SlideShare a Scribd company logo
1 of 12
Download to read offline
DATA STORY-TELING WITH QUICK SIGHT
US E-COMMERCE
Trần Văn Thiện
Email: thien1892@gmail.com
1. Đặt vấn đề và tổng quan về dữ liệu
• Hành vi tiêu dùng của khách hàng thương mại điện tử (TMĐT) khác
với khách hàng truyền thống ra sao?
• Dữ liệu:
• Dữ liệu tiêu dùng TMĐT của 3 thành phố: New York City, Los Angles, Seattle.
• Thời gian: Từ 20/09/2013 đến 13/01/2014
• Dữ liệu gồm 65535 giao dịch và 19 thuộc tính kèm theo.
2. Làm sạch dữ liệu và làm giàu dữ liệu
• 2.1. Làm sạch dữ liệu:
• Dữ liệu lỗi ở 159 dòng ở cột Individual_Price_US$ tôi thực hiện bằng cách
thay thế những giá trị #VALUE! bằng cách chia giá trị của Amount US$ cho
Quantity
• 2.2. Làm giàu dữ liệu:
• Tôi thêm trường weekday để xem giao dịch xảy ra vào thứ nào trong tuần.
3. Số liệu giao dịch bán hàng theo tháng
- Bởi vì tháng 9/2013 và tháng 1/2014 không đầy đủ dữ liệu toàn tháng ở các thành phố nên ta sẽ xem xét giá trị
trung bình hàng tháng.
- Ta thấy số lượng món hàng trung bình 1 giao dịch ghi nhận không khác nhau nhiều ở 3 thành phố và trong các
tháng : trong bình 17 món hàng/ 1lần đặt.
- Giá trị trung bình 1 lần đặt hàng ở Seattle, Los Angles tương tự ở các tháng ~ $4.4k đến $4.7k
- Giá trị trung bình 1 lần đặt hàng ở New York City cao nhất ở tháng 12/2013 ($5.25k) và thấp nhất ở tháng
01/2014 ($3.88k)
4. Tỷ lệ đóng góp doanh số và doanh thu
- Do tính không toàn vẹn về dữ liệu, ta quan tấm đến đóng góp Doanh số và Doanh thu trong quý 3 – 2013, ta
thấy:
- Seattle có đóng góp về Doanh số và Doanh thu nhiều nhất nhưng giảm đần qua các tháng.
- Los Angles và New York City tăng tỷ lệ đóng góp Doanh số và Doanh thu theo các tháng, trong đó New
York City đóng góp ít nhất
5. Danh mục hàng hóa và giá
- Trong 8 loại danh mục hàng hóa, thì Fashion và Clothing chiếm hơn 80% số lượng đặt hang
- Giá trung bình 1 mặt hàng phân bố như hình dưới, chủ yếu <$20k.
- Có 7719 giao dịch có giá ~ $0 chiếm 11,8% số lượng giao dịch!! Đây có thể là các mặt hàng
khuyến mãi hoặc các đơn hàng ~ $0 để kích thích khách sử dụng TMĐT.
6. Giới tính và loại thiết bị
- Nữ giới mua 100% các mặt hàng: Wearables, Vehicle, House hold, Accessories
- Nam giới mua 100% các mặt hàng: stationaries, Electronics
- Nam giới mua Clothing (quần áo) nhiều hơn nữ giới!!!
- Hai mặt hàng Fashion, Clothing chiếm Doanh số và Doanh thu lớn nhất chủ yếu mua ở Web
7. Thời gian mua hàng
- Giờ mua hàng:
- Không có khác biệt về tổng số lượng hàng được mua theo từng giờ ~ 47k / giờ
- Giá trị tổng đơn hàng mua nhiều nhất vào các khung giờ: 6H, 8H, 14H
- Thứ ngày mua hàng:
- Thứ 7, chủ nhật có tổng số lượng hàng mua ít nhất và giá trị nhỏ nhất!!!
8. Loại khách hang mua hàng
- Doanh số và Doanh thu mua hang đến chủ yếu từ khách hàng thành viên (Member) ~ 96%
9. Loại hình thức giao hàng?
- Không có sự khác biệt nhiều về hình thức giao hang ở 2 danh mục chủ yếu là Fashion và Clothing
- Giao hàng trong ngày chiếm phần lớn ở New York City và Los Angles, trong khi đó ở Seattel
chuộng giao hang thường.
Kết luận
• Khách hàng TMĐT chủ yếu mua hàng quần áo và thời trang, và chủ
yếu mua hang qua web
• Không có sự phân biệt về giới tính trong mua hang
• KH mua nhiều trong các giờ 6h, 8h, 14h và mua hang ít vào thứ 7, chủ
nhật.
Thank you!!!

More Related Content

More from Lam Le

Module 1 - CP Datalake on AWS
Module 1 - CP Datalake on AWSModule 1 - CP Datalake on AWS
Module 1 - CP Datalake on AWSLam Le
 
[Provided Data - Brazil] Hung Nguyen
[Provided Data - Brazil] Hung Nguyen[Provided Data - Brazil] Hung Nguyen
[Provided Data - Brazil] Hung NguyenLam Le
 
[Provided Data - US] Hang Le
[Provided Data - US] Hang Le[Provided Data - US] Hang Le
[Provided Data - US] Hang LeLam Le
 
[Custom Data] Ngo Duy Vu
[Custom Data] Ngo Duy Vu[Custom Data] Ngo Duy Vu
[Custom Data] Ngo Duy VuLam Le
 
[Provided Data - US] Khanh Ngo
[Provided Data - US] Khanh Ngo[Provided Data - US] Khanh Ngo
[Provided Data - US] Khanh NgoLam Le
 
[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen[Custom Data] Alice Nguyen
[Custom Data] Alice NguyenLam Le
 
[Custom Data] Hy Dang
 [Custom Data] Hy Dang [Custom Data] Hy Dang
[Custom Data] Hy DangLam Le
 
[Provided Data - Brazil] Dương Hà Nguyễn Hoàng
 [Provided Data - Brazil] Dương Hà Nguyễn Hoàng [Provided Data - Brazil] Dương Hà Nguyễn Hoàng
[Provided Data - Brazil] Dương Hà Nguyễn HoàngLam Le
 
[Custom Data] Ha Hoang
[Custom Data] Ha Hoang[Custom Data] Ha Hoang
[Custom Data] Ha HoangLam Le
 
[Provided Data - Brazil] Ethan Phan
[Provided Data - Brazil] Ethan Phan[Provided Data - Brazil] Ethan Phan
[Provided Data - Brazil] Ethan PhanLam Le
 
[Provided Data - US] ChiQuyen Dinh
 [Provided Data - US] ChiQuyen Dinh [Provided Data - US] ChiQuyen Dinh
[Provided Data - US] ChiQuyen DinhLam Le
 
[Provided Data - US] Chi Cuong Nguyen
[Provided Data - US] Chi Cuong Nguyen[Provided Data - US] Chi Cuong Nguyen
[Provided Data - US] Chi Cuong NguyenLam Le
 
[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen[Custom Data] Alice Nguyen
[Custom Data] Alice NguyenLam Le
 
[Provided Data - Brazil] Vuong.le
[Provided Data - Brazil] Vuong.le[Provided Data - Brazil] Vuong.le
[Provided Data - Brazil] Vuong.leLam Le
 
[Provided data - Brazil] Tran Manh Cuong
[Provided data - Brazil] Tran Manh Cuong[Provided data - Brazil] Tran Manh Cuong
[Provided data - Brazil] Tran Manh CuongLam Le
 
[Custom data] Ngo Duy Vu
[Custom data] Ngo Duy Vu[Custom data] Ngo Duy Vu
[Custom data] Ngo Duy VuLam Le
 
[Provided Data - US] Thao Phi
[Provided Data - US] Thao Phi[Provided Data - US] Thao Phi
[Provided Data - US] Thao PhiLam Le
 

More from Lam Le (17)

Module 1 - CP Datalake on AWS
Module 1 - CP Datalake on AWSModule 1 - CP Datalake on AWS
Module 1 - CP Datalake on AWS
 
[Provided Data - Brazil] Hung Nguyen
[Provided Data - Brazil] Hung Nguyen[Provided Data - Brazil] Hung Nguyen
[Provided Data - Brazil] Hung Nguyen
 
[Provided Data - US] Hang Le
[Provided Data - US] Hang Le[Provided Data - US] Hang Le
[Provided Data - US] Hang Le
 
[Custom Data] Ngo Duy Vu
[Custom Data] Ngo Duy Vu[Custom Data] Ngo Duy Vu
[Custom Data] Ngo Duy Vu
 
[Provided Data - US] Khanh Ngo
[Provided Data - US] Khanh Ngo[Provided Data - US] Khanh Ngo
[Provided Data - US] Khanh Ngo
 
[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen
 
[Custom Data] Hy Dang
 [Custom Data] Hy Dang [Custom Data] Hy Dang
[Custom Data] Hy Dang
 
[Provided Data - Brazil] Dương Hà Nguyễn Hoàng
 [Provided Data - Brazil] Dương Hà Nguyễn Hoàng [Provided Data - Brazil] Dương Hà Nguyễn Hoàng
[Provided Data - Brazil] Dương Hà Nguyễn Hoàng
 
[Custom Data] Ha Hoang
[Custom Data] Ha Hoang[Custom Data] Ha Hoang
[Custom Data] Ha Hoang
 
[Provided Data - Brazil] Ethan Phan
[Provided Data - Brazil] Ethan Phan[Provided Data - Brazil] Ethan Phan
[Provided Data - Brazil] Ethan Phan
 
[Provided Data - US] ChiQuyen Dinh
 [Provided Data - US] ChiQuyen Dinh [Provided Data - US] ChiQuyen Dinh
[Provided Data - US] ChiQuyen Dinh
 
[Provided Data - US] Chi Cuong Nguyen
[Provided Data - US] Chi Cuong Nguyen[Provided Data - US] Chi Cuong Nguyen
[Provided Data - US] Chi Cuong Nguyen
 
[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen[Custom Data] Alice Nguyen
[Custom Data] Alice Nguyen
 
[Provided Data - Brazil] Vuong.le
[Provided Data - Brazil] Vuong.le[Provided Data - Brazil] Vuong.le
[Provided Data - Brazil] Vuong.le
 
[Provided data - Brazil] Tran Manh Cuong
[Provided data - Brazil] Tran Manh Cuong[Provided data - Brazil] Tran Manh Cuong
[Provided data - Brazil] Tran Manh Cuong
 
[Custom data] Ngo Duy Vu
[Custom data] Ngo Duy Vu[Custom data] Ngo Duy Vu
[Custom data] Ngo Duy Vu
 
[Provided Data - US] Thao Phi
[Provided Data - US] Thao Phi[Provided Data - US] Thao Phi
[Provided Data - US] Thao Phi
 

[Provided Data - US] Thien Tran

  • 1. DATA STORY-TELING WITH QUICK SIGHT US E-COMMERCE Trần Văn Thiện Email: thien1892@gmail.com
  • 2. 1. Đặt vấn đề và tổng quan về dữ liệu • Hành vi tiêu dùng của khách hàng thương mại điện tử (TMĐT) khác với khách hàng truyền thống ra sao? • Dữ liệu: • Dữ liệu tiêu dùng TMĐT của 3 thành phố: New York City, Los Angles, Seattle. • Thời gian: Từ 20/09/2013 đến 13/01/2014 • Dữ liệu gồm 65535 giao dịch và 19 thuộc tính kèm theo.
  • 3. 2. Làm sạch dữ liệu và làm giàu dữ liệu • 2.1. Làm sạch dữ liệu: • Dữ liệu lỗi ở 159 dòng ở cột Individual_Price_US$ tôi thực hiện bằng cách thay thế những giá trị #VALUE! bằng cách chia giá trị của Amount US$ cho Quantity • 2.2. Làm giàu dữ liệu: • Tôi thêm trường weekday để xem giao dịch xảy ra vào thứ nào trong tuần.
  • 4. 3. Số liệu giao dịch bán hàng theo tháng - Bởi vì tháng 9/2013 và tháng 1/2014 không đầy đủ dữ liệu toàn tháng ở các thành phố nên ta sẽ xem xét giá trị trung bình hàng tháng. - Ta thấy số lượng món hàng trung bình 1 giao dịch ghi nhận không khác nhau nhiều ở 3 thành phố và trong các tháng : trong bình 17 món hàng/ 1lần đặt. - Giá trị trung bình 1 lần đặt hàng ở Seattle, Los Angles tương tự ở các tháng ~ $4.4k đến $4.7k - Giá trị trung bình 1 lần đặt hàng ở New York City cao nhất ở tháng 12/2013 ($5.25k) và thấp nhất ở tháng 01/2014 ($3.88k)
  • 5. 4. Tỷ lệ đóng góp doanh số và doanh thu - Do tính không toàn vẹn về dữ liệu, ta quan tấm đến đóng góp Doanh số và Doanh thu trong quý 3 – 2013, ta thấy: - Seattle có đóng góp về Doanh số và Doanh thu nhiều nhất nhưng giảm đần qua các tháng. - Los Angles và New York City tăng tỷ lệ đóng góp Doanh số và Doanh thu theo các tháng, trong đó New York City đóng góp ít nhất
  • 6. 5. Danh mục hàng hóa và giá - Trong 8 loại danh mục hàng hóa, thì Fashion và Clothing chiếm hơn 80% số lượng đặt hang - Giá trung bình 1 mặt hàng phân bố như hình dưới, chủ yếu <$20k. - Có 7719 giao dịch có giá ~ $0 chiếm 11,8% số lượng giao dịch!! Đây có thể là các mặt hàng khuyến mãi hoặc các đơn hàng ~ $0 để kích thích khách sử dụng TMĐT.
  • 7. 6. Giới tính và loại thiết bị - Nữ giới mua 100% các mặt hàng: Wearables, Vehicle, House hold, Accessories - Nam giới mua 100% các mặt hàng: stationaries, Electronics - Nam giới mua Clothing (quần áo) nhiều hơn nữ giới!!! - Hai mặt hàng Fashion, Clothing chiếm Doanh số và Doanh thu lớn nhất chủ yếu mua ở Web
  • 8. 7. Thời gian mua hàng - Giờ mua hàng: - Không có khác biệt về tổng số lượng hàng được mua theo từng giờ ~ 47k / giờ - Giá trị tổng đơn hàng mua nhiều nhất vào các khung giờ: 6H, 8H, 14H - Thứ ngày mua hàng: - Thứ 7, chủ nhật có tổng số lượng hàng mua ít nhất và giá trị nhỏ nhất!!!
  • 9. 8. Loại khách hang mua hàng - Doanh số và Doanh thu mua hang đến chủ yếu từ khách hàng thành viên (Member) ~ 96%
  • 10. 9. Loại hình thức giao hàng? - Không có sự khác biệt nhiều về hình thức giao hang ở 2 danh mục chủ yếu là Fashion và Clothing - Giao hàng trong ngày chiếm phần lớn ở New York City và Los Angles, trong khi đó ở Seattel chuộng giao hang thường.
  • 11. Kết luận • Khách hàng TMĐT chủ yếu mua hàng quần áo và thời trang, và chủ yếu mua hang qua web • Không có sự phân biệt về giới tính trong mua hang • KH mua nhiều trong các giờ 6h, 8h, 14h và mua hang ít vào thứ 7, chủ nhật.