Your SlideShare is downloading. ×
0
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Business Research Method 6
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Business Research Method 6

2,375

Published on

Published in: Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,375
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
178
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. PHÂN TÍCH DỮ LIỆU
  • 2. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biếnTổng quan về phân tích đa biến
  • 3. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biếnTổng quan về phân tích đa biến
  • 4. Hiệu chỉnh (Editing) Mã hoá (Coding)Tạo tập tin dữ liệu
  • 5. Mục đích Đúng thủ tục/đối tượng phỏng vấn (legibility) Xử lý các phỏng vấn/trả lời không hoàn chỉnh (completeness) Tính nhất quán của các trả lời (consistency) Sự chính xác của các trả lời (accuracy) Sự rõ ràng của các trả lời (clarification)
  • 6. Quá trìnhHiệu chỉnh sơ bộ (field editing):• Thực hiện bởi interviewer• Càng sớm càng tốt sau khi phỏng vấn xongHiệu chỉnh cuối cùng (office editing):• Thực hiện bởi editor• Sau khi thu thập xong data• Đòi hỏi người hiệu chỉnh phải có nhiều kinh nghiệm, kiến thức.
  • 7. Xử lý khi phát hiện lỗi Liên lạc trở lại để bổ sung hoặc làm rõ Hiệu chỉnh, làm rõ hoặc bổ sung theo trí nhớ hoặc các cứ liệu/suy luận khác Hủy bỏ một số câu trả lời (missing value) Hủy hoàn toàn cuộc phỏng vấn/questionnaire
  • 8. Là quá trình gán mã số (số hoặc nhãn) cho các biếnvà các trả lời.Thang đo của biến tùy thuộc vào cách hỏi và bản chấtcủa biến được hỏi.
  • 9. Các bước mã hoá◦ Đặt tên biến cho các câu hỏi Câu hỏi 1 chọn lựa Câu hỏi nhiều chọn lựa◦ Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thành tập các số/nhãn phù hợp, có ý nghĩa. Câu hỏi đóng Câu hỏi mở Câu hỏi có chọn lựa: “Khác” Hai trường hợp “Không biết”
  • 10. Tính phù hợp Tính toàn diện (appropriateness) (exhaustiveness) NGUYÊN TẮCTính loại trừ nhau Tính đơn nguyên(mutual exclusivity) (unidimensionality)
  • 11. Tính phù hợp (appropriateness)Thí dụ: Thông tin cá nhân Cách phân loại/ nhómhoặc doanh nghiệp. phải phù hợp với vấnTuổi <18 18-30 …. ? đề/ mục tiêu nghiên <16 16-25 …. ? cứu.
  • 12. Tính toàn diện (exhaustiveness) Các mã số cần thể Thí dụ: Tuổi <18hiện các loại cần NC. 18-30 Loại “trả lời khác” nên >30chiếm tỉ lệ nhỏ nhất. ??
  • 13. Mỗi trả lời chỉ tương ứng với một mã số. Thí dụ: quốc doanh, tưTính loại trừ nhau nhân, TNHH, cổ phần ??(mutual exclusivity)
  • 14. Mỗi câu trả lời ứng vớimột thứ nguyên duynhất. Tính đơn nguyên (unidimensionality)
  • 15. Nhập dữ liệu vào file (SPSS)Cải biến tập dữ liệuTạo biến mới, biến trung gian, v.v.Xử lý missing value Thí dụ về data file
  • 16. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biếnTổng quan về phân tích đa biến
  • 17. Tổng quan về phân tích dữ liệuTổng quát về phân tích đơn biếnThống kê mô tảKiểm nghiệm giả thuyết đơn biến
  • 18. Chọn phương pháp phân tích đơn biến nào?Tùy vào: Có bao nhiêu biến được phân tích đồng thời? Mục tiêu phân tích chỉ là mô tả mẫu hay suy đoán cho tổng thể Các biến được đo bởi thang đo gì? Chỉ danh, thứ tự, khoảng, tỉ lệ.
  • 19. Start Bao nhiêu biến được phân tích đồng thời1 biến Trên 2 biến 2 biến Phân tích Phân tích Phân tích đơn biến nhị biến đa biến
  • 20. Phân tích đơn biến Khoảng Thang đo Chỉ danh của biến Thứ tựMÔ TẢ Trung vị Trung bình Yếu vị Khoảng/ Phương sai Tần suất phần trăm SUYĐOÁN Kolmogorov Chi – square Z test/ t test – Smirnov test test
  • 21. Biến chỉ danh, thứ tự Ví dụ Response Frequency Percentage Cum. Category Percentage Benthanh 1 - - Foster 3 1 1 Saigon 45 18 19 Heineken 120 46 65 Tiger 92 35 100 261 100%
  • 22. Lợi ích của biến chỉ danh, thứ tự: Trình bày phân phối dữ liệu của một biến có thang đo nominal hoặc ordinal. Phát hiện một số dạng sai sót khi mã hoá. So sánh với các phân phối/ dữ liệu có liên quan. Đề nghị những phương pháp biến đổi các biến Kiểm tra sampling.
  • 23. Biến khoảng N 215 Minimum 1 Maximum 5 Mean Statistic 2.25 Std. Error 0.06 Std. Deviation Statistic 0.83 Statistic 0.57 Skewness Std. Error 0.17 Statistic 0.45 Kurtosis Std. Error 0.33 Ví dụ
  • 24. Kiểm chứng xem những phát biểu nào đó cóthích hợp cho tổng thể nghiên cứu hay không.• TD: Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể: • Null hypothesis Ho: µ = 23 • Alternative hypothesis H1: µ ≠ 23Các phân tích liên quan đến kiểm nghiệm giảthuyết gọi là phân tích suy luận (inferentialanalysis).
  • 25. • Thiết lập giả thuyết H0 và H1B1 • Xác định phương pháp test phù hợp (statistical test).B2 • Chọn trước mức ý nghĩa α (significance level)B3 • Tính (tra bảng) giá trị test tới hạn (critical value) ứng với α (one/ two tailed)B4 • Tính giá trị kiểm nghiệm thống kê từ tập số liệuB5 • Nếu giá trị tính được ở B5 lớn hơn giá trị tới hạn loại HoB6
  • 26. Biến đo bằng thang khoảng (interval) ◦ Có thể dùng t Test hoặc Z Test để test giá trị trung bình của tổng thể khi biết giá trị trung bình của mẫu Z TEST t TEST Biết phương sai σ của tổng Không biết phương sai σ củathể và cỡ mẫu bất kỳ. tổng thể và cỡ mẫu bất kỳ. Không biết phương sai σ Khi cỡ mẫu n > 30 thì phâncủa tổng thể và cỡ mẫu n >30 phối t = phân phối z Lưu ý: khi tra bảng tc thì dF = n-1 x−μ t= Sx
  • 27. Thí dụ (tiếp theo thí dụ trên)Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NCmuốn kiểm chứng cho tổng thể: Null hypothesis Ho: µ = 23 Alternative hypothesis H1: µ ≠ 23 Do n = 100 > 30 nên dùng Z test Chọn mức ý nghĩa α = 0.05 (two tailed) Zc = 1.96 Tính Z khi chưa biết σ : Z = (Ā - µ) n1/2/s = (24 - 23) x 1001/2/5 = 2 Z = 2 > Zc = 1.96 loại Ho Không thể kết luận (với significant 5%) là µ = 23 Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n)1/2
  • 28. Biến đo bằng thang thứ tự (ordinal)◦ Dùng chi-square test để so sánh phân phối các loại (categories) của mẫu và kỳ vọng của tổng thể Các bước tiến hành
  • 29. B2. Xác định mứcB1. Phát biểu giả B3. Tra bảng Chi- ý nghĩa α và bậc χ c2thuyết H0, H1 Square chuẩn tự do df df = k – 1 (k là số loại danh định có thể chọn trong biến thứ tự) B5. Bác bỏ/chấp nhận B4. Tính giá trị kiểm H0 dựa trên tiêu chuẩn nghiệm theo công thức “Bác bỏ H0- nếu (tính được) > (tới hạn)”. k ( O i − E i ) 2 Oi: Số lần xuất hiện loại i trong mẫu χ2 = ∑ i =1 Ei Ei: Giá trị kỳ vọng của số lần xuất hiện
  • 30. Biến đo bằng thang thứ tự (ordinal)◦ Dùng chi-square test để so sánh phân phối các loại (categories) của mẫu và kỳ vọng của tổng thể Các bước tiến hành◦ Nghĩa là có sự khác biệt giữa phân phối của mẫu và phân phối của tổng thể.◦ Kiểm định Chi-Square không có ý nghĩa khi số lần xuất hiện kỳ vọng cho mỗi lựa chọn < 5.
  • 31. Thí dụ: Khảo sát 100 người đang sử dụng internet ở HCMCNghề nghiệp Oi Ei Oi - Ei (Oi - Ei)2 (Oi - Ei)2/ EiLao động 15 25 -10 100 4Nhân viên VP 20 25 -5 25 1Quản lý 30 25 5 25 1Sinh viên 35 25 10 100 4Total 100 100 χ 2 =10
  • 32. Thí dụ: Khảo sát 100 người đang sử dụnginternet ở HCMC (n = 100)Cột 1: Phân bố nghề nghiệp của những người sửdụng internet.Cột 2: Phân bố kỳ vọng (bằng nhau cho các nhóm)Ho: Không có sự khác nhau về nghề nghiệp củanhững người sử dụng internetK = 4 loại nghề nghiệp Df = k - 1 = 3χ c = 6.25 ( với α = 10%) 2Vì χ 2 = 10 > χ c2 = 6.25 loại bỏ H0
  • 33. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biếnTổng quan về phân tích đa biến
  • 34. Bảng 2 chiều (Two – way Tabulation) Khảo sát mức độ và các mối liên hệ (có thể có) giữa các cặp biến. Thích hợp cho các trường hợp số loại trong mỗi biến không lớn, thang đo nominal hoặc ordinal. Chỉ định hướng, không kết luận về mối quan hệ nhân quả giữa các biến. Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.
  • 35. Function group Total Mkt & Prodct Others Sales Count 41 62 41 144 Male % within Gender 28.5% 43.1% 28.5% 100.0% % within Functgr 74.5% 93.9% 53.2% 72.7%Gender % of Total 20.7% 31.3% 20.7% 72.7% Count 14 4 36 54 Female % within Gender 25.9% 7.4% 66.7% 100.0% % within Functgr 25.5% 6.1% 46.8% 27.3% % of Total 7.1% 2.0% 18.2% 27.3% Count 55 66 77 198 % within Gender 27.8% 33.3% 38.9% 100.0% Total % within Functgr 100.0% 100.0% 100.0% 100.0% % of Total 27.8% 33.3% 38.9% 100.0%
  • 36. Phương pháp Áp dụng Minh họaChi – Square Quan hệ giữa thu nhập Quan hệ giữa 2 biếnContingency (hoặc nghề nghiệp) với chỉ danh. Test việc chọn nhãn hiệu bia. Hệ số Quan hệ giữa mức thưởng Quan hệ giữa 2 biến nhân viên bán hàng (mứctương quan thứ tự. 1, 2, 3, 4) và thành tích Spearman (mức 1, 2, 3, 4, 5). Hệ số Quan hệ giữa 2 biến Quan hệ giữa tuổi củatương quan metric khách hàng và chi phí hàng Pearson (khoảng hay tỉ lệ). tháng cho y tế. Xây dựng một Hồi quy hàm tuyến tính giữa Doanh thu (đồng) theo chi đơn giản 2 biến metric phí khuyến mãi. (phụ thuộc nhau)
  • 37. Chi – Square contingency test Mục đích: Xác định sự tồn tại mối quan hệ giữa 2 biến danh định. Yêu cầu: Không có ô nào có số lần xuất hiện kỳ vọng < 1 Không quá 1/5 tổng số ô có số lần xuất hiện < 5 Hạn chế: Chỉ xác định có quan hệ hay không, không cho biết mức độ quan hệ.
  • 38. Hệ số Contingency thường được bổ sung vào kiểmnghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến. χ 2 C = 0: không có quan hệ c= n+ χ2 C không có chặn trên khó diễn dịchNên trong thực tế hay dùng hệ số thống kê Cramer χ2 V = 0: không có quan hệ v= n( f − 1) V = 1: có quan hệ hoàn hảo
  • 39. Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thích nhất phân theo mức thu nhập. Nhãn hiệu bia ưa thích nhấtThu nhập Tổng Bia A Bia B Bia C 50 200 125 Thấp 375 (109.38) (101.56) (164.06) 200 100 350Trung bình 650 (189.58) (176.04) (284.38) 100 25 50 Cao 175 (51.04) (47.40) (76.56) Tổng 350 325 525 1200
  • 40. Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của mỗi ôtrong bảng. Chúng được xác định theo tỉ lệ với tổng về thunhập và loại bia ưa thích.(Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38) k (O − E ) 2Tính χ = ∑i =1 ∑ 2 l ij ij j =1 EijKết quả : χ = 252.2 2 Df = (k-1)(l-1) = (3-1)(3-1) = 4Nếu chọn α = 1% thì χ C = 13.3 (tra bảng) 2 χ 2 = 252.2 > χ C = 13.3 2 loại Ho Có sự khác biệt đáng kể giữa phân phối của mẫu và kỳvọng (tổng thể)
  • 41. Hệ số tương quan Spearman và Pearson Spearman: tương quan giữa 2 biến thứ tự (ordinal) Pearson: tương quan giữa các biến khoảng/ tỉ lệ. Hệ số tương quan r = 0 1 (không kể dấu +/-) r > 0.8 rất mạnh r = 0.6 – 0.8 mạnh r = 0.4 – 0.6 có tương quan r = 0.2 – 0.4 tương quan yếu r < 0.2 không tương quan
  • 42. Lưu ý: Hai biến phải có phân phối chuẩn nhị biến. Phương sai của 1 biến tại bất kỳ giá trị nào của biến kia cũng phải bằng nhau. Khi r nhỏ không có nghĩa là không tương quan, mà chỉ không tương quan tuyến tính. Khi |r| lớn chỉ cho thấy mối tương quan, nhưng không xác định quan hệ nhân quả.
  • 43. Phân tích hồi quy tuyến tính đơn◦ Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn Y = aX + b◦ Sự khác biệt giữa hồi quy và tương quan Hồi quy tuyến tính Tương quan Tạo ra một phương Phát hiện ra mức độ trình toán học liên kết tương quan giữa các biến lại 2 biến Tồn tại giả thiết nhân – Không có giả thiết về quả: Biến độc lập – nhân quả Biến phụ thuộc
  • 44. Xử lý dữ liệu Phân tích đơn biến Phân tích nhị biếnTổng quan về phân tích đa biến
  • 45. Phân tích phụ thuộc• Xác định được biến nào là phụ thuộc, biến nào là độc lập• Bao gồm các phương pháp: phân tích hồi quy đa biến,ANOVA, Conjoint, Discriminant, Canonical analysis...Phân tích tương tác• Không xác định trước biến nào là phụ thuộc, biến nào làđộc lập, chủ yếu là tìm kiếm các mô thức tương quan.• Bao gồm các phương pháp: Factor analaysis, Cluster,Multi-dimensional Scaling. Phân tích đa biến giúp giải quyết nhiều bài toán phức tạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đều dựa trên một số giả thiết (ngầm) cần thận trọng.
  • 46. Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo Thang đo của biến Phương pháp Phụ thuộc Độc lậpMột biến phụ thuộc Hồi quy bội Interval Interval ANOVA Interval Nominal Hồi quy bội - biến dummy Interval Nominal Discriminant analysis Nominal Interval Conjoint analysis Ordinal Nominal
  • 47. Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo Thang đo của biến Phương pháp Phụ thuộc Độc lậpHai biến phụ thuộc trở lên Canonical analysis Interval Interval MANOVA Interval NominalMạng lưới của nhiều biến phụ thuộc và độc lậpStructural Equation Modeling Interval Interval (SEM)
  • 48. HỒI QUY TUYẾN TÍNH BỘI y = a1X1 + a2X2 + a3X3 + ... anXn + bDạng mở rộng của hồi quy đơn.Một biến phụ thuộc, nhiều biến độc lập.Tất cả được đo bằng thang interval (ngoại lệ:dummy-variable multiple regression)
  • 49. Đánh giá mô hình và kết quả hồi quy theo 3 phần: Mức độ phù hợp của phương trình hồi quy: Dùng hệ số r2 (coefficient of determination) r2 = 0 ÷ 1 đặc trưng cho % của biến thiên trong biến phụ thuộc được giải thích do sự biến thiên của biến độc lập. Kiểm nghiệm mức ý nghĩa của r2: Dùng F – test, với độ tự do: df = n – k – 1 cho mẫu số và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập) Kiểm nghiệm mức ý nghĩa của các độ dốc ai: Dùng t – test với độ tự do df = n – k – 1 ◦
  • 50. Kiểm nghiệm các giả thuyết của phương pháp hồi quy Linearity Đa cộng tuyến (Multicolinearity) Phân phối chuẩn (Normality) của sai số và mỗi biến Sai số hồi quy có variance không đổi Tính độc lập của các sai số hồi quy
  • 51. Linearity Có mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập. Test: quan sát scatter diagram hoặc ma trận tương quan
  • 52. Đa cộng tuyến (Multicolinearity) Giả thuyết: các biến độc lập không có tương quan tuyếntính với nhau. Khi bị vi phạm Có hiện tượng đa cộng tuyến, nghĩa làhiện hữu mối tương quan tuyến tính giữa ≥ 2 biến độc lập. Đa cộng tuyến gây ra: Hạn chế giá trị r2 Sai lệch/ đổi dấu các hệ số hồi quy Test đa cộng tuyến: hệ số Tolerance hoặc VIF
  • 53. Một số lưu ý khi sử dụng multiple regression: Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tươngquan TUYẾN TÍNH giữa các biến. r2 không nói lên được quan hệ nhân quả giữa các biến Có thể dự đoán sai nếu nằm ngoài khoản tính toán Để đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗibiến độc lập đưa vào phương trình ( yêu cầu cỡ mẫu) Khoảng dao động (range) các biến có thể ảnh hưởng đến ýnghĩa phương trình hồi quy. Trường hợp biến độc lập là nominal thì có thể sử dụngdummy-variable. Khi đó: Số biến dummy = k-1; với k = số loại của biến nominal Mỗi biến dummy chỉ nhận giá trị 0 hoặc 1
  • 54. Thí dụ: Bài toán tìm các yếu tố quyết định sự thỏa mãn của nhân viên trong Cty XYZ. Biến phụ thuộc: sự thỏa mãn của nhân viên Cty. Biến độc lập: thu nhập, điều kiện làm việc, sự quan tâm của cấp trên, quan hệ với đồng nghiệp, cơ hội thăng tiến, cơ hội học tập, v.v..
  • 55. Unstandardized Standardized Coefficients Coefficients Collinearity Statistics Biến Std. B Beta độc lập Error t Sig. Tolerance VIF(Constant) .540 .193 2.793 .007Thu nhập .526 .081 .596 6.491 .000 .793 1.262 Sựquan tâm/ .205 .061 .310 3.380 .001 .793 1.262công nhận r = 0.787 r2 = 0.619 F sig. = 0.000
  • 56. ANOVA – ANALYSIS OF VARIANCEMục đích Đặc điểm Áp dụng
  • 57. ANOVA – ANALYSIS OF VARIANCEMục đích Đặc điểm Áp dụng
  • 58. ANOVA – ANALYSIS OF VARIANCEMục đích Đặc điểm Áp dụng Khảo sát mối quan hệ giữa các biến độc lập và phụ thuộc
  • 59. ANOVA – ANALYSIS OF VARIANCEMục đích Đặc điểm Áp dụng Tương tự như phân tích hồi quy, nhưng các biến độc lập là biến nonmetric (nominal/ ordinal)
  • 60. ANOVA – ANALYSIS OF VARIANCE Mục đích Đặc điểm Áp dụngSo sánh giá trị trung bình của một thuộc tính (biến phụthuộc/ thang metric) thể hiện ảnh hưởng của một hay nhiều thuộc tính khác (biến độc lập/thang nonmetric)
  • 61. ANOVA – ANALYSIS OF VARIANCE Nếu có nhiều biến độc lập với thang chỉ danh gọi làFactorial ANOVA Nguyên tắc: Nếu có sự khác biệt đáng kể giữa cácnhóm thì “between-group variance > within-group variance” ANCOVA: có xét đến các ảnh hưởng của một haynhiều biến ngoại lai (gọi là control variable hoặc covariates- thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộctrước khi phân tích ANOVA. MANOVA nếu có nhiều biến phụ thuộc MANCOVA có nhiều biến phụ thuộc và biến kiểm soát
  • 62. Thí dụ: Khảo sát 200 doanh nghiệp thuộc 3 ngành May mặc, Mỹ phẩm và Nhựa gia dụng về chi phí dành cho khuyến mãi hằng năm. Mục đích phân tích nhằm tìm xem có sự khác nhau đáng kể/ có ý nghĩa thống kê giữa 3 ngành này về chi phí khuyến mãi không?
  • 63. Cty Ngành Chi phí KM (1000 USD)Biến độc lập: 1 May 123ngành (chỉ danh) 2 May 235(3 treatments) 3 Mỹ phẩm 1346 4 Nhựa 876Biến phụ thuộc: . . .chi phí khuyến . . .mãi (ratio) 199 Nhựa 68 200 May 12
  • 64. Bài toán này có thể so sánh giá trị trung bình của chi phí khuyến mãi theo từng cặp ngành (dùng t – test). Tuy nhiên, khi số treatment lớn số lượng so sánh sẽ rất lớn. Khi đó nên dùng ANOVA: ◦ H0 : μ1 = μ2 = ... = μk = μ ◦ Ha : có ít nhất 1 giá trị μi khác những giá trị kia.Với μ là trung bình của tổng thể
  • 65. DISCRIMINANT ANALYSIS Mục đích Đặc điểm Nguyên tắcNhận ra những Biến độc lập có Hàm phân biệt có dạng:thuộc tính (các thang metric,biến độc lập) để Y = v1.X1 + v2.X2 + v3.X3 + … biến phụ thuộcphân biệt các có thang Sau khi tính được Y, sonhóm định trước nonmetric. sánh với giá trị chuẩn Yccủa biến phụ để biết đối tượng thuộcthuộc nhóm nào.
  • 66. Thí dụ: Công ty máy tính muốn biết xem thu nhập gia đình (X1) và số năm học ở trường của chủ hộ (X2) có phải là hữu ích trong việc phân biệt hộ có mua máy tính PC hay không. Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên (có và không có PC). Biến độc lập: X1 – thu nhập, X2 – số năm học : metric Biến phụ thuộc: Có PC, Không có PC: category. Kết quả sẽ là hàm phân biệt: Y= v1X1 + v2X2 v1, v2 : trọng số phân biệt (hằng số) Y: điểm phân biệt So sánh Yi và Yc Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên.
  • 67. CONJOINT ANALYSIS Mục đích Áp dụng
  • 68. CONJOINT ANALYSIS Mục đíchPhân tích ảnh hưởng tổng hợp (joint effects) của 2 haynhiều biến độc lập (thang nominal) lên một biến phụthuộc (utility score - thang đo ordinal)
  • 69. CONJOINT ANALYSIS Áp dụngThường dùng trong test sản phẩm với nhiều yếu tố khácnhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.).Mỗi yếu tố có vài phương án khác nhau. Tìm xem tổhợp nào được ưa thích nhất.
  • 70. CONJOINT ANALYSIS – ÁP DỤNGNhà NC tạo ra một tập các phương án sản phẩm. Mỗiphương án là 1 tổ hợp của các yếu tố.Tập các phương án này được đưa cho đối tượng chọn/xếp hạng (hoặc cho điểm thể hiện mức ưa thích).Conjoint analysis sẽ đánh giá ảnh hưởng của các utilityscore thành phần (hay part-worths, tượng trưng chomức độ quan trọng của mỗi yếu tố) lên sự ưa thích tổnghợp (utility) đối với một sản phẩm.
  • 71. CONJOINT ANALYSIS – ÁP DỤNGCó thể dùng kết quả để Đánh giá thị phần của các nhãn hiệu trên thị trường Phân khúc thị trường Nhận dạng cơ hội thị trường cho một sản phẩm với tổ hợp thuộc tính mới
  • 72. Thí dụ:Thiết kế sản phẩm mới có 3 thuộc tính: Giá : (cao, trung bình, thấp) Kiểu dáng : (cao, trung bình, thấp) Chức năng : (đơn giản, phức tạp) ... Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì 18 tổ hợp) về tính hấp dẫn của sản phẩm đối với khách hàng.
  • 73. Thí dụ: Tầm quan trọng của mỗi thuộc tính Tạo ra sản phẩm có độ vị lợi cao nhất đối với Tầm quan trọng người mua.Nhà nghiên cứu của mỗi mức độ trong các thuộc tính
  • 74. Phân tích phụ thuộcPhân tích tương tác
  • 75. FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ)Là phép rút gọn dữ liệu và biến bằng cách nhómchúng lại với các nhân tố đại diệnĐiều kiện: các biến phải có thang đo metricỨng dụng• Xây dựng bộ thang đo Multiple – item• Xác định cấu trúc bộ dữ liệu• Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệu
  • 76. Thí dụ: Case X1 X2 X3 … … XmFactor analysis:gom m biến 1thành k factor 2Tùy mục đích bài 3toán, có thểdùng: Exploratory …factor analysis n(EFA) hoặcConfirmatory Factor 1 gồm X1 X6 X9 Xmfactor analysis 2 gồm X2 X3 X10 Xm - 1(CFA) 3 gồm X4 X5 X7 X8 ...
  • 77. CLUSTER ANALYSIS (PHÂN TÍCH NHÓM) Phân chia các đối tượng/ người thành các nhóm với các thành viên trong nhóm có các đặc trưng tương tự. Mục tiêuThí dụ: Bài toán phân khúc thị trường (Segmentation) Phân loại hành vi mua (Typology)
  • 78. CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)Quá trình thực hiệnXác định các biến làm cơ sở để phân nhóm Phần chia các nhóm dựa trên sự tương tự Đặc tên nhóm dựa theo đặc điểm chung của các thuộc tính (các biến cơ sở) Chuẩn định (Validation) và mô tả đặc trưng (profiling)
  • 79. Thí dụ: Cluster analysis để phân khúc thị trườngYêu cầu thang đo: metricCông ty TICO: Xác định các Nhóm Khách Hàng khácnhau căn cứ trên hành vi mua.“Hãy đánh giá mức độ quan trọng của các yếu tố sau đâytrong quyết định mua hàng của Ông/ Bà”X1 – Chất lượng sản phẩmX2 – Giá bánX3 – Thời gian giao hàngX4 – Uy tín nhà sản xuấtX5 – Các dịch vụ đi kèm Không qtrọng Rất qtrọng 1 2 3 4 5 6 7
  • 80. Thí dụ: Cluster analysis để phân khúc thị trường Hơn 300 khách hàng được khảo sát Nhận dạng ra các nhóm khác nhau. Trong mỗi nhóm có sự tương tự nhau về tầm quan trọng của các yếu tố (X1 X5) ảnh hưởng đến quyết định mua. Nhóm 1Nhóm 1: X1, X4, X5 là quan trọng trong Khách hàng trẻ,quyết định mua thu nhập cao, ởNhóm 2: X1, X2, X3 là quan trọng. TP... Nhóm 2 TICO sẽ có chiến lược tiếp thị đối Khách hàngvới từng nhóm khách hàng khác nhau. công nghiệp – sản xuất
  • 81. MULTIDIMENTIONAL SCALING (perceptual mapping) Mục đích: Xác định số lượng và bản chất của các thứ nguyên (dimensions) đặc trưng cho nhận thức/ đánh giá của khách hàng về các đối tượng. Thang đo: Cả hai loại thang metric/nonmetric Trong MR: Thường được sử dụng trong bài toán xác định vị trí tương đối (relative position) của các nhãn hiệu cạnh tranh nhau do phản hồi từ phía khách hàng. Xác định những yếu tố đặc trưng cho việc đánh giá của khách hàng. Là phương pháp ngược với Cluster
  • 82. Multidimentional Cluster Scaling Analaysis• Phát hiện các thứ • Gộp các đối tượng nguyên đặc trưng thành các nhóm (Underlying theo 1 số đặc tính Dimensions) từ tượng tự nhau các phản hồi
  • 83. KỸ THUẬT ĐO VÀTHU THẬP DỮ LIỆU

×