Dưới đây là Bộ Bài giảng "Giới thiệu về thống kê cho các ngành khoa học xã hội" do DEPOCEN thực hiện.
Tài liệu gồm 04 Bài giảng sẽ cung cấp các Kiến thức nền tảng về thống kê trong các ngành khoa học xã hội đồng thời Hướng dẫn sử dụng một số phân tích dữ liệu thống kê cơ bản.
Bài giảng 1: Giới thiệu chung thống kê
Phần đầu tiên sẽ giới thiệu cho học viên những khái niệm cơ bản về thống kê cũng như cách trình bày dữ liệu thống kê dưới dạng bảng/biểu đồ:
_ Giới thiệu về Thống kê
_ Các bước thực hiện
_ Trình bày dữ liệu trong bảng và biểu đồ
Các tài liệu tham khảo sau đây là kiến thức cơ bản, giúp hiểu nội dung của bài giảng:
_ Patrick Dattalo, Xác định kích thước mẫu: Sự cân bằng về , sự chính xác, và tính thực tiễn, Oxford University Press Hoa Kỳ, 2008 (Chương 2 và Chương 3)
_ JAMES T. McCLAVE, P. GEORGE BENSON, TERRY SlNClCH, Khóa học đầu tiên trong số liệu thống kê kinh doanh, Prentice Hall; 8 ấn bản năm 2000 (Chương 1 và Chương 2)
_ Mario F. Triola, Thống kê cơ bản, Addison Wesley; 9 ấn bản, 2003 (Chương 6 và Chương 7)
Để biết thêm chi tiết về các hoạt động và nghiên cứu của DEPOCEN truy cập:
Website: http://depocen.org/vn/
LinkedIn: http://linkd.in/1GnHrHB
Facebook: DEPOCEN
"Challenges of financial regulation in the post crisis world"- "Những thách t...
(1) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 1: Giới thiệu chung thống kê
1. Giới thiệu về thống kê
DEPOCEN
Chương 1
Giới thiệu chung và cách thu thập số liệu
2. • Các phương pháp thống kê là gì?
• Tại sao chúng ta lại cần các
phương pháp thống kê?
3. Các ph ng pháp th ng kê đ c mô t nhươ ố ượ ả ư
vi c đ nh nghĩa các ph ng pháp s d ngệ ị ươ ử ụ
trong vi c thu th p s li u, bi u di n, phânệ ậ ố ệ ể ễ
tích và làm sáng t d li uỏ ữ ệ (Weinberg and
Schumaker 1962)
4. Để hiểu việc biểu diễn các tính chất và mô tả các
thông tin như thế nào?
Để biết việc vẽ minh họa về một tổng thể lớn mà
chỉ dựa trên thông tin thu được từ các mẫu ra
sao?
Để biết các dự báo thu được chắc chắn đến mức
độ nào?
Để biết bằng cách nào cải tiến quy trình
5. Một công ty có kế hoạch giới thiệu một sản phẩm
mới.
Lợi tức của một sản phẩm trong công ty giảm xuống
nghiêm trọng trong sáu tháng gần đây.
Công ty muốn thay đổi mẫu mã của sản phẩm đã có.
Giám đốc Marketing muốn kiểm tra xem mẫu mã
mới ảnh hưởng đến thái độ của khách hàng với sản
phẩm mới như thế nào?
6. C đi n và Bayesianổ ể
C đi n: Fisher and Pearsonổ ể
Bayesian: Thomas Bayes
Tham s và phi tham s (n a tham s )ố ố ử ố
Nguyên nhân (causal) và t ng quanươ
7. Bước 1: Xác định bài toán
Bước 2: Thiết lập các đối tượng nghiên cứu.
Bước 3: Xác định dạng dữ liệu cần thu thập.
Bước 4: Xác định nguồn lấy thông tin.
Bước 5: Xác định cỡ mẫu và cách lấy mẫu.
Bước 6: Xác định phương pháp thu thập số liệu.
Bước 7: Tiến hành thu thập số liệu.
Bước 8: Mô tả số liệu.
Bước 9: Phân tích số liệu.
Bước 10: Chuẩn bị và diễn giải báo cáo kết quả.
8. Phân loại Thống kê
•Thống kê mô tả:
• Lấy số liệu từ mẫu.
• Mô tả số liệu.
•Thống kê suy luận:
•Phân tích số liệu.
•Đưa ra kết luận.
9. Thống kê mô tả
•Thu thập số liệu (khảo sát)
•Biểu diễn số liệu (bảng, đồ thị)
•Đặc trưng của số liệu: mức ý nghĩa
n
xi∑
Một đặc trưng:
tổng thể: là một tham số
Mẫu: là một thống kê
10. Các bước xác định bài toán:
(1) Các vấn đề liên quan.
(2) Thông tin về công ty như:sản phẩm, dịch vụ, thị trường,
khách hàng….
(3) Những thay đổi gần đây có thể làm ảnh hưởng đến công
ty.
(4) Các hoạt động có thể làm giảm nhẹ bài toán.
11. Để thu được thông tin cơ bản, xác định giới hạn,
làm rõ bài toán và giả thuyết, xác định nguyên
nhân và tạo các câu “nếu … thì…”.
Các loại kế hoạch nghiên cứu:
- Thăm dò
- Mô tả
- Nguyên nhân
12. Thiết kế cấu trúc số liệu thu thập được dựa trên
các đối tượng nghiên cứu.
13. Bước 4: Các số liệu gốc
Chính
Thu thập số liệu
Phụ
Số liệu phức tạp
Quan sát
Thí nghiệm
Khảo sát
Bản in hoặc điện tử
14. Tổng thể: là tất cả các đối tượng được quan sát.
Mẫu: là một phần của tổng thể được chọn để
phân tích.
15. Các phương pháp lấy mẫu
Mẫu
Mẫu không có xác
suất
Mẫu có xác suất
Mẫu ngẫu
nhiên đơn
giản
Mẫu hệ thống
Mẫu phân
tầng
Mẫu
chùm
16. Mẫu có xác suất
Mẫu có xác suất
Mẫu ngẫu
nhiên đơn
giản
Mẫu hệ thống Mẫu phân tầng Mẫu chùm
Các đối tượng mẫu được chọn dựa trên những khả năng đã biết.
17. Mẫu ngẫu nhiên đơn giản
• Mọi đối tượng có khả năng được chọn như
nhau.
• Việc chọn có thể hoàn lại hoặc không hoàn lại.
• Một trong các cách là sử dụng bảng số liệu
ngẫu nhiên thu thập được từ mẫu.
19. Mẫu phân tầng
• Tổng thể được chia thành 2 hoặc nhiều nhóm tùy theo một
vài đặc trưng thông dụng.
• Mẫu ngẫu nhiên đơn giản được chọn từ các nhóm vừa phân
chia.
• Hai hoặc nhiều mẫu được kết nối với nhau.
20. Mẫu chùm
• tổng thể được chia thành một vài “chùm”, mỗi
chùm biểu diễn lại tổng thể.
• Mẫu ngẫu nhiên đơn giản được chọn từ các chùm.
• Các mẫu đơn giản được kết nối làm một.
tổng thể
chia làm 4
“chùm”.
28. Giới thiệu về thống kê
DEPOCEN
Chương 2
Biểu diễn số liệu bằng bảng
và biểu đồ
29. Các chủ đề
•Tổ chức số liệu:
theo thứ tự mảng và hiển thị bằng biểu đồ hình cây-lá
•Bảng và đồ thị số liệu:
•Phân phối tần xuất : bảng, biểu đồ, đường gấp khúc
•Phân phối tích lũy: bảng, biểu đồ, hình cung
•Tổ chức số liệu định tính một chiều: tổng hợp các bảng
•Đồ thị của số liệu định tính 1 chiều:
cột, tròn…
•Bảng số liệu định tính 2 chiều:
Cột, bảng ngẫu nhiên
30. 2 144677
3 028
4 1
Tổ chức số liệu
Số liệu
Thứ tự mảng
Biểu diễn hình
cây-lá
Phân phối tần xuất
Phân phối tích lũy
Biểu đồ
Đường
gấp khúc
Hình
cung
Bảng
41, 24, 32, 26, 27, 27, 30, 24, 38, 21
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
31. Bi u di n hình cây-láể ễ : là m tộ kỹ
thu tậ thống kê hi n th m tđể ể ị ộ
t p s li u. M i giá tr s li uậ ố ệ ỗ ị ố ệ
c chia thànhđượ hai ph n: ph nầ ầ
chính là cây và ph n ph là láầ ụ
cây.
32. 2 1 4 4 6 7 7
Tổ chức số liệu:
•Số liệu biểu diễn hàng ngang:
24, 26, 24, 21, 27, 27, 30, 41, 32, 38
•Số liệu biểu diến theo thứ tự từ nhỏ đến lớn:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41
•Biểu diễn cây-lá:
3 0 2 8
4 1
33. M t phân ph i t n xu t là vi cộ ố ầ ấ ệ
nhóm các s li u thành các m cố ệ ụ
riêng bi t đ ch ra s quan sátệ ể ỉ ố
trong m i l p.ỗ ớ
34. Bảng số liệu: Phân phối tần xuất
Số liệu theo thứ tự mảng:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Lớp Tần xuất
10 đến 20 3 .15 15
20 đến 30 6 .30 30
30 đến 40 5 .25 25
40 đến 50 4 .20 20
50 đến 60 2 .10 10
Tổng số 20 1 100
Tỉ lệ tần
xuất
Phần trăm
35. T l t n xu tỉ ệ ầ ấ : Là ph n trăm c a các quan sátầ ủ
trong m i l p trong t ng th . Ta l y s l ngỗ ớ ổ ể ấ ố ượ
trong m i l p chia cho t ng s quan sát.ỗ ớ ổ ố
Note: Tác d ng c a bi u di n cây-lá v i m t b ngụ ủ ể ễ ớ ộ ả
phân ph i t n xu t là không làm m t đi tínhố ầ ấ ấ
đ ng nh t c a m i quan sát.ồ ấ ủ ỗ
36. Có ba d ng đ th th ng đ c sạ ồ ị ườ ượ ử
d ng là: bi u đ , đ ng g pụ ể ồ ườ ấ
khúc, và phân ph i t n xu t tíchố ầ ấ
lũy (d ng đ ng cong).ạ ườ
37. Bi u để ồ: t o nên b ng cách các l p n m trên tr cạ ằ ớ ằ ụ
ngang và t n xu t n m trên tr c th ng đ ng,ầ ấ ằ ụ ẳ ứ
t n xu t c a m i l p bi u di n đ cao c a hìnhầ ấ ủ ỗ ớ ể ễ ộ ủ
c t và m i c t đ c v c nh nhau.ộ ỗ ộ ượ ẽ ạ
38. M t đ ng g p khúc g m cácộ ườ ấ ồ
đo n th ng n i các đi m n mạ ẳ ố ể ằ
chính gi a các l p và t n xu tữ ớ ầ ấ
c a l p đó.ủ ớ
39. Đ c s d ng đ xác đ nh t l c aượ ử ụ ể ị ỉ ệ ủ
các giá tr s li u là n m trên hayị ố ệ ằ
d i m t giá tr ch c ch n nàoướ ộ ị ắ ắ
đó là bao nhiêu.
40. Histogram
0
3
6
5
4
2
0
0
1
2
3
4
5
6
7
5 15 25 36 45 55 More
Frequency
Đồ thị số liệu: Biểu đồ
Số liệu theo hàng ngang:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
41. Đồ thị số liệu :
Đường gấp khúc
Frequency
0
1
2
3
4
5
6
7
5 15 25 36 45 55 More
Số liệu:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
42. Lớp Tần số %
10 đến 20 3 15
20 đến 30 9 45
30 đến 40 14 70
40 đến 50 18 90
50 đến 60 20 100
Bảng số liệu:
Tần số tích lũy
Số liệu:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
44. Tổ chức số liệu định tính
Số liệu định tính
Bảng số liệu
Tổng kết thành bảng
Đồ thị số liệu
Hình quạt
Dạng khácDạng cột
45. Ví dụ: Tổng kết số liệu bằng
bảng 1 chiều
(với một nhà đầu tư)
Danh mục đầu tư Số lượng %
(ngàn đôla)
Dự trữ 46.5 42.27
Cổ phần 32 29.09
Tiết kiệm 16 14.55
Chi phí khác 15.5 14.09
Tổng cộng 110 100
Biến định tính
46. R t h u ích trong vi c th hi nấ ữ ệ ể ệ
m i quan h c a m t phân ph iố ệ ủ ộ ố
t n: m t hình tròn đ c chia t lầ ộ ượ ỉ ệ
v i các t n xu t c a s li u.ớ ầ ấ ủ ố ệ
48. Tổ chức số liệu định tính dạng bảng
2 chiều
•Bảng ngẫu nhiên
•Dạng cột
49. Tổ chức số liệu định tính dạng
bảng 2 chiều
:Bảng ngẫu nhiên
Danh mục Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng
số đầu tư
Dự trữ 46.5 55 27.5 129
Cổ phần 32 44 19 95
Tiết kiệm 16 28 7 51
Chi phí khác 15.5 20 13.5 49
Tổng số 110 147 67 324
50. Bi u di n s li u đ c thi t k t t n u:ể ễ ố ệ ượ ế ế ố ế
B n ch tả ấ
Th ng kêố
Liên kết các ý tưởng với sự rõ ràng, chính xác và hiệu
quả.
Yêu cầu đưa ra thông tin chính xác về số liệu.
51. Sử dụng ‘Biểu đồ gãy khúc’
Không liên hệ với giá trị chuẩn
khi so sánh các mảng số liệu
Co các trục
Không có số 0 trên trục
52. Biểu diễn đúng
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Minimum Wage Minimum Wage
0
2
4
1960 1970 1980 1990
$
Biểu diễn sai
53. Biểu diễn đúngBiểu diễn sai
0
100
200
300
FR SO JR SR
Freq.
0%
10%
20%
30%
FR SO JR SR
%
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
54. Biểu diễn đúngBiểu diễn sai
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
55. Biểu diễn đúngBiểu diễn sai
0
39
42
45
J F M A M J
$
36
39
42
45
J F M A M J
$
Graphing the first six months of sales.
36