SlideShare a Scribd company logo
BÀI TẬP XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG

1    Dữ liệu và một số thao tác tiền xử lí dữ liệu
Bài 1 Giả sử bạn theo dõi số tiền trong hóa đơn diện thoại hàng tháng theo thứ tự từ tháng 1 đến tháng
12 trong năm vừa qua như sau (đơn vị nghìn đồng)

               198 185      223    221    207 203 180 195 222 177 214 216

a. Nhập dữ liệu thành một vec tơ có tên TienDT.

b. Tính tổng số tiền bạn phải trả cho phí điện thoại trong năm đó.

c. Cho biết tháng nào có số tiền ít (nhiều) nhất, và số tiền là bao nhiêu?

d. Cho biết những tháng bạn phải trả hơn 200 nghìn tiền điện thoại. Có bao nhiêu tháng như thế?

e. Tính xem có bao nhiêu tháng mà tiền điện thoại không quá 190 nghìn.

f. Tính xem có bao nhiêu tháng mà tiền điện thoại dao động trong khoảng [190, 210] nghìn.

g. Tính số tiền điện thoại trung bình một tháng (dùng hàm mean)..

Bài 2 Dùng dữ liệu TienDT trên để thực hiện tiếp những yêu cầu sau

a. Lưu file dữ liệu này dưới dạng .rda

b. Sửa tiền điện thoại tháng 2 thành 175.

c. Nhập thêm vào dãy trên tiền điện thoại của 3 tháng tiếp theo nhưng bạn quên mất số tiền tháng thứ
     13, biết tháng thứ 14, 15 số tiền lần lượt là 201, 185. Sau đó tính lại số tiền trung bình bạn phải
     trả mỗi tháng.

Bài 3 Cho ba tập dữ liệu dạng véc tơ

                  x = c(1, 3, 5, 7, 9),   y = c(1, 2, 8, 6, 4, 5, 7),   z = c(2, 8, 1, 0, 3)

Hãy thực hiện các thao tác sau:

a. z − x, x + z, x⋆z, z/x

b. x + 1, y ⋆ 2, length(x), length(y), x + y

c. sum(x > 5) và sum(x[x > 5])

Bài 4 Dưới đây là thông tin về 8 sinh viên mới ra trường của một khóa học
Bài tập xác suất thống kê và Ứng dụng

                 Thứ tự    Lương khởi điểm   Giới tính   Xếp loại tốt nghiệp   Tuổi
                    1                6         Nam               K              22
                    2                5         Nu                K              25
                    3               4.5        Nam               TB             23
                    4               3.8        Nu                K              22
                    5                8         Nu                G              22
                    6               12         Nam               G              23
                    7                4         Nam               TB             22
                    8                5         Nu                TB             24

a. Nhập dữ liệu vào một data frame (đặt tên là SV) gồm các cột TT, Luong, GioiTinh, TotNghiep,
     Tuoi.

b. Đưa ra dữ liệu về những sinh viên nữ.

c. Đưa ra dữ liệu về những sinh viên nam.

d. Đưa ra danh sách lương khởi điểm của nhóm sinh viên nữ.

e. Đưa ra danh sách tuổi của nhóm sinh viên nam.

f. Đưa ra danh sách những sinh viên có lương khởi điểm trên 6 triệu/tháng.

g Cho biết những thông tin về những người có lương cao nhất trong danh sách.

h. Thêm vào danh sách một sinh viên nam tốt nghiệp xếp loại giỏi, lương khởi điểm 7.5 triệu nhưng
     không có thông tin về tuổi.

i. Thêm vào data frame trên một cột điểm khóa luận tốt nghiệp của các sinh viên trên theo thứ tự như
      sau: 8, 7.5, 7, 7, 9, 9.5, 8, 8, 9.

j. Cho biết dữ liệu trong từng cột được đo bằng thang đo nào?

k. Loại đi số liệu trống không trong data frame. Nhận xét.

Bài 5 Cho file dữ liệu HocSinh.rda. Hãy lấy file dữ liệu và thực hiện các yêu cầu sau:

a. Cho biết tập dữ liệu này có bao nhiêu cột, bao nhiêu dòng?

b. Lấy ra dữ liệu ở cột thứ 3 (Tuoi).

c. Lấy ra toàn bộ dữ liệu ở dòng thứ 10.

d. Tính số học sinh nữ, nam.

e. Tính tỷ lệ học sinh có mức độ yêu thích thể thao là 4. Tính tỷ lệ này trong nhóm học sinh nam,
      trong nhóm học sinh nữ.

Bài 6 Trong file HocSinh.rda, hãy chọn ngẫu nhiên 50 học sinh và lấy ra tất cả thông tin về 50 người
đó. Lưu dữ liệu dưới dạng file .rda.


P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     2
Bài tập xác suất thống kê và Ứng dụng

Bài 7 a. Tạo dãy số từ 1 đến 100.

b. Tạo dãy số chẵn từ 0 đến 100.

c. Tạo dãy số trong đó 3 lặp 4 lần, 5 lặp 10 lần, 16 lặp 7 lần.

d. Tạo dãy số trong đó có các giá trị 1, 2, 3, 4 lần lượt lặp lại 10 lần.

e. Tạo dãy số mà cả cụm 1, 2, 3 lặp lại 8 lần.

f. Tạo biến thứ bậc gồm 3 bậc, mỗi bậc lặp 4 lần.

g. Tạo biến thứ bậc gồm 4 bậc, mỗi bậc lặp 4 lần, chiều dài biến bằng 15.

h. Tạo biến thứ bậc gồm 3 bậc, số lần lặp lại tương ứng là 2, 5, 8 với ký hiệu a, b, c.

Bài 8 Xác định loại thang đo trong các trường hợp sau

a. Thời gian chờ thang máy của một người tại một khu chung cư.

b. Số khối nước một gia đình sử dụng trong một tháng.

c. Xếp hạng 5 chiếc máy trong nhà máy theo đánh giá: rất tốt, tốt, trung bình, kém.

d. Mã vùng điện thoại của các địa phương.

e. Tuổi của các nhân viên trong công ty.

f. Doanh thu (VN đồng) của một cửa hàng bán báo trong một tháng

g. Mã sinh viên trong một trường đại học.

h. Điểm thi một môn của sinh viên một lớp.

i. Chiều cao của một người.

Bài 9 Chọn ngẫu nhiên 5 người từ danh sách gồm 40 người.

Bài 10 Tung một đồng xu 50 lần. Mô phỏng phép thử và đếm số mặt sấp.

Bài 11 Tung một con xúc sắc 100 lần. Mô phỏng phép thử và đếm số lần xuất hiện mặt 6 chấm.

Bài 12 Chọn ngẫu nhiên năm cây bài từ bộ bài tú lơ khơ. Mô phỏng phép thử và kiểm tra xem có bộ
đôi nào trong mẫu không? Hãy lặp lại cho đến khi có được một đôi trong 5 cây bài.




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                          3
Bài tập xác suất thống kê và Ứng dụng

2    Tóm tắt dữ liệu
Bài 13 Trong file dữ liệu có tên là SoLieu.csv chứa một số thông tin cá nhân của 100 người về giới
tính (GioiTinh), tuổi (Tuoi), khu vực sống (KhuVuc) và tổng thu nhập (đơn vị triệu VND) trong năm
2008 (ThuNhap). Hãy lấy file dữ liệu và thực hiện các yêu cầu sau:

a. Trong nhóm được điều tra có bao nhiêu nam và có bao nhiêu người sống ở thành phố.
b. Tính số nam sống ở hải đảo và nữ sống ở nông thôn trong nhóm những người được điều tra.
c. Trong số nữ được điều tra, hãy tính tỉ lệ nữ sống ở thành phố và miền núi.
d. Tiến hành phân tổ cột dữ liệu về tuổi thành các tổ với các điểm chia là 20, 30, 40, 50, 60, 70, 80 và
      tính tỉ lệ những người được điều tra có độ tuổi không vượt quá 50.
e. Tiến hành phân tổ cột dữ liệu về thu nhập thành các tổ với các điểm chia là 20, 40, 60, 80, 100 và
      tính:
      i. tỉ lệ những người phải đóng thuế thu nhập nếu biết một người phải đóng thuế thu nhập nếu
             tổng thu nhập trong năm của người đó vượt quá 60 triệu VND.
      ii. tỉ lệ những người có thu nhập hơn 80 triệu nằm từ độ tuổi 40 đến 50.

Bài 14 Hãy phân tổ cho dữ liệu về điểm toán tuyển sinh khối D năm 2008 trong file
DiemToanKhoiD 2008.rda với số tổ thích hợp và lập bảng tần số tương ứng với số tổ vừa phân.

Bài 15 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàng
và 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của tham số type
thông qua hàm plot()

Bài 16 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàng
và 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của đường bao quanh
hình vẽ của tham số bty thông qua hàm plot()

Bài 17 Tập dữ liệu sau cho ta điểm thi của một số sinh viên (thang điểm 100):

                                    61   27   26   37   30   47 87 90
                                    63   46   67   19   81   47 100 25
                                    45   60   65   53   35   28 80 95
                                    57   37   45   25   48   60 48 47
                                    30   47   60   61   55   48 60 90

(Dữ liệu có trong file DiemThi.xls)

a. Hãy tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. Nêu
     ý nghĩa của những giá trị này.
b. Tính các đại lượng mô tả độ phân bố của tập dữ liệu như: tứ phân vị, phân vị thứ 10, 60, 90 của tập
      dữ liệu. Nêu ý nghĩa của những giá trị này.
c. Tính các đại lượng mô tả độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa, phương sai
      và độ lệch chuẩn.

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                        4
Bài tập xác suất thống kê và Ứng dụng

d. Vẽ biểu đồ hộp và râu cho tập dữ liệu và cho nhận xét.
Bài 18 Bảng tần số sau cho ta thông tin về chiều cao của 300 sinh viên:
      Khoảng giá trị     [150,155)    [155,160)     [160,165) [165,170) [170,175) [175,180)
      Tần số                30           45            55        100       40        30

Tính chiều cao trung bình, phương sai và độ lệch chuẩn của chiều cao của các sinh viên trong nhóm.

Bài 19 File ChiSoIQ.rda cho ta dữ liệu về chỉ số IQ của 200 người. Biết rằng dữ liệu tuân theo phân
phối chuẩn, hãy lấy file dữ liệu và thực hiện các yêu cầu sau:
a. Lập bảng tần số của tập dữ liệu trên bằng cách phân tập dữ liệu thành các tổ có khoảng cách là 10.
b. Vẽ biểu đồ phân phối tần số và đa giác tần số tương ứng với bảng tần số trên.
c. Vẽ biểu đồ phân phối tần số và đa giác tấn số tương ứng với bảng tần số trên trên cùng một hình.
d. Dựa vào hình dáng của hai biểu đồ trên bạn có nhận xét gì hình dáng của phân phối chuẩn.
e. Tính trung bình x và độ lệch chuẩn sx của tập dữ liệu.
f. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x − sx , x + sx ], [x − 2sx , x + 2sx ],
      [x − 3sx , x + 3sx ] và so sánh với qui tắc thực nghiệm.

Bài 20 Bảng sau đây cho ta cho ta bảng giá của chỉ số chứng khoán công nghiệp Dow Jones trong 30
tuần khác nhau
                                    2656    2301    2975    3002    2468
                                    2742    2830    2405    2677    2990
                                    2200    2764    2337    2961    3010
                                    2976    2375    2602    2670    2922
                                    2344    2760    2555    2524    2814
                                    2996    2437    2268    2448    2460
(Dữ liệu có trong file ChiSoDowJones.xls)
a. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét.
b. Lập biểu đồ hộp và râu cho 30 giá trị trên và đưa ra nhận xét.
c. Từ hình dáng của hai biểu đồ ở câu a. và câu b. theo bạn biểu đồ thân và lá hay biểu đồ hộp và râu
     thể hiện tính đối xứng hay nghiêng trái, phải của tập dữ liệu rõ hơn?

Bài 21 Bảng dữ liệu sau cho số lượng album (triệu bản) được bán trong vài năm gần đây của một số
thể loại âm nhạc:
                                           Thể loại     Số lượng
                                           R&B           146.4
                                           Rock          102.6
                                           Rap            73.7
                                           Đồng quê       64.5
                                           Cổ điển        14.8
                                           Latin          14.5

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                             5
Bài tập xác suất thống kê và Ứng dụng

a. Lập biểu đồ thanh mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhận
     xét.

b. Lập biểu tròn mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhận xét.

c. So sánh thông tin có được khi dùng biểu đồ thanh và biểu đồ tròn để mô tả phân phối về số lượng
      album.

Bài 22 Lấy lại file dữ liệu SoLieu.csv và thực hiện các yêu cầu sau:

a. Vẽ biểu đồ thân và lá cho cột tuổi và hãy đưa ra nhận xét về hình dáng của phân phối của tuổi trong
     nhóm được điều tra.

b. Vẽ biểu đồ phân phối tần số với độ rộng mỗi cột là 10 cho cột thu nhập. Biểu đồ này cho ta thông
     tin gì về phân phối của thu nhập của nhóm được điều tra.

c. Vẽ biểu đồ thanh minh họa phân phối tần số của khu vực sống và đưa ra nhận xét.

d. Vẽ biểu đồ thanh minh họa phân phối tần số giới tính trong nhóm được điều tra theo khu vực sống
     và khu vực sống theo giới tính của nhóm được điều tra.

e. Hãy chọn một trong ba đại lượng là trung bình cộng, trung vị và mode mà bạn cho là thích hợp
     nhất để miêu tả độ tập trung cho mỗi cột dữ liệu và hãy tính những đại lượng này.

Bài 23 Điều tra tổng thu nhập (triệu VND) trong năm 2008 của một số chủ hộ gia đình được chọn
ngẫu nhiên trong một phường ở Hà Nội ta thu được bảng số liệu sau:

                                    30   20   35   27 37  30
                                    38   40   42   35 38  44
                                    41   42   47   48 43  50
                                    55   60   70   45 47  49
                                    78   55   60   85 90 100
                                    75   80   85   95 105 47

(Dữ liệu có trong file ThuNhap.xls)

a. Tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. So sánh
      các giá trị này với nhau.

b. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét. Những nhận xét về phân phối của tập
     dữ liệu này có phù hợp với những tính toán ở câu a. không?

c. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x−2sx , x+2sx ], [x−3sx , x+3sx ],
      [x − 4sx , x + 4sx ], ở đây x, sx là trung bình cộng và độ lệch chuẩn của tập dữ liệu. So sánh kết
      quả với định lí Chebyshev.

Bài 24 Thống kê tiền điện (nghìn VND) trong tháng 8 năm 2008 của một số gia đình trong một quận
ở Hà Nội thu được bảng số liệu sau:




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                        6
Bài tập xác suất thống kê và Ứng dụng

                                      5    30    100   150 600    210
                                     85    95    105   120 185    250
                                    310   1500   500   425 480    450
                                    550   175    180   285 350    450
                                    750    65     55   880 1350   270

(Dữ liệu có trong file TienDien.xls)

a. Tính các đại lượng đo độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa và độ lệch chuẩn.

b. Sử dụng đồ thị hộp và râu để minh họa sự phân bố của tập dữ liệu. Đồ thị này cho ta thông tin gì
     về giá trị ngoại biên của tập dữ liệu.

c. Từ các tính toán ở câu a. và b. theo bạn khoảng biến thiên hay độ lệch chuẩn đo độ phân tán cho
     tập dữ liệu trên tốt hơn.

Bài 25 Theo định lí Chebyshev:

a. ít nhất bao nhiêu phần trăm phần tử của tập dữ liệu rơi vào khoảng [µ − kσ, µ + kσ] với những giá
       trị k sau: k = 1.8, k = 3.5, k = 2.5 và k = 4.

b. trong vòng bao nhiêu độ lệch chuẩn từ trung bình chứa ít nhất 80% giá trị của tập dữ liệu.

Bài 16: Một tập dữ liệu số có phân phối xấp xỉ hình chuông đối xứng. Nếu trung bình của các số là
125, độ lệch chuẩn là 12, hãy tìm khoảng giá trị mà:

a. 68% giá trị của tập dữ liệu rơi vào.

b. 95% giá trị của tập dữ liệu rơi vào.

c. 99.7% giá trị của tập dữ liệu rơi vào.

Bài 26 Cho một tập dữ liệu số có phân phối không tuân theo phân phối chuẩn. Nếu trung bình các số
là 38 và độ lệch chuẩn là 6, hãy tính xem:

a. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 26 và 50?

b. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 14 và 62?

c. 89% giá trị của tập dữ liệu rơi vào khoảng hai giá trị nào?


3    Xác suất
Bài 27 Ba người cùng vào một cửa hàng trưng bày xe máy, mỗi người có thể mua một chiếc xe (M )
hoặc không mua (K)

a. Liệt kê các biến cố sơ cấp của không gian mẫu về tất cả các khả năng có thể xảy ra về quyết định
      của ba người trên.

b. Liệt kê các biến cố sơ cấp thuận lợi cho những biến cố sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                       7
Bài tập xác suất thống kê và Ứng dụng

      1. Có đúng ba người mua xe.
      2. Không quá hai người mua xe.
      3. Ít nhất có một người mua xe.
      4. Bốn người có quyết định giống nhau.

c. Giả sử rằng xác suất của các biến cố sơ cấp bằng nhau, hãy tính xác suất của các biến cố trên.

Bài 28 Tiến hành phép thử tung một đồng xu ba lần liên tiếp. Hãy mô tả không gian mẫu của phép
thử. Biến cố nào tương ứng với kết quả: số mặt sấp nhiều hơn số mặt ngửa?

Bài 29 Tung một con xúc xắc hai lần. Gọi E là biến cố tổng số chấm hai mặt trên là chẵn, F là biến
cố mặt trên của con xúc xắc đầu là 1, G là biến cố tổng hai mặt trên bằng 5. Hãy mô tả những biến cố
sau: EF , E ∪ F , F G, E F , EF G.
                         ¯

Bài 30 Cho E, F , G là ba biến cố. Xét các biến cố sau:

1. Chỉ có E xảy ra.

2. E và G xảy ra nhưng F không xảy r.

3. Ít nhất hai trong ba biến cố xảy ra.

4. Ít nhất một trong ba biến cố xảy ra.

5. Cả ba biến cố xảy ra.

6. không biến cố nào xảy ra.

7. Nhiều nhất một trong ba biến cố xảy ra.

8. Đúng hai trong ba biến cố xảy ra.

9. Nhiều nhất cả ba biển cố xảy ra.

a. Hãy biểu diễn các biến cố trên qua E, F, G.

b. Cho P (E) = 0.5, P (F ) = 0.6, P (G) = 0.7. Tính xác suất của các biến cố trên.

Bài 31 Một hệ thống chữa cháy tại một toà nhà cao tầng có hai thiết bị báo cháy D1, D2 hoạt động
độc lập. Khi xảy ra cháy nếu một trong hai thiết bị này báo động đúng thì hệ thống chữa cháy sẽ hoạt
động. Giả sử rằng khi xảy ra cháy D1 báo động đúng với xác suất 0.95 và D2 báo động đúng với xác
suất 0.92. Tính xác suất khi có cháy

a. Cả D1, D2 báo động đúng.

b. Hệ thống chữa cháy hoạt động.

c. Hệ thống chữa cháy không hoạt động.




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      8
Bài tập xác suất thống kê và Ứng dụng

Bài 32 Trong một nhóm những người nghỉ hưu gồm 1000 người thì có 600 người theo Đảng Cộng
hòa và số còn lại theo Đảng Dân chủ. Trong một cuộc bầu cử ở địa phương mà mọi người trong nhóm
này đều tham gia bỏ phiếu, có 60 người theo Đảng Cộng hòa bỏ phiếu cho ứng cử viên Đảng Dân chủ
và 50 người theo Đảng Dân chủ bỏ phiếu cho ứng cử viên Đảng Cộng hòa. Nếu chọn ngẫu nhiên ra
một thành viên trong nhóm đã bỏ phiếu cho Đảng Cộng hòa, xác suất để người này theo Đảng Dân
chủ là bao nhiêu?

Bài 33 Một người có 10 chiếc chìa khóa và có đúng một chìa mở được cửa.

a. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cách
      ngẫu nhiên và bỏ ra ngoài những chìa không mở được.

b. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cách
      ngẫu nhiên và không bỏ ra ngoài những chìa không mở được.

Bài 34 Rút từ bộ bài tây gồm 52 quân ra 5 quân:

a. Tính xác suất để rút được tứ quí át.

b. Tính xác suất để rút được cả 5 quân đều cùng một chất.

c. Tính xác suất để được một đôi (không nhất thiết cùng màu).

Bài 35 Một khách sạn có 10 tầng. Năm khách hàng cùng đi lên thang máy từ tầng một và chọn tầng
ra một cách ngẫu nhiên và độc lập. Tìm xác suất để xảy ra các tình huống sau:

a. Tất cả cùng ra ở tầng năm.

b. Tất cả cùng ra ở một tầng.

c. Mỗi người ra ở một tầng khác nhau.

d. Năm người ra ở bốn tầng khác nhau.

Bài 36 Tung lần lượt hai con xúc xắc. Gọi E là biến cố tổng số chấm hai mặt trên cùng bằng 7.

a. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc đầu tiên bằng 4.

b. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc thứ hai bằng 3.

Bài 37 Một bài thi thể dục tổng hợp gồm ba môn: chạy, nhảy cao, nhảy xa. Xét phép thử Nam và
Tiến bốc thăm môn thi đầu tiên.

a. Mô tả không gian mẫu của phép thử.

b. Xét ba biến cố sau:

         • Nam bốc môn thi đầu tiên là chạy.
         • Tiến bốc môn thi đầu tiên là chạy.
         • Tiến bốc môn thi đầu tiên là nhảy cao.


P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                    9
Bài tập xác suất thống kê và Ứng dụng

      1. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là xung khắc.
      2. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là độc lập.

Bài 38 Ở một trường đại học có 52% là sinh viên nữ, 5% sinh viên trong trường chuyên về khoa học
máy tính, 2% sinh viên nữ và chuyên về khoa học máy tính. Chọn ngẫu nhiên một sinh viên ở trong
trường.

a. Tính xác suất để sinh viên này là nữ biết rằng đây là sinh viên chuyên về khoa học máy tính.

b. Tính xác suất để sinh viên này chuyên về khoa học máy tính biết rằng đây là sinh viên nữ.

c. Hai biến cố "sinh viên được chọn là nữ" và "sinh viên được chọn chuyên về khoa học máy tính" có
     độc lập với nhau không?

Bài 39 Theo một con số thống kê ở Mỹ năm 2007, có khoảng 40% các vụ tai nạn xe cộ gây chết người
là có người lái xe say rượu. Giả sử tỉ lệ số người say rượu khi lái xe là 4%. Hỏi việc say rượu khi lái
xe làm tăng khả năng gây tai nạn chết người lên bao nhiêu lần?

Bài 40 Điều tra sở thích xem ti vi của các cặp vợ chồng cho thấy 30% các bà vợ thường xem chương
trình thể thao, 50% các ông chồng thường xem chương trình thể thao, song nếu thấy vợ xem thì tỉ lệ
chồng xem cùng là 60%. Chọn ngẫu nhiên một cặp vợ chồng.

a. Tìm xác suất để có ít nhất một người thường xem chương trình thể thao.

b. Tìm xác suất để nếu chồng xem thì vợ xem cùng.

c. Tìm xác suất để nếu chồng không xem thì vợ vẫn xem.

d. Hai biến cố "Vợ xem chương trình thể thao" và "Chồng xem chương trình thể thao" có độc lập với
     nhau không?

Bài 41 Thu nhập (triệu đồng) một năm của 500 cặp vợ chồng được ghi lại trong bảng sau:

                                                   Thu nhập chồng
                                    Thu nhập vợ   Dưới 60 Trên 60
                                      Dưới 60       212      198
                                      Trên 60        36       54

Chọn ngẫu nhiên một cặp vợ chồng.

a. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm.

b. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm biết người vợ có thu nhập dưới
      60 triệu một năm.

Bài 42 Giả sử một công ty bảo hiểm chia người dân ra ba nhóm: ít rủi ro, rủi ro trung bình, rất rủi ro.
Số liệu thu thập được cho thấy trong một năm một người thuộc nhóm ít rủi ro, rủi ro trung bình, rất
rủi ro có thể gặp tai nạn với xác suất là 0.05, 0.15, 0.30. Cho biết 20% số người dân thuộc nhóm ít rủi
ro, 50% thuộc nhóm rủi ro trung bình, và 30% thuộc nhóm rất rủi ro.

a. Tỷ lệ số người gặp tai nạn trong một năm là bao nhiêu?

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      10
Bài tập xác suất thống kê và Ứng dụng

b. Nếu một người nào đó không bị tai nạn trong năm 2009, xác suất để người đó thuộc nhóm ít rủi ro
     là bao nhiêu?

Bài 43 Xét nghiệm máu cho khả năng phát hiện đến 99% một loại bệnh (tức là một người mắc bệnh
khi đi xét nghiệm cho kết quả dương tính với xác suất là 0.99). Tuy nhiên xét nghiệm cũng cho những
kết quả "dương tính giả" cho 1% những người khỏe mạnh (tức là, khi một người khỏe mạnh được tiến
hành xét nghiệm thì xác suất là 0.01 để kết quả xét nghiệm cho thấy anh ta bị mắc bệnh). Cho biết
0.5% dân số thực sự mắc loại bệnh này.

a. Một người xét nghiệm có kết quả dương tính, tính xác suất để anh ta mắc bệnh?

b. Một người đi xét nghiệm có kết quả âm tính, tính xác suất để anh ta không mắc bệnh.

Bài 44 Bạn nhờ hàng xóm của bạn tưới nước cho một cây hoa mới trồng của bạn khi bạn đi du lịch.
Loại cây này nếu không tưới nước sẽ bị chết với xác suất 0.8, nếu được tưới nước thì xác suất bị chết
là 0.15. Bạn tin rằng 90% người hàng xóm của bạn sẽ tưới nước cho cây.

a. Xác suất để cây hoa của bạn vẫn còn sống khi bạn trở về là bao nhiêu?

b. Nếu cây hoa của bạn bị chết, xác suất để người hàng xóm đã quên tưới là bao nhiêu?

Bài 45 Có ba ngăn kéo, một ngăn có hai đồng tiền vàng, một ngăn có hai đồng tiền bạc, và một ngăn
có một đồng tiền vàng và một đồng tiền bạc. Rút ra một ngăn kéo một cách ngẫu nhiên và từ ngăn
kéo này lấy ngẫu nhiên ra một đồng tiền. Giả sử được một đồng tiền vàng. Hỏi xác suất để ngăn kéo
được rút ra là ngăn kéo chứa hai đồng tiền vàng là bao nhiêu?

Bài 46 Năm 2001 Cộng đồng Châu Âu có một kiểm tra rất rộng rãi các con bò để phát hiện những
con bị bệnh bò điên. Không có xét nghiệm nào cho kết quả chính xác 100%. Một loại xét nghiệm,
mà ở đây ta gọi là xét nghiệm A, cho kết quả như sau: khi con bò bị bệnh bò điên, thì xác suất để ra
phản ứng dương tính trong xét nghiệm A là 70%, còn khi con bò không bị bệnh, thì xác suất để xảy
ra dương tính trong xét nghiệm A là 10%. Biết rằng tỉ lệ bò bị mắc bệnh bò điên ở Hà Lan là 1.3 con
trên 100000 con. Hỏi rằng khi một con bò ở Hà Lan phản ứng dương tính với xét nghiệm A, thì xác
suất để nó mắc bệnh bò điên là bao nhiêu?


4     Biến ngẫu nhiên
Bài 47 Xác định trường hợp nào sau đây là bảng phân phối xác suất

     X      -1      0       1
a.
     p(x)   0.2    0.6     0.2

     X      1/2    3/4 1
b.
     p(x)   -1      0 2

     X       2       4        6
c.
     p(x)   0.25    0.35     0.5

     X      0.1    0.7     0.8
d.
     p(x)   2/5    1/5     2/5

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     11
Bài tập xác suất thống kê và Ứng dụng

Bài 48 Xét phân phối xác suất như sau:

                              X       0    1    2   3   4    5
                              p(x)   0.15 0.35 0.2 0.1 0.15 0.05

Tìm trung bình và phương sai của X.

Bài 49 Gọi X là biến ngẫu nhiên chỉ chênh lệch giữa số mặt sấp và mặt ngửa khi tung một đồng xu
4 lần.

a. Lập bảng phân phối xác suất của X.

b. Tính kì vọng và phương sai của X.

Bài 50 Mười quả bóng được chọn ngẫu nhiên từ một chiếc bình có 17 quả bóng trắng và 23 quả bóng
đen. Gọi X là biến ngẫu nhiên chỉ số bóng trắng được lấy ra. Tính EX.

Bài 51 Trong một rổ có 99 quả bóng đánh số từ 1 đến 99. Nhặt ngẫu nhiên từ rổ ra 5 quả bóng. Gọi
X, Y tương ứng là số nhỏ nhất, lớn nhất hiện lên trên 5 quả bóng được nhặt ra.

a. Lập bảng phân phối xác suất của X, Y .

b. Tính kì vọng EX, EY .

Bài 52 Một công ty bảo hiểm bán một bảo hiểm nhân thọ với giá 20000 đô la và số tiền khách hàng
phải đóng hàng năm là 300 đô la. Những bảng thống kê bảo hiểm cho thấy, một người mua bảo hiểm
có thể chết trong một năm với xác suất 0.001. Gọi X là biến ngẫu nhiên chỉ lợi nhuận của công ty
trên mỗi bảo hiểm bán ra trong một năm.

a. Hãy cho biết phân phối xác suất của X.

b. Tìm lợi nhuận kỳ vọng trên mỗi bảo hiểm của công ty.

c. Nếu không có giả thiết số tiền khách hàng phải đóng hàng năm là 300 đô la thì số tiền công ty phải
     thu của khách hàng mỗi năm là bao nhiêu để lợi nhuận kỳ vọng trên mỗi bảo hiểm lớn hơn 0?

Bài 53 Một công ty thuê một luật sư trong một vụ kiện với hai phương án trả công như sau:

   • Phương án 1: Trả 10 triệu đồng bất kể thắng hay thua kiện.

   • Phương án 2: Trả 1 triệu đồng nếu thua kiện và 30 triệu đồng nếu thắng kiện.

Luật sư đánh giá khả năng thắng kiện của công ty này là 40%.

a. Lập bảng phân phối xác suất cho số tiền mà luận sư nhận được trong mỗi phương án.

b. Theo bạn luật sư nên chọn phương án nào?

Bài 54 Thống kê số khách trên một ôtô buýt tại một tuyến giao thông thu được số liệu như sau:

                       Số khách trên một chuyến   20 25    30  35   40
                       Xác suất tương ứng         0.3 0.2 0.15 0.1 0.25

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     12
Bài tập xác suất thống kê và Ứng dụng

a. Tìm kì vọng và phương sai của số khách đi mỗi chuyến và giải thích ý nghĩa của kết quả thu được.

b. Giả sử chi phí cho mỗi chuyến xe là 1,5 triệu VND không phụ thuộc vào số khách đi trên xe thì để
     công ty xe buýt có thể thu lãi bình quân cho mỗi chuyến xe là 300 nghìn VND thì phải qui định
     giá vé là bao nhiêu?

Bài 55 Số lượng thuyền gỗ X mà một xưởng đóng thuyền có thể làm được trong một tháng có bảng
phân phối xác suất như sau:

                             X       2   3   4   5   6    7    8
                             PX     0.2 0.2 0.3 0.1 0.1 0.05 0.05

a. Số thuyền có khả năng nhiều nhất mà xưởng đó có thể đóng được trong tháng tới là bao nhiêu?

b. Giả sử việc đóng thuyền có chi phí cố định hàng tháng là 25 triệu đồng và chi phí bổ sung cho mỗi
     con thuyền là 15 triệu đồng. Hãy tìm chi phí bình quân hàng tháng của xưởng đó.

Bài 56 Trên một chuyến bay có 70 chỗ ngồi. Thực tế cho thấy đến giờ chót vẫn có khách bỏ chuyến
bay. Để tận dụng hết chỗ bay bằng cách bán thêm vé dự phòng người ta đã thống kê 20 chuyến bay
và thu được các số liệu sau:

                   Số khách bỏ chuyến bay     1 2 3 4 5 6 7 8 9 10
                   Số chuyến bay tương ứng    1 4 0 4 2 5 1 1 0 2

a. Hãy tính xác suất để trong một chuyến bay nào đó có nhiều hơn 5 hành khách bỏ chuyến bay.

b. Tìm số hành khách bỏ chuyến trung bình của mỗi chuyến bay.

Bài 57 Thời gian sửa chữa một chiếc máy tính cá nhân (đơn vị: giờ) là biến ngẫu nhiên có hàm mật
độ như sau:                          {
                                       1/2, 0 < x < 2
                             f (x) =
                                       0,     trường hợp còn lại

a. Tìm thời gian trung bình để sửa chữa một chiếc máy.
                                                                  √
b. Chi phí sửa chữa phụ thuộc vào thời gian theo công thức 40 + 30 x trong đó x là thời gian sửa
     chữa chiếc máy. Tìm chi phí kỳ vọng để sửa chữa một chiếc máy tính cá nhân.

Bài 58 Một bài thi trắc nghiệm gồm 50 câu hỏi, mỗi câu có 4 đáp án trả lời nhưng chỉ có một đáp án
là đúng. Nam không học bài đi thi trả lời một cách ngẫu nhiên.

a. Tính xác suất để Nam trả lời đúng một nửa số câu hỏi.

b. Một sinh viên thi đỗ nếu trả lời đúng ít nhất một nửa số câu hỏi. Tính xác suất để Nam thi đỗ.

c. Số câu trả lời đúng trung bình của Nam là bao nhiêu? Tính xác suất để Nam trả lời đúng số câu
      bằng số câu trung bình này và nhận xét.

Bài 59 Một bài thi trắc nghiệm gồm 12 câu hỏi, mỗi câu hỏi có 5 phương án trả lời, trong đó chỉ có
một đáp án đúng. Giả sử mỗi câu trả lời đúng được 4 điểm, mỗi câu trả lời sai bị trừ 1 điểm. Một sinh
viên không học bài làm bài bằng cách trả lời ngẫu nhiên từng câu hỏi.

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     13
Bài tập xác suất thống kê và Ứng dụng

a. Tính xem số câu trả lời đúng và số câu trả lời sai để sinh viên này được 13 điểm.

b. Tính xác suất để sinh viên này được 13 điểm.

c. Tính xác suất để sinh viên này bị điểm âm.

Bài 60 Cho X là biến ngẫu ngiên nhị thức với EX = 3, V X = 2.1. Tính các xác suất sau:

a. P (X = 7)

b. P (X ≤ 7)

c. P (X > 7)

d. P (X ≥ 7)

Bài 61 Một người tập ném bóng rổ, đứng từ một chỗ ném bóng vào rổ 6 lần. Xác suất ném trúng mỗi
lần là 2/3. Gọi X, Y tương ứng là số lần ném trúng và ném trượt, hãy tính E(X − Y ).

Bài 62 Nếu bạn mua 50 vé xổ số và cơ hội trúng thưởng của mỗi vé số là 1/100.

a. Tính xác suất để bạn trúng ít nhất một giải, đúng một giải, ít nhất hai giải.

b. Tìm số giải mà bạn có khả năng trúng cao nhất.

Bài 63 Số lần một người bị cảm lạnh trong một năm tuân theo phân phối Poisson với λ = 3.

a. Tính số lần bị cảm trung bình trong một năm của một người.

b. Tính xác suất để một người không bị cảm lạnh lần nào trong năm.

c. Tính xác suất để một người bị cảm lạnh không quá ba lần trong một năm.

Bài 64 Giả sử một người có mặt tại bến xe buýt lúc 10 giờ sáng, cho biết thời điểm xe buýt đỗ tại bến
tuân theo phân phối đều giữa 10h và 10h30.

a. Tính xác suất người đó phải đợi trên 15 phút.

b. Nếu lúc 10h15 xe buýt vẫn chưa tới bến, tính xác suất để người đó phải đợi thêm ít nhất 5 phút
     nữa.

Bài 65 Cho X là biến ngẫu nhiên phân phối chuẩn với tham số µ = 8, σ 2 = 25, tính các xác suất sau:

a. P (X > 5).

b. P (2 < X < 6).

c. P (X < 15).

d. P (X > 10).

e. Tìm x0 sao cho P (X < x0 ) = 0.4.

f. Tìm x0 sao cho P (X > x0 ) = 0.7.

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                        14
Bài tập xác suất thống kê và Ứng dụng

Bài 66 Giả sử tuổi thọ của một chiếc đèn hình màu trong tivi tuân theo phân phối chuẩn với trung
bình 8.2 năm và độ lệch chuẩn 1.4 năm. Chọn ngẫu nhiên một chiếc đèn hình màu.

a. Tính xác suất để chiếc đèn hình màu có tuổi thọ trên 10 năm.

b. Tính xác suất để một chiếc đèn hình màu có tuổi thọ ít hơn 4 năm.

c. Tính xác suất để một chiếc đèn hình màu có tuổi thọ từ 4 đến 10 năm.

d. Nếu qui định thời gian bảo hành là 5 năm thì tỉ lệ bảo hành là bao nhiêu?

e. Nếu muốn tỉ lệ bảo hành là 5% thì phải qui định thời gian bảo hành là bao nhiêu năm?

Bài 67 Chỉ số IQ của người tuân theo phân phối chuẩn với trung bình 100 và độ lệch chuẩn 14.2.
Nhóm 10% những người có chỉ số IQ cao nhất có chỉ số IQ nằm trong phạm vi nào?

Bài 68 Giả sử lượng mưa hàng năm (mm) của một địa phương tuân theo phân phối chuẩn với trung
bình là 1800, độ lệch chuẩn là 100. Tính xác suất để có 2 năm trong 4 năm có lượng mưa không quá
1600 mm. Giả thiết rằng lượng mưa trong các năm khác nhau là độc lập.

Bài 69 Giả sử số dặm (nghìn dặm) một chiếc ôtô đi được cho đến khi không sử dụng được nữa tuân
theo phân phối mũ với tham số λ = 1/20.

a. Tính số dặm trung bình mà một chiếc ô tô đi được.

b. Một người mua một chiếc xe mới, tính xác suất để người này đi được ít nhất 20 nghìn dặm.

c. Một người mua một chiếc ôtô cũ đã đi được 10 nghìn dặm, tính xác suất để anh ta có thể sử dụng
     nó để đi tiếp được ít nhất 20 nghìn dặm nữa.

Bài 70 Số lần động đất tại một địa phương có phân phối Poisson với tỷ lệ 5 trận mỗi năm

a. Xác suất có ít nhất 3 vụ động đất trong nửa năm đầu tiên của năm 2020 là bao nhiêu?

b. Giả sử sự kiện trên xảy ra, xác suất không có động đất ở địa phương trong năm 2020 là bao nhiêu?

c. Mới có một vụ động đất vào tháng 5 năm 2020. Tính xác suất để ít nhất một năm nữa không có vụ
     động đất nào.


5    Ước lượng tham số tổng thể
Bài 71 Tại một ngân hàng, người ta muốn cải tiến hệ thống phục vụ để làm giảm thời gian chờ của
khách hàng đến giao dịch. Hiện tại trung bình khách hàng phải chờ từ 9 đến 10 phút. Họ tiến hành
chọn mẫu ngẫu nhiên 100 khách hàng trong vòng 1 tháng sử dụng hệ thống mới. Thời gian chờ của
những người trong mẫu được lưu trong file ThoiGianCho.txt (đơn vị: phút).

a. Tìm một ước lượng điểm cho thời gian chờ trung bình của tất cả khách hàng khi ngân hàng dùng
     hệ thống mới.

b. Tìm khoảng tin cậy 99% cho thời gian chờ trung bình của khách hàng khi ngân hàng dùng hệ thống
     mới.

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     15
Bài tập xác suất thống kê và Ứng dụng

Bài 72 Sử dụng file ThoiGianCho.txt hãy thực hiện các yêu cầu sau:

a. Tìm một ước lượng điểm cho cho tỷ lệ khách hàng phải chờ ít hơn 6 phút.

b. Tìm khoảng tin cậy 90% cho tỷ lệ khách hàng phải chờ ít hơn 6 phút.

Bài 73 Thành phần PCBs (đơn vị: ppm) (polychlorynated biphenyls-một nhóm những chất hóa học
nhân tạo có hại cho môi trường) trong một con cá tại một chiếc hồ được đo bởi một kỹ thuật mà kết
quả tuân theo phân phối chuẩn với trung bình chính là mức PCB thực sự của con cá và độ lệch chuẩn
là 0.08). Tiến hành đo thành phần này trên một con cá trong 8 lần với kỹ thuật đó được kết quả như
sau

                                11.2 12.4 10.8 11.6 12.5 10.1 12.2 10.6

Tìm khoảng tin cậy cho mức PCB của con cá này với độ tin cậy 95%.

Bài 74 Một mẫu ngẫu nhiên gồm 20 điếu thuốc được chọn để xác định thành phần nicotin, kết quả thu
được hàm lượng nicotine trung bình của mẫu là 1.2 mg. Tìm khoảng tin cậy 99% cho lượng nicotine
trung bình của các điếu thuốc lá cho biết lượng nicotine trong một điếu thuốc tuân theo phân phối
chuẩn với độ lệch chuẩn σ = 0.2 mg.

Bài 75 Hãy thực hiện yêu cầu của bài tập trên nếu không biết độ lệch chuẩn tổng thể, thay vào đó ta
biết phương sai mẫu là 0.04.

Bài 76 Một mẫu ngẫu nhiên gồm 100 sản phẩm được chọn từ một dây chuyền sản suất thấy có 16 sản
phẩm phải loại. Tìm khoảng tin cậy 95% cho tỷ lệ sản phẩm bị loại của dây chuyền sản xuất đó.

Bài 77 Dùng dữ liệu trong file HocSinh.rda trên hãy tìm khoảng tin cậy 99% cho tỷ lệ học sinh trong
độ tuổi được nghiên cứu (9-11) có mức độ yêu thích thể thao là 4.


6    Kiểm định tham số một tổng thể
Bài 78 Một công ty dược phẩm ở Anh, Glaxo Holdings, mới phát triển một loại thuốc điều trị chứng
đau nửa đầu. Theo công ty dược này, thời gian trung bình để chất somatriptan, một thành phần của
thuốc, đi vào máu ít hơn 10 phút. Để thuyết phục cơ quan quản lý về nhận định này, Glaxo tiến hành
một thử nghiệm trên một nhóm bệnh nhân bị chứng đau nửa đầu được chọn ngẫu nhiên. Để chứng
minh khẳng định của mình, họ cần đưa ra giả thuyết không và giả thuyết đối như thế nào?

Bài 79 Trong một quy trình sản xuất hoá học, điều rất quan trọng là một dung dịch được dùng cần có
PH chính xác là 8.20. Một phương pháp xác định PH cho dung dịch này được biết sẽ cho các số đo
phân phối chuẩn với trung bình là PH của dung dịch và độ lệch chuẩn là 0.02. Giả sử 10 mẫu dung
dich độc lập đo được PH bằng phương pháp này như sau:

                  8.18 8.17         8.16 8.15 8.17 8.21 8.22 8.16 8.19 8.18

a. Để thực hiện bài toán trên, ta sử dụng loại phân phối nào?

b. Thực hiện kiểm định bằng phương pháp giá trị tới hạn tại mức ý nghĩa 0.05, giá trị kiểm định là
     bao nhiêu, giá trị tới hạn là bao nhiêu? Kết luận.

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      16
Bài tập xác suất thống kê và Ứng dụng

c. Thực hiện kiểm định bằng phương pháp p - giá trị, cho biết p-giá trị của bài toán. Kết luận với mức
     ý nghĩa α = 5%.

Bài 80 Độ bền trung bình của một loại sợi đòi hỏi phải ít nhất bằng 200 psi. Những thí nghiệm trước
đây cho thấy rằng độ lệch chuẩn của độ bền là 5 psi. Một mẫu gồm 8 mẩu sợi được chọn và đo được
độ bền như sau:
                        210 198 195 202 197.5 196 199 195.5
Có thể kết luận, tại mức ý nghĩa 0.05 rằng loại sợi nói trên không đảm bảo tiêu chuẩn không?

Bài 81 Chiều cao trung bình của nam giới của một nước được cho là 1.78 m với độ lệch chuẩn 7.6
cm. Để kiểm tra chiều cao của nam giới tại một thành phố có ở mức trung bình như trên toàn quốc
hay không, một mẫu ngẫu nhiên gồm 20 người là nam giới được chọn ra. Chiều cao của họ được ghi
lại trong file ChieuCao.csv.

                               Thứ tự   Chiều cao Thứ tự Chiều cao
                                 1        1.83      11     1.79
                                 2        1.73     12      1.93
                                 3        1.76     13      1.84
                                 4        1.85     14      1.88
                                 5        1.81     15      1.82
                                 6        1.83     16      1.77
                                 7        1.80     17      1.92
                                 8        1.88     18      1.79
                                 9        1.68     19      1.94
                                10        1.79      20     1.96

Cho biết chiều cao nam giới tại thành phố này tuân theo phân phối chuẩn, hãy kết luận ở mức ý nghĩa
0.01.

Bài 82 Trọng lượng của cá hồi trưởng thành tại một khu vực ấp trứng tuân theo phân phối chuẩn với
độ lệch chuẩn 1.2 pound. Những người nuôi cá cho rằng vụ thu hoạch năm nay, trọng lượng trung
bình của cá ít nhất là 7.6 pound. Một mẫu ngẫu nhiên gồm 16 con cá được chọn ra cân được trọng
lượng trung bình là 7.2 pound. Tại mức ý ngĩa α = 1%, có đủ bằng chứng để bác bỏ giả thuyết của
những người nuôi cá hồi không?

Bài 83 Một quảng cáo về một loại thuốc đánh răng mới cho rằng loại thuốc này làm giảm số răng
sâu của trẻ em. Số lượng răng bị sâu trong một năm của nhóm tuổi này có phân phối chuẩn với trung
bình 3 và độ lệch chuẩn là 1. Một cuộc nghiên cứu trên 2500 trẻ dùng loại thuốc đánh răng này thấy
số răng sâu trung bình 2.95/một trẻ. Giả sử rằng độ lệch chuẩn của số răng sâu của trẻ em dùng loại
thuốc này vẫn là 1. Tại mức ý nghĩa α = 5%, dữ liệu này có đủ để tin vào lời quảng cáo trên hay
không?

Bài 84 Một công ty xăng dầu khẳng định rằng tỷ lệ lưu huỳnh trong dầu diesel của họ nhiều nhất là
0.15%. Để kiểm tra điều này, lượng lưu huỳnh trong mẫu gồm 40 mẫu dầu diesel được xác định và
tính được trung bình và độ lệch chuần là 0.162 và 0.04. Với mức ý nghĩa α = 1% ta có thể kết luận
rằng lời phát biểu của công ty có cơ sở hay không?



P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      17
Bài tập xác suất thống kê và Ứng dụng

Bài 85 Một công ty sản xuất những tấm nhựa dụng trong công nghiêp mới đưa ra một sản phẩm mới
và cho rằng sản phẩm này có thể chịu được sức ép ít nhất là 30 (psi), ở đây khả năng chịu lực đươc
tính bằng số pound cần thiết làm vỡ tấm nhựa trên một diện tích 1 inch vuông. Dữ liệu sau đây cho
biết khả năng chịu lực của một mẫu gồm 16 tấm nhựa (file dữ liệu Nhua.txt).

                         30.1 32.7       22.5 27.5 27.7 29.8 28.9 31.4
                         31.2 24.3       26.4 22.8 29.1 33.4 32.5 21.7
Giả thiết rằng khả năng chịu lực của tấm nhựa phân phối chuẩn. Dựa vào dữ liệu hãy kết luận về
khẳng định của công ty với mức ý nghĩa α = 5% bằng cách dùng phương pháp

a. giá trị tới hạn.

b. p - giá trị.

Bài 86 Trọng lượng sản phẩm của một nhà máy tuân theo phân phối chuẩn với trung bình là 20 kg.
Nghi ngờ máy hoạt động không bình thường người ta cân thử 100 sản phẩm và thu được kết quả như
sau:

                                    Trọng lượng   19 20 21 22 23
                                    Số sản phẩm   10 59 20 6   5

Với mức ý nghĩa 1% hãy kết luận về nghi ngờ nói trên.

Bài 87 Theo số liệu trước đây, dây chuyền sản xuất tại một nhà máy có tỷ lệ phế phẩm là 7%. Người
ta muốn kiểm tra xem tỷ lệ này có thay đổi không nên đã chọn ngẫu nhiên 250 sản phẩm đem kiểm
tra thấy có 20 sản phẩm bị loại. Hãy tiến hành bài toán kiểm định tại mức ý nghĩa 1%.

Bài 88 Dùng file dữ liệu ThoiGianCho.csv kiểm định xem tỷ lệ khách hàng phải chờ trên 7 phút
không vượt quá 25% hay không tại mức ý nghĩa 0.05.


7     Kiểm định tham số hai tổng thể
Bài 89 Trong một nghiên cứu về tác dụng của Vitamin C trong điều trị bệnh cảm lạnh, 22 người bị
cảm lạnh tình nguyện được chia làm hai nhóm: nhóm 1 gồm 10 người được sử dụng một ngày 4 viên
thuốc chứa 1 gram vitamin C. Nhóm 2 gồm 12 người còn lại cũng dùng thuốc bề ngoài tương tự nhưng
không có vitamin C và vô hại. Thời gian bị cảm (đơn vị: ngày) của những người này được ghi lại như
sau (VitaminC.xls)




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                   18
Bài tập xác suất thống kê và Ứng dụng

                         Điều trị có Viatmin C Điều trị không có viatmin C
                                   5.5                     6.5
                                   6.0                     6.0
                                   7.0                     8.5
                                   6.0                     7.0
                                   7.5                     6.5
                                   6.0                     8.0
                                   7.5                     7.5
                                   5.5                     6.5
                                   7.0                     7.5
                                   6.5                     6.0
                                                           8.5
                                                           7.0

Việc sử dụng 4 gram vitamin C mỗi ngày có làm giảm thời gian bị cảm lạnh hay không? Kiểm định
ở mức ý nghĩa 5%.

Bài 90 Một kỹ sư xây dựng muốn so sánh sức chịu nén của hai loại bê tông. Anh ta chọn ra một mẫu
gồm 10 tấm bê tông loại thứ nhất, dữ liệu về sức chịu nén (đơn vị: psi) của những tấm bê tông này
như sau:
             3250 3268 4302 3184 3266 3297 3332 3502 3064 3116
Một mẫu ngẫu nhiên khác gồm 10 tấm bê tông loại thứ hai được chọn và có sức chịu nén như sau
               3094 3106       3004   3066 2984 3124 3316 3212 3380 3018
Giả sử hai tổng thể phân phối chuẩn có phương sai bằng nhau. Hãy kiểm định ở mức ý nghĩa 5% xem
khả năng chịu lực của hai loại bê tông có khác nhau hay không?

Bài 91 Dữ liệu về trọng lượng của những bé sơ sinh trong hai mẫu ngẫu nhiên chọn ra từ các bé sơ
sinh tại hai thành phố A và B cho những kết quả sau

                                      n1 = 55       n2 = 48
                                      x1 = 3.1      x2 = 3.3
                                      s2 = 1.07
                                       1            s2 = 1.01
                                                     2

Kiểm định giả thuyết không: trọng lượng của trẻ sơ sinh ở hai thành phố như nhau ở mức ý nghĩa 5%.

Bài 92 Để nghiên cứu ảnh hưởng của một loại thuốc ngủ, người ta cho 12 bệnh nhân uống thuốc thật
và một lần khác uống thuốc giả, số giờ ngủ của bệnh nhân được ghi lại như sau (file Thuoc.rda)
     Bệnh nhân                   1   2   3   4   5   6   7   8   9  10 11 12
     Số giờ ngủ (thuốc thật)    6.1 7.0 8.2 7.6 6.5 8.4 6.9 6.7 7.4 5.8 6.0 7.1
     Số giờ ngủ (thuốc giả)     5.2 7.9 3.9 4.7 5.3 5.4 4.2 6.1 3.8 6.3 4.1 5.3

Với mức ý nghĩa 5% có kết luận gì về ảnh hưởng của loại thuốc ngủ trên? Cho biết thời gian ngủ của
các bệnh nhân tuân theo quy luật chuẩn.

Bài 93 Để so sánh số hành khách đi xe bus trong giờ cao điểm buổi sáng và buổi chiều ở một thành
phố, trong một ngày người ta chọn ngẫu nhiên 9 chiếc xe với lộ trình khác nhau và thu thập số liệu về
số hành khách đi xe lúc 7h45 và 16h45

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     19
Bài tập xác suất thống kê và Ứng dụng

                          Xe         1    2  3  4 5   6  7  8  9
                          Sáng      43   51 37 24 47 44 50 55 46
                          Chiều     41   49 44 32 46 42 47 51 49

Có sự khác biệt về số hành khách trên các chuyến xe giữa buổi sáng và chiều không? Kiểm định ở
mức ý nghĩa 5% cho biết số hành khách đi xe phân phối chuẩn (làm bằng 2 cách).

Bài 94 Trong một cuộc điều tra người ta thấy 59% trong số 375 nam giới và 70% trong số 481 phụ
nữ nói rằng trọng lượng là một yếu tố quan trọng khi mua một chiếc máy tính xách tay. Điều đó có
cho thấy tỷ lệ phụ nữ có ý kiến nói trên cao hơn nam giới hay không. Dùng mức ý nghĩa 0.05.

Bài 95 Dùng dữ liệu trong file HocSinh.rda để kiểm định xem có phải tỷ lệ học sinh rất thích thể
thao (mức 4) trong nhóm học sinh nam cao hơn so với tỷ lệ này trong nhóm học sinh nữ hay không?
Dùng mức ý nghĩa α = 1%.

Bài 96 Từ dây chuyền thứ nhất kiểm tra 110 chi tiết người ta loại đi 30 chi tiết, từ dây chuyền thứ hai
kiểm tra 150 chi tiết người ta loại đi 40 chi tiết. Ở mức ý nghĩa 5% có thể cho rằng chất lượng sản
phẩm của hai dây chuyền là như nhau không?

Bài 97 Người ta sử dụng hai phương pháp đo hàm lượng PCBs (polychlorynated biphenyls-một nhóm
những chất hóa học nhân tạo có hại cho môi trường) trên cá trong một chiếc hồ. Giả sử kết quả đo
của hai phương pháp tuân theo quy luật chuẩn. Hãy kiểm định giả thuyết phương sai của kết quả đo
bởi hai phương pháp bằng nhau dựa trên kết quả đo 8 lần tiến hành trên một con cá sau đây

                     Phương pháp 1       6.2 5.8 5.7 6.3 5.9 6.1 6.2 5.7
                     Phương pháp 2       6.3 5.7 5.9 6.4 5.8 6.2 6.3 5.5

Bài 98 Điều tra về sự biến động của giá xăng tại hai thành phố, chọn ngẫu nhiên từ mỗi thành phố 10
trạm bán xăng và ghi lại giá một gallon xăng bán tại những trạm này trong một ngày. Kết quả như sau

                   Thành phố 1      1.18 1.07 1.13 1.15 1.14 1.13 1.14 1.13 1.03 1.09
                   Thành phố 2      1.08 1.05 1.19 1.17 1.21 1.12 1.14 1.14 1.13 1.11

Giả thiết giá xăng tuân theo phân phối chuẩn kiểm định về sự khác nhau về phương sai của giá xăng
giữa hai thành phố với mức ý nghĩa α = 0.01.

Bài 99 Trong file ChiSoIQ CLBToanHoc.csv cho ta thông tin về một số thành viên được chọn ngẫu
nhiên từ một vài câu lạc bộ Toán học trong cả nước. Cho biết chỉ số IQ tuân theo phân phối chuẩn, tại
mức ý nghĩa α = 5%, hãy kiểm định xem mức độ đồng đều về chỉ số IQ của nam thành viên và nữ
thành viên tham gia các câu lạc bộ Toán học trong cả nước có như nhau hay không?


8    Phân tích phương sai
Bài 100 Một công ty sản xuất sữa có 4 máy đổ sữa vào các bình. Để kiểm định xem lượng sữa các
máy đổ vào bình có như nhau không, người ta chọn ngẫu nhiên 19 bình sữa sau khi được đổ sữa từ 4
máy nói trên. Lượng sữa trong những bình này đo được như sau:



P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                       20
Bài tập xác suất thống kê và Ứng dụng

                                    Máy 1 Máy 2 Máy 3 Máy 4
                                    4.05  3.99  3.97  4.00
                                    4.01  4.02  3.98  4.02
                                    4.02  4.01  3.97  3.99
                                    4.04  3.99  3.95  4.01
                                          4.00  4.00
                                          4.00  4.00

(Dữ liệu có trong file TrongLuongSua.xls)

a. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có như
     nhau không, nếu giả thiết trọng lượng sữa của các bình đổ từ mỗi máy đều tuân theo phân phối
     chuẩn và có phương sai bằng nhau. Trong trường hợp bác bỏ H0, hãy thực hiện bài toán phân
     tích sâu để có những thông tin tốt hơn về sự khác nhau giữa trọng lượng sữa từ những máy trên.
b. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có như
     nhau không, nếu không có những thông tin về tổng thể trọng lượng sữa của các bình đổ từ mỗi
     máy.

Bài 101 Để kiểm tra ảnh hưởng của ba loại chất phụ gia (A, B, C) và ba loại xăng X1, X2, X3 đến
quãng đường đi được của ô tô, người ta chọn ra 9 xe mô tô giống nhau, mỗi xe sử dụng 20 lít một loại
xăng có pha thêm một chất phụ gia nhất định. Số dặm đi được của các xe được ghi lại như sau:

                                                   Chất phụ gia
                               Loại xăng   A            B         C
                                  X1     124.1        131.5      127
                                  X2     126.4        130.6     128.4
                                  X3     127.2        132.7     125.6

(Dữ liệu có trong file QuangDuong MotQuanSat.xls)

a. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăng
     không ảnh hưởng đến quãng đường đi được.
b. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởng
     của các chất phụ gia là như nhau đến quãng đường đi được.

Bài 102 Trong bài tập trên, ứng với mỗi loại xăng và chất phụ gia người ta thử nghiệm trên 2 chiếc
xe. Quãng đường đi được của những chiếc xe này như sau:

                                                    Chất phụ gia
                                    Loại xăng     A      B       C
                                                126.2 130.4 127
                                       X1
                                                124.8 131.6 126.6
                                                127.2 142.1 129.5
                                       X2
                                                126.6 132.6 142.6
                                                127.2 132.4 125.2
                                       X3
                                                124.9 133.0 120.9

(Dữ liệu có trong file QuangDuong NhieuQuanSat.xls)

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      21
Bài tập xác suất thống kê và Ứng dụng

a. Ở mức ý nghĩa α = 5% hãy kiểm định xem có sự tương tác giữa hai yếu tố loại xăng và chất phụ
     gia không?
a. Ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăng không ảnh hưởng đến quãng đường đi được.
b. Ở mức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởng của các chất phụ gia là như nhau đến quãng
     đường đi được.
Bài 103 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bán
tại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứng
tại các khu vực trên và hỏi giá khách hàng đã mua xe. Biết rằng giá xe ở mỗi nơi bán tuân theo phân
phối chuẩn và có phương sai bằng nhau, thực hiện bài toán phân tích phương sai mô hình một nhân
tố ta thu được kết quả sau:
                                        Df Sum Sq Mean Sq F value
                       KhuVuc            2  15.53    7.76    0.38
                       Residuals        13 266.71   20.52

a. Hoàn thành bảng phân tích phương sai sau:


           Nguồn             Tổng         Bậc tự do       Phương sai                 Tỉ số
          biến thiên      bình phương       (df)             (MS)                      F
                                                              SSG                   M SG
       Giữa các nhóm      SSG =         k−1=          M SG =       =            F =        =
                                                              k−1                   M SW
                                                              SSW
      Nội bộ các nhóm SSW =             n−k =         M SW =       =
                                                              n−k
           Toàn bộ        SST =         n−1=

b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thành
     phố và nông thôn có khác nhau không?
Bài 104 Một kĩ sư nông nghiệp đã tiến hành một cuộc thực nghiệm để thẩm định sự khác biệt về sản
lượng của 4 giống lúa (A, B, C và D) khi dùng 3 loại phân bón khác nhau (Loại 1, Loại 2 và Loại 3).
Kĩ sư này đã ghi lại số tạ thóc trồng trên một hecta của từng giống lúa tương ứng với từng loại phân
bón. Để xem xét sự khác biệt, kĩ sư thực hiện bài toán phân tích phương sai mô hình hai nhân tố, một
quan sát trong một ô và thu được bảng kết quả sau:
                                        Df Sum Sq     Mean Sq F value
                       PhanBon           2 231.17      115.58   11.04
                       GiongLua          3  22.92        7.64    0.73
                       Residuals         6  62.83       10.47

a. Hãy hoàn thành bảng phân tích phương sai sau:

                Nguồn            Tổng           Bậc tự do           Phương sai        Tỉ số
              biến thiên      bình phương         (df)                (MS)              F
            Giữa các nhóm     SSG =           K −1=                M SG =           F1 =
            Giữa các khối     SSB =           H −1=                M SB =           F2 =
               Phần dư        SSE =       (K − 1)(H − 1) =         M SE =
              Tổng cộng       SST =           n−1=

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                    22
Bài tập xác suất thống kê và Ứng dụng

b. Tại mức ý nghĩa α = 5%, hãy kiểm định xem giống lúa có ảnh hưởng đến sản lượng lúa hay
     không?
c. Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại phân bón có ảnh hưởng đến sản lượng lúa hay
      không?
Bài 105 Trong file TienVayKinhDoanh.txt cho ta số liệu về tiền vay kinh doanh (Tien) và loại hình
sở hữu (CongTy) của một số công ty được chọn ngẫu nhiên trong cả nước. Tại mức ý nghĩa α = 5%,
hãy xét xem số tiền vay trung bình của các công ty thuộc ba loại hình sở hữu liên doanh, nhà nước và
tư nhân có như nhau không, giả sử rằng số tiền vay của từng loại công ty tuân theo phân phối chuẩn
có phương sai bằng nhau.


9    Kiểm định phi tham số
Bài 106 Một tổ chức sức khỏe công cộng cho rằng lượng nước dùng trung bình của mỗi một hộ gia
đình trong ngày là 350 gallons. Để kiểm định lại khẳng định này, một nghiên cứu đã được tiến hành
bằng cách chọn ngẫu nhiên ra 20 gia đình và ghi lại lượng nước trung bình họ dùng hàng ngày như
sau:
                                      340   344   362   375   356
                                      386   354   364   332   402
                                      340   355   362   322   372
                                      324   318   360   338   370
(Dữ liệu có trong file LuongNuocTrongNgay.xls)
    Tại mức ý nghĩa α = 5%, hãy kiểm định xem khẳng định của tổ chức sức khỏe công cộng trên là
có cơ sở không?

Bài 107 Nhà sản xuất một loại lốp xe mới khẳng định rằng tuổi thọ trung bình của những chiếc lốp
này ít nhất là 40000 dặm. Để kiểm định lại khẳng định này một mẫu ngẫu nhiên gồm 12 chiếc lốp
được đem ra thử nghiệm và tuổi thọ của chúng (đơn vị 1000 dặm) được ghi lại như sau:
          Lốp         1    2          3      4   5   6   7  8   9    10 11 12
          Tuổi thọ   36.1 40.2       33.8   38.5 42 35.8 37 41 36.8 37.2 33 36
(Dữ liệu có trong file TuoiThoLopXe.xls)
    Tại mức ý nghĩa α = 5%, hãy kiểm định xem lời khẳng định của nhà sản xuất có cơ sở không?

Bài 108 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bán
tại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứng
tại các khu vực trên và hỏi giá khách hàng đã mua xe. Bảng số liệu sau cho ta giá của cùng một kiểu
xe của ba khu vực đang điều tra:
                                    Thị xã Thành phố Nông thôn
                                    158.0    163.0     160.0
                                    165.0    159.0     166.0
                                    157.5    159.0     168.0
                                    162.0    166.5     160.5
                                    156.0    158.0     152.5
                                                       165.5

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     23
Bài tập xác suất thống kê và Ứng dụng

(Dữ liệu có trong file GiaXeMay.xls)

a. Để giá của loại xe mới này có khác nhau tại các khu vực thị xã, thành phố và nông thôn hay không,
     bạn sẽ dùng kiểm định tham số hay phi tham số.

b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thành
     phố và nông thôn có khác nhau hay không?

Bài 109 Người ta thử nghiệm một loại thuốc làm giảm hàm lượng albumin trong máu. Một mẫu gồm
12 bệnh nhân có hàm lượng albumin cao trong máu được điều trị bởi loại thuốc thuốc này. Bảng sau
cho ta hàm lượng albumin trong máu của những bệnh nhân này trước và sau khi điều trị:

                                         Hàm lượng albumin (g/100ml)
                           Bệnh nhân   Trước khi điều trị Sau khi điều trị
                               1             5.02              4.66
                               2             5.08              5.15
                               3             4.75              4.30
                               4             5.25              5.07
                               5             4.80              5.38
                               6             5.77              5.10
                               7             4.85              4.80
                               8             5.09              4.91
                               9             6.05              5.22
                              10             4.77              4.50
                              11             4.85              4.85
                              12             5.24              4.56

(Dữ liệu có trong file HamLuongAlbumin.xls)
    Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại thuốc này có công hiệu không?

Bài 110 Hai mác xe A và B được chọn một cách ngẫu nhiên để thử nghiệm độ bền của động cơ (tính
bằng số ngàn km sử dụng cho đến khi hỏng). Với số liệu đã cho sau đây, tại mức ý nghĩa α = 5% có
thể khẳng định mác xe A tốt hơn mác xe B không?

                                       Mác xe A    Mác xe B
                                         61          26
                                         30          32
                                         49          40
                                         48          35
                                         41          41
                                         45          43
                                         57          30
                                                     36
                                                     41

(Dữ liệu có trong file DoBenDongCo.xls)

Bài 111 Để kiểm định tốc độ xử lí của hai phần mềm mới và hiện dùng, người ta tiến hành điều tra
và thu được thời gian xử lí của hai phần mềm đối với 10 lệnh như sau:

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                    24
Bài tập xác suất thống kê và Ứng dụng

    Lệnh                         1       2    3    4    5    6    7     8                9    10
    Phần mềm đang dùng          9.98    9.98 9.84 9.99 9.94 9.84 9.86 10.12             9.9 9.91
    Phần mềm mới                9.88    9.86 9.75 9.8 9.87 9.84 9.87 9.86               9.83 9.86

(Dữ liệu có trong file TocDoXuLi.csv)
    Hãy kiểm chứng ở mức ý nghĩa 5% về sự khác biệt giữa tốc độ xử lí của hai phần mềm này.

Bài 112 Để đánh giá điều kiện kinh doanh theo một số nhân tố, người ta dùng một thang điểm để đo
"mức độ lạc quan trong kinh doanh" (điểm càng cao thì mức độ lạc quan càng nhiều). Năm 2001,
nhóm điều tra tiếp xúc với 10 người làm việc ở nhiều ngành khác nhau và đề nghị họ đưa ra điểm
nhận định về điều kiện kinh doanh trong lĩnh vực của mình. Năm 2002, nhóm điều tra tiếp xúc với 10
người trên và cũng đề nghị họ đưa ra nhận định như năm 2001. Bảng sau cho ta điểm của 10 người
được phỏng vấn năm 2001 và 2002:

           Năm 2001      63.1    67.1    65.5 68.0 66.6 65.7 69.2 67.0 65.2 60.7
           Năm 2002      57.4    66.4    61.8 65.3 63.5 66.4 64.9 65.2 65.1 62.2

(Dữ liệu có trong file DiemLacQuan.xls)
    Tại mức ý nghĩa α = 5%, trong mỗi trường hợp đưa ra dưới đây có thể khẳng định các nhà kinh
doanh năm 2002 kém lạc quan hơn các nhà kinh doanh năm 2001 không?

a. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên tuân theo phân phối chuẩn.

b. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên không tuân theo phân phối
     chuẩn.

Bài 113 Bốn qui trình hóa học chuẩn được sử dụng để xác định hàm lượng magiê trong một hợp chất
hóa học. Mỗi qui trình được sử dụng năm lần trên cùng một hợp chất và thu được bảng dữ liệu sau:

                                                  Qui trình
                                          1       2       3     4
                                        76.42   80.41 74.20   86.20
                                        78.62   82.26 72.68   86.04
                                        80.40   81.15 78.84   84.36
                                        78.20   79.20 80.32   80.68
                                        79.30   82.30 77.40   85.50

(Dữ liệu có trong file HamLuongMaGie.xls)
    Bằng cách thực hiện lần lượt các yêu cầu sau, hãy kiểm định xem có sự khác biệt về hàm lượng
magiê đo được theo các qui trình khác nhau không?

a. Hãy xét xem bạn nên sử dụng phương pháp tham số hay phi tham số.

b. Nêu cặp giả thuyết H0 và H1 thích hợp.

c. Dựa trên p− giá trị nêu kết luận tại mức ý nghĩa α = 5%.




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                       25
Bài tập xác suất thống kê và Ứng dụng

10     Kiểm định khi- bình phương
Bài 114 Một mẫu ngẫu nhiên gồm 100 phụ nữ ở thành phố Hồ Chí Minh được chọn ra để hỏi mức độ
ưa thích về 5 loại xà phòng A, B, C, D và E thì thu được kết quả như sau:

                           Loại xà phòng       A B C D E             Tổng
                           Số phụ nữ chọn      18 16 23 20 23        100

Hãy kiểm tra xem 5 loại xà phòng này có được ưa thích như nhau đối với phụ nữ ở thành phố HCM
ở mức ý nghĩa 5% không.

Bài 115 Theo hồ sơ lưu trữ thì nếu qui trình sản xuất là bình thường thì có 93% số sản phẩm không
bị sai sót, 5% có một sai sót và 2% có hơn một sai sót. Một mẫu ngẫu nhiên gồm 500 sản phẩm được
chọn ra từ đợt sản xuất tuần qua thì thấy 458 sản phẩm không sai sót , 30 có một sai sót và 12 có hơn
một sai sót. Hãy kiểm chứng ở mức ý nghĩa 5% xem chất lượng sản phẩm tuần qua có bình thường
không.

Bài 116 Theo số liệu các năm trước, giải thưởng trúng được khi mua một loại xà phòng trong dịp tết
Nguyên đán phân về ba miền Bắc, Trung, Nam theo tỉ lệ 3 : 2 : 2. Phỏng vấn 400 người trúng giải
nhân lễ trao giải thưởng năm nay, thấy có 180 người miền Bắc, 100 người miền Trung và 120 người
miền Nam. Tại mức ý nghĩa α = 5% có thể kết luận tỉ lệ giải thưởng năm nay còn như mọi năm
không?

Bài 117 Một nhân viên khách hàng mỗi ngày viếng thăm 5 khách hàng. Giả thiết cho rằng số lần bán
được hàng tuân theo phân phối nhị thức với p = 0.4. Kết quả trong nhiều ngày như sau:

                           Số lần bán trong ngày    0 1   2  3 4 5
                           Số ngày                 10 41 60 20 6 3

Ở mức ý nghĩa 5% ta có thể kết luận rằng phân phối số lần bán ra thực sự tuân theo phân phối đã giả
thiết trên không?

Bài 118 Người ta muốn kiểm tra xem số người đến chi cục thuế ở một huyện có tuân theo phân phối
Poisson không. Thống kê số người đến trong một giờ trong một số ngày tại chi cục thuế này ta thu
được bảng số liệu sau:

                             Số người   0 1  2   3 4  5 trên 5
                             Số giờ     8 12 20 25 15 15   5

Tại mức ý nghĩa α = 5%, hãy xét xem số người đến chi cục thuế trong một giờ có tuân theo phân
phối Poisson với λ = 3 không?

Bài 119 Một trong những cách để quyết định ai là tác giả là so sánh tần số xuất hiện của một từ nào
đó. Nghiên cứu số lần xuất hiện của từ "có thể" trong một đoạn văn dài xấp xỉ 200 từ người ta ghi lại
được như sau:

                            Số lần xuất hiện    0   1  2      ≥3    Tổng
                            Số đoạn văn        156 63 29      14    262

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     26
Bài tập xác suất thống kê và Ứng dụng

Tại mức ý nghĩa α = 5% hãy xét xem phân phối tần số xuất hiện của từ "có thể" có tuân theo phân
phối Poisson với λ = 0.6 không?

Bài 120 Các phương tiện giải trí ở TPHCM sẽ được đánh giá là tốt, vừa hay xấu. Một mẫu ngẫu nhiên
gồm nhiều người có mức thu nhập trên trung bình, trung bình và dưới trung bình được chọn ra để hỏi
ý kiến. Kết quả xếp lớp chéo như sau:

                                                          Ý kiến
                                    Mức thu nhập    Tốt    Vừa     Xấu
                                    Trên trung bình 175    124      92
                                    Trung bình      118    110     126
                                    Dưới trung bình 127    82      147

Hãy kiểm chứng ở mức ý nghĩa 5% hãy kiểm định xem có mối liên hệ giữa mức thu nhập với thái độ
đối với phương tiện giải trí không?

Bài 121 Người ta nghiên cứu xem có mối liên hệ giữa thời gian tìm hiểu trước hôn nhân và tình trạng
hiện tại của cuộc hôn nhân hay không. Bảng sau cho ta số liệu điều tra về 200 cặp vợ chồng có thời
gian kết hôn trên 5 năm, với thời gian tìm hiểu trước hôn nhân được chia làm ba mức là ngắn, trung
bình và dài và tình trạng hôn nhân được chia làm ba mức là hạnh phúc, không hạnh phúc và ly dị/ly
thân:
                                                  Thời gian tìm hiểu
                            Tình trạng hôn nhân Ngắn Trung bình Dài
                            Hạnh phúc            38       58         54
                            Không hạnh phúc      12       14          4
                            Ly dị/Ly thân        10        8          2

Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian tìm hiểu trước hôn nhân có liên hệ với tình
trạng hôn nhân không?

Bài 122 Để tìm hiểu xem thời gian nằm bệnh viện của bệnh nhân có phụ thuộc vào các loại bảo hiểm
(phần trăm chi phí được bảo hiểm chi trả) không, người ta thu thập một mẫu gồm 660 thời gian nằm
viện và được xếp chéo với loại bảo hiểm như sau:

                                                   Số ngày nằm viện
                                    Loại bảo hiểm < 5 5 − 10 > 10
                                       < 25%      40     75      65
                                     25% − 50%    30      45     75
                                       > 50%      40     100    190

Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian nằm viện và loại bảo hiểm có phụ thuộc vào
nhau không?


11     Hồi qui tuyến tính
Bài 123 Để ước lượng giá bán của những chiếc ô tô cũ, người ta xây dựng mô hình hồi qui tuyến tính
của giá xe theo số km mà ô tô đã đi được. Bảng sau cho ta giá bán (đơn vị: 1000 euro) và số km (đơn
vị 1000 km) của 15 chiếc BMW cũ tại thời điểm 08/11/2009:

P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                          27
Bài tập xác suất thống kê và Ứng dụng

                              Giá Số km Giá Số km Giá Số km
                             31.0   24.0 21.0 52.0 11.0 150.0
                             12.5 115.0 18.5  75.0 13.0 156.0
                             15.5   80.0 8.6 126.0 11.0 124.0
                              6.7 195.0 9.0 138.0   9.0 180.0
                             30.0   53.0 18.0 70.0  8.0 143.0

(Dữ liệu có trong file GiaVaQuangDuong.xls)

a. Vẽ biểu đồ tán xạ giữa giá bán và số km đi được. Biểu đồ cho ta nhận xét gì?

b. Tính hệ số tương quan tuyến tính mẫu giữa giá bán và số km đi được. Hệ số tương quan tuyến tính
      mẫu cho ta thông tin gì?

c. Giả sử phân phối xác suất đồng thời của giá bán và số km tuân theo phân phối chuẩn, tại mức ý
      nghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số km đi được
      hay không.

b. Tính hệ số tương quan thứ hạng spearman giữa giá bán và số km đi được. Hệ số tương quan thứ
      hạng cho ta thông tin gì?

c. Giả sử phân phối xác suất đồng thời của giá bán và số km không tuân theo phân phối chuẩn, tại
      mức ý nghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số km
      đi được hay không.

Bài 124 Để xét xem lượng nước tiêu thụ trong một thành phố có thể được dự đoán theo nhiệt độ hay
không, người ta thu thập một mẫu gồm lượng nước tiêu thụ trong một ngày và nhiệt độ cao nhất tương
ứng trong ngày đó ta được bảng dữ liệu sau:

                          Lượng nước dùng (triệu gallons) Nhiệt độ (độ F)
                                      219                       103
                                       56                        39
                                      107                        77
                                      129                        78
                                       68                        50
                                      184                        96
                                      150                        90
                                      112                        75

(Dữ liệu có trong file LuongNuocVaNhietDo.xls)
    Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn.

a. Tính hệ số tương quan tuyến tính giữa lượng nước và nhiệt độ cao nhất trong ngày và cho nhận xét.

b. Viết phương trình hồi qui tuyến tính tổng thể của lượng nước tiêu thụ (Y) trong ngày theo nhiệt độ
     cao nhất (X). Nêu ý nghĩa các hệ số trong phương trình hồi qui.

c. Tìm phương trình hồi qui tuyến tính mẫu của lượng nước tiêu thụ trong ngày theo nhiệt độ cao nhất
     của ngày đó. Hệ số độ dốc trong phương trình hồi qui cho ta thông tin gì?


P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                     28
Bài tập xác suất thống kê và Ứng dụng

d. Tính hệ số xác định và cho nhận xét.

e. Biểu diễn các cặp điểm (x, y) và đường hồi qui mẫu trên cùng một hệ trục tọa độ. Những minh họa
      hình học này phù hợp với những tính toán ở hai câu (a), (c), (d) như thế nào?

f. Tại mức ý nghĩa α = 5%, hãy xét xem nhiệt độ cao nhất trong ngày có là một yếu tố có ý nghĩa
      cho lượng nước tiêu thụ trong ngày không?

g. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui tổng thể và cho nhận xét.

h. Tìm một ước lượng điểm cho lượng nước trung bình trong ngày khi nhiệt độ cao nhất trong ngày
     là X0 .

i. Tìm khoảng tin cậy 90% cho giá trị trung bình của lượng nước tiêu thụ trong ngày E(Y |X0 ) khi
      nhiệt độ trong ngày đó là X0 = 85. Theo bạn độ rộng của khoảng tin cậy này sẽ nhỏ nhất tại
      giá trị X0 bằng bao nhiêu?

j. Tìm khoảng tin cậy 99% cho giá trị thật của lượng nước tiêu thụ trong ngày Y0 , Y0′ khi nhiệt độ cao
                                    ′
      nhất trong ngày là X0 = 90, X0 = 100. So sánh độ rộng của hai khoảng tin cậy này đưa ra lời
      giải thích.

Bài 125 Để minh họa luật Galton về giả thuyết chiều cao của con trai đầu qui về chiều cao trung bình
của dân chúng, nhà thống kê học người Anh Karl Pearson đã chọn ngẫu nhiên và đo chiều cao (đơn
vị inches) của 10 cặp cha và con trai đầu thu được bảng dữ liệu như sau:

         Chiều cao cha          60   62 64 65     66   67   68   70   72 74
         Chiều cao con trai    63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70

(Dữ liệu có trong file ChieuCaoChaVaCon.csv)
    Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn.

a. Tính hệ số tương quan tuyến tính mẫu giữa chiều cao của con trai và chiều cao của cha. Hệ số
      tương quan này cho ta những thông tin gì?

b. Tìm phương trình hồi qui tuyến tính mẫu mô tả mối liên hệ giữa chiều cao của con trai đầu theo
     chiều cao của cha. Giải thích ý nghĩa của các hệ số trong phương trình.

c. Tính hệ số xác định và cho nhận xét.

d. Vẽ biểu đồ tán xạ và đường hồi qui tuyến tính mẫu mô tả chiều cao của con trai đầu theo chiều cao
     của cha trên cùng một biểu đồ và cho nhận xét.

e. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui. Khoảng tin cậy này cho ta
     nhận xét gì?

f. Nếu một người có chiều cao là 70 thì con trai anh ta sẽ cao khoảng bao nhiêu?

g. Tìm khoảng tin cậy 98% cho chiều cao trung bình của những người con trai khi chiều cao của cha
     là 68.




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                      29
Bài tập xác suất thống kê và Ứng dụng

Bài 126 Bộ Nông nghiệp hàng năm công bố dữ liệu về sản lượng của nhiều loại nông sản khác nhau.
Bảng dữ liệu dưới đây cho ta những sản lượng (triệu tấn) của ba loại nông sản là ngô, đậu tương và
lúa mì trong 7 năm:

                                    Ngô Đậu tương Lúa mì
                                    4152  1127     1352
                                    6639  1798     2381
                                    4175  1639     2420
                                    7672  1861     2595
                                    8876  2099     2424
                                    8226  1940     2091
                                    7131  1938     2108

(Dữ liệu có trong file SanLuong.xls)
    Giả sử các giả thiết trong mô hình hồi qui tuyến tính đa biến được thỏa mãn.

a. Lập phương trình hồi qui tuyến tính mẫu của sản lượng ngô theo sản lượng đậu tương và lúa mì.
     Giải thích ý nghĩa của các hệ số trong mô hình.

b. Tính hệ số xác định bội, hệ số xác định hiệu chỉnh và cho nhận xét.

c. Bằng cách kiểm định các hệ số của phương trình hồi qui tổng thể bằng không một cách thích hợp,
     hãy xét xem sản lượng ngô có được giải thích một cách có ý nghĩa qua sản lượng đậu tương và
     lúa mì hay không?

d. Tìm khoảng tin cậy 90% cho sản lượng ngô và sản lượng ngô trung bình khi sản lượng đậu tương
     là 1535 và sản lượng lúa mì là 2205. So sánh độ rộng của hai khoảng tin cậy này.




P.T.Hồng, N.T.Nhung - Bộ môn Toán                                                                    30

More Related Content

What's hot

BẢNG TRA PHÂN PHỐI CHI-SQUARE
BẢNG TRA PHÂN PHỐI CHI-SQUAREBẢNG TRA PHÂN PHỐI CHI-SQUARE
BẢNG TRA PHÂN PHỐI CHI-SQUARE
hiendoanht
 
Bai tap tin dung nh + loi giai
Bai tap tin dung nh + loi giaiBai tap tin dung nh + loi giai
Bai tap tin dung nh + loi giaiNhí Minh
 
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
bài tập kinh tế vi mô
bài tập kinh tế vi môbài tập kinh tế vi mô
bài tập kinh tế vi mô
Trung Billy
 
Bài tập kế toán tài chính có lời giải
Bài tập kế toán tài chính có lời giảiBài tập kế toán tài chính có lời giải
Bài tập kế toán tài chính có lời giải
Nguyen Minh Chung Neu
 
Bài tập quản trị sản xuất
Bài tập quản trị sản xuấtBài tập quản trị sản xuất
Bài tập quản trị sản xuất
Le Nguyen Truong Giang
 
Đề cương ôn tập môn khởi sự kinh doanh - có lời giải
Đề cương ôn tập môn khởi sự kinh doanh - có lời giảiĐề cương ôn tập môn khởi sự kinh doanh - có lời giải
Đề cương ôn tập môn khởi sự kinh doanh - có lời giải
Dịch vụ Làm Luận Văn 0936885877
 
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢIDung Lê
 
Tổng kết công thức kinh tế lượng ( kinh te luong)
Tổng kết công thức kinh tế lượng ( kinh te luong)Tổng kết công thức kinh tế lượng ( kinh te luong)
Tổng kết công thức kinh tế lượng ( kinh te luong)
Quynh Anh Nguyen
 
Bài tập giá trị thời gian của tiền tệ 1
Bài tập giá trị thời gian của tiền tệ 1Bài tập giá trị thời gian của tiền tệ 1
Bài tập giá trị thời gian của tiền tệ 1
Le Nguyen Truong Giang
 
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
Ác Quỷ Lộng Hành
 
Phan phoi gauss
Phan phoi gaussPhan phoi gauss
Phan phoi gauss
Trần Phương
 
120 cau trac nghiem marketing can ban (co dap an)
120 cau trac nghiem marketing can ban (co dap an)120 cau trac nghiem marketing can ban (co dap an)
120 cau trac nghiem marketing can ban (co dap an)Viết Dũng Tiêu
 
Chương 2: Lợi suất và Rủi ro
Chương 2: Lợi suất và Rủi roChương 2: Lợi suất và Rủi ro
Chương 2: Lợi suất và Rủi ro
Dzung Phan Tran Trung
 
Cách tính tỷ giá chéo môn tiền tệ thanh toán quốc tế
Cách tính tỷ giá chéo   môn tiền tệ thanh toán quốc tếCách tính tỷ giá chéo   môn tiền tệ thanh toán quốc tế
Cách tính tỷ giá chéo môn tiền tệ thanh toán quốc tếHọc Huỳnh Bá
 
tổng cầu và chính sách tài khóa
tổng cầu và chính sách tài khóatổng cầu và chính sách tài khóa
tổng cầu và chính sách tài khóaLyLy Tran
 
Tổng cầu và các hàm tổng cầu
Tổng cầu và các hàm tổng cầuTổng cầu và các hàm tổng cầu
Tổng cầu và các hàm tổng cầupehau93
 
Bo de-thi-va-loi-giai-xac-xuat-thong-ke
Bo de-thi-va-loi-giai-xac-xuat-thong-keBo de-thi-va-loi-giai-xac-xuat-thong-ke
Bo de-thi-va-loi-giai-xac-xuat-thong-ke
Nam Cengroup
 

What's hot (20)

BẢNG TRA PHÂN PHỐI CHI-SQUARE
BẢNG TRA PHÂN PHỐI CHI-SQUAREBẢNG TRA PHÂN PHỐI CHI-SQUARE
BẢNG TRA PHÂN PHỐI CHI-SQUARE
 
Bai tap tin dung nh + loi giai
Bai tap tin dung nh + loi giaiBai tap tin dung nh + loi giai
Bai tap tin dung nh + loi giai
 
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
300 Câu hỏi trắc nghiệm thi môn QUẢN TRỊ CHIẾN LƯỢC, CÓ ĐÁP ÁN!
 
bài tập kinh tế vi mô
bài tập kinh tế vi môbài tập kinh tế vi mô
bài tập kinh tế vi mô
 
Bài tập kế toán tài chính có lời giải
Bài tập kế toán tài chính có lời giảiBài tập kế toán tài chính có lời giải
Bài tập kế toán tài chính có lời giải
 
Phương trình hồi quy
Phương trình hồi quyPhương trình hồi quy
Phương trình hồi quy
 
Bài giảng quản trị học
Bài giảng quản trị họcBài giảng quản trị học
Bài giảng quản trị học
 
Bài tập quản trị sản xuất
Bài tập quản trị sản xuấtBài tập quản trị sản xuất
Bài tập quản trị sản xuất
 
Đề cương ôn tập môn khởi sự kinh doanh - có lời giải
Đề cương ôn tập môn khởi sự kinh doanh - có lời giảiĐề cương ôn tập môn khởi sự kinh doanh - có lời giải
Đề cương ôn tập môn khởi sự kinh doanh - có lời giải
 
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI
290 CÂU TRẮC NGHIỆM KINH TẾ VĨ MÔ CÓ LỜI GIẢI
 
Tổng kết công thức kinh tế lượng ( kinh te luong)
Tổng kết công thức kinh tế lượng ( kinh te luong)Tổng kết công thức kinh tế lượng ( kinh te luong)
Tổng kết công thức kinh tế lượng ( kinh te luong)
 
Bài tập giá trị thời gian của tiền tệ 1
Bài tập giá trị thời gian của tiền tệ 1Bài tập giá trị thời gian của tiền tệ 1
Bài tập giá trị thời gian của tiền tệ 1
 
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
Bài tập trắc nghiệm nguyên lý kế toán có lời giải (đáp án)
 
Phan phoi gauss
Phan phoi gaussPhan phoi gauss
Phan phoi gauss
 
120 cau trac nghiem marketing can ban (co dap an)
120 cau trac nghiem marketing can ban (co dap an)120 cau trac nghiem marketing can ban (co dap an)
120 cau trac nghiem marketing can ban (co dap an)
 
Chương 2: Lợi suất và Rủi ro
Chương 2: Lợi suất và Rủi roChương 2: Lợi suất và Rủi ro
Chương 2: Lợi suất và Rủi ro
 
Cách tính tỷ giá chéo môn tiền tệ thanh toán quốc tế
Cách tính tỷ giá chéo   môn tiền tệ thanh toán quốc tếCách tính tỷ giá chéo   môn tiền tệ thanh toán quốc tế
Cách tính tỷ giá chéo môn tiền tệ thanh toán quốc tế
 
tổng cầu và chính sách tài khóa
tổng cầu và chính sách tài khóatổng cầu và chính sách tài khóa
tổng cầu và chính sách tài khóa
 
Tổng cầu và các hàm tổng cầu
Tổng cầu và các hàm tổng cầuTổng cầu và các hàm tổng cầu
Tổng cầu và các hàm tổng cầu
 
Bo de-thi-va-loi-giai-xac-xuat-thong-ke
Bo de-thi-va-loi-giai-xac-xuat-thong-keBo de-thi-va-loi-giai-xac-xuat-thong-ke
Bo de-thi-va-loi-giai-xac-xuat-thong-ke
 

Viewers also liked

Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1
Ngọc Ánh Nguyễn Thị
 
De xstk k12
De xstk k12De xstk k12
De xstk k12
dethinhh
 
đề Thi xác suất thống kê và đáp án
đề Thi xác suất thống kê và đáp ánđề Thi xác suất thống kê và đáp án
đề Thi xác suất thống kê và đáp ánHọc Huỳnh Bá
 
Bài tập Xác suất thống kê
Bài tập Xác suất thống kêBài tập Xác suất thống kê
Bài tập Xác suất thống kêHọc Huỳnh Bá
 
Bai tap xác suất
Bai tap xác suấtBai tap xác suất
Bai tap xác suất
TzaiMink
 
De xstk k11
De xstk k11De xstk k11
De xstk k11dethinhh
 
Bai tap xstk b (cap nhat chuong 6 7)
Bai tap xstk b (cap nhat chuong 6 7)Bai tap xstk b (cap nhat chuong 6 7)
Bai tap xstk b (cap nhat chuong 6 7)Bích Anna
 
Bai tap nguyen ly thong ke
Bai tap nguyen ly thong keBai tap nguyen ly thong ke
Bai tap nguyen ly thong ke
quynhtrang2723
 
Ebook du học Phần Lan
Ebook du học Phần LanEbook du học Phần Lan
Ebook du học Phần Lan
Du học INEC
 
Chuyên đề 5 thống kê
Chuyên đề 5 thống kêChuyên đề 5 thống kê
Chuyên đề 5 thống kê
phamchidac
 
De xstk k13
De xstk k13De xstk k13
De xstk k13
dethinhh
 
Bai tap xac suat thong ke
Bai tap xac suat thong keBai tap xac suat thong ke
Bai tap xac suat thong ke
Tu Uyen Nguyen Pham
 
De xs tk k 14 2012
De xs  tk k 14 2012De xs  tk k 14 2012
De xs tk k 14 2012
dethinhh
 
ôN tập xác suất thống kê
ôN tập xác suất thống kêôN tập xác suất thống kê
ôN tập xác suất thống kêHọc Huỳnh Bá
 
Bảng giá trị hàm Laplace
Bảng giá trị hàm LaplaceBảng giá trị hàm Laplace
Bảng giá trị hàm Laplace
hiendoanht
 
Địa lý kinh tế Nông - Lâm - Ngư nghiệp
Địa lý kinh tế Nông - Lâm - Ngư nghiệpĐịa lý kinh tế Nông - Lâm - Ngư nghiệp
Địa lý kinh tế Nông - Lâm - Ngư nghiệp
Ngốc Nghếch Nhóc
 
Đề thi trắc nghiệm Xác suất thống kê có lời giải
Đề thi trắc nghiệm Xác suất thống kê có lời giảiĐề thi trắc nghiệm Xác suất thống kê có lời giải
Đề thi trắc nghiệm Xác suất thống kê có lời giải希夢 坂井
 

Viewers also liked (20)

bai tap co loi giai xac suat thong ke
bai tap co loi giai xac suat thong kebai tap co loi giai xac suat thong ke
bai tap co loi giai xac suat thong ke
 
Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1Giai sach bai tap xstk dh ktqd chuong 1 full v1
Giai sach bai tap xstk dh ktqd chuong 1 full v1
 
De xstk k12
De xstk k12De xstk k12
De xstk k12
 
đề Thi xác suất thống kê và đáp án
đề Thi xác suất thống kê và đáp ánđề Thi xác suất thống kê và đáp án
đề Thi xác suất thống kê và đáp án
 
Bài tập Xác suất thống kê
Bài tập Xác suất thống kêBài tập Xác suất thống kê
Bài tập Xác suất thống kê
 
Bai tap xác suất
Bai tap xác suấtBai tap xác suất
Bai tap xác suất
 
De xstk k11
De xstk k11De xstk k11
De xstk k11
 
Bai tap xstk b (cap nhat chuong 6 7)
Bai tap xstk b (cap nhat chuong 6 7)Bai tap xstk b (cap nhat chuong 6 7)
Bai tap xstk b (cap nhat chuong 6 7)
 
Baitap xstk-uit
Baitap xstk-uitBaitap xstk-uit
Baitap xstk-uit
 
Bai tap nguyen ly thong ke
Bai tap nguyen ly thong keBai tap nguyen ly thong ke
Bai tap nguyen ly thong ke
 
Ebook du học Phần Lan
Ebook du học Phần LanEbook du học Phần Lan
Ebook du học Phần Lan
 
Xác suất
Xác suấtXác suất
Xác suất
 
Chuyên đề 5 thống kê
Chuyên đề 5 thống kêChuyên đề 5 thống kê
Chuyên đề 5 thống kê
 
De xstk k13
De xstk k13De xstk k13
De xstk k13
 
Bai tap xac suat thong ke
Bai tap xac suat thong keBai tap xac suat thong ke
Bai tap xac suat thong ke
 
De xs tk k 14 2012
De xs  tk k 14 2012De xs  tk k 14 2012
De xs tk k 14 2012
 
ôN tập xác suất thống kê
ôN tập xác suất thống kêôN tập xác suất thống kê
ôN tập xác suất thống kê
 
Bảng giá trị hàm Laplace
Bảng giá trị hàm LaplaceBảng giá trị hàm Laplace
Bảng giá trị hàm Laplace
 
Địa lý kinh tế Nông - Lâm - Ngư nghiệp
Địa lý kinh tế Nông - Lâm - Ngư nghiệpĐịa lý kinh tế Nông - Lâm - Ngư nghiệp
Địa lý kinh tế Nông - Lâm - Ngư nghiệp
 
Đề thi trắc nghiệm Xác suất thống kê có lời giải
Đề thi trắc nghiệm Xác suất thống kê có lời giảiĐề thi trắc nghiệm Xác suất thống kê có lời giải
Đề thi trắc nghiệm Xác suất thống kê có lời giải
 

Similar to Bai tapxstk tonghop

1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
doanvanlamvb
 
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
nataliej4
 
10 đề tổng hợp
10 đề tổng hợp10 đề tổng hợp
10 đề tổng hợp
Hỹ Thành
 
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khốiLuận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
https://www.facebook.com/garmentspace
 
THCS_W11_BaiTap
THCS_W11_BaiTapTHCS_W11_BaiTap
THCS_W11_BaiTapCNTT-DHQG
 
De cuong on tap toan 7 ca nam
De cuong on tap toan 7 ca namDe cuong on tap toan 7 ca nam
De cuong on tap toan 7 ca nam
cnguynthanh3
 
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.docde-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
ssuser148a94
 
De cuong on tap cuoi nam toan 6 co de thi
De cuong on tap cuoi nam toan 6 co de thiDe cuong on tap cuoi nam toan 6 co de thi
De cuong on tap cuoi nam toan 6 co de thi
Tao Binh
 
Bài tập CTDL và GT 13
Bài tập CTDL và GT 13Bài tập CTDL và GT 13
Bài tập CTDL và GT 13
Hồ Lợi
 
Baitap pascal cơ bản
Baitap pascal cơ bảnBaitap pascal cơ bản
Baitap pascal cơ bản
Tường Anh
 
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
Blue.Sky Blue.Sky
 
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
Nguyen Thanh Tu Collection
 
Phân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanhPhân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanh
Tuấn Trần Quốc
 
B A I T A P T O N G H O P
B A I  T A P  T O N G  H O PB A I  T A P  T O N G  H O P
B A I T A P T O N G H O PChjm Ku'
 
Homework - C programming language
Homework - C programming languageHomework - C programming language
Homework - C programming languageLinh Lê
 
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
haic2hv.net
 
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
Nguyen Thanh Tu Collection
 
Bài tập thực hành số 1
Bài tập thực hành số 1Bài tập thực hành số 1
Bài tập thực hành số 1Tran Trung Dung
 
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
Nguyen Thanh Tu Collection
 

Similar to Bai tapxstk tonghop (20)

1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
1. Đề thi số 01 - Giữa HK2 - Toán 8 - Cánh diều.docx
 
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
 
10 đề tổng hợp
10 đề tổng hợp10 đề tổng hợp
10 đề tổng hợp
 
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khốiLuận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
Luận án tiến sĩ toán học các phụ thuộc logic trong mô hình dữ liệu dạng khối
 
THCS_W11_BaiTap
THCS_W11_BaiTapTHCS_W11_BaiTap
THCS_W11_BaiTap
 
De cuong on tap toan 7 ca nam
De cuong on tap toan 7 ca namDe cuong on tap toan 7 ca nam
De cuong on tap toan 7 ca nam
 
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.docde-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
de-giua-ki-1-toan-8-nam-2023-2024-truong-thcs-nguyen-binh-khiem-quang-nam.doc
 
De cuong on tap cuoi nam toan 6 co de thi
De cuong on tap cuoi nam toan 6 co de thiDe cuong on tap cuoi nam toan 6 co de thi
De cuong on tap cuoi nam toan 6 co de thi
 
Bài tập CTDL và GT 13
Bài tập CTDL và GT 13Bài tập CTDL và GT 13
Bài tập CTDL và GT 13
 
Dai so to hop
Dai so to hopDai so to hop
Dai so to hop
 
Baitap pascal cơ bản
Baitap pascal cơ bảnBaitap pascal cơ bản
Baitap pascal cơ bản
 
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
De-thi-hoc-ki-2-toan-6-sach-chan-troi-sang-tao.
 
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
ĐỀ KIỂM TRA GIỮA KỲ 2 LỚP 10 - NĂM 2023-2024 MÔN TOÁN CÁNH DIỀU (ĐỀ 1-10) (TH...
 
Phân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanhPhân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanh
 
B A I T A P T O N G H O P
B A I  T A P  T O N G  H O PB A I  T A P  T O N G  H O P
B A I T A P T O N G H O P
 
Homework - C programming language
Homework - C programming languageHomework - C programming language
Homework - C programming language
 
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
Đề thi toán học Hoa Kỳ AMC8 từ 2010-2023 (bản xem thử)
 
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
ĐỀ ÔN TẬP KIỂM TRA CUỐI HỌC KỲ I NĂM HỌC 2022 – 2023 MÔN TOÁN 10 KẾT NỐI TRI ...
 
Bài tập thực hành số 1
Bài tập thực hành số 1Bài tập thực hành số 1
Bài tập thực hành số 1
 
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
PHIẾU BÀI TẬP TOÁN 8 CHƯƠNG TRÌNH MỚI NĂM HỌC 2023 - 2024 (DÙNG CHUNG 3 BỘ SÁ...
 

Bai tapxstk tonghop

  • 1. BÀI TẬP XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG 1 Dữ liệu và một số thao tác tiền xử lí dữ liệu Bài 1 Giả sử bạn theo dõi số tiền trong hóa đơn diện thoại hàng tháng theo thứ tự từ tháng 1 đến tháng 12 trong năm vừa qua như sau (đơn vị nghìn đồng) 198 185 223 221 207 203 180 195 222 177 214 216 a. Nhập dữ liệu thành một vec tơ có tên TienDT. b. Tính tổng số tiền bạn phải trả cho phí điện thoại trong năm đó. c. Cho biết tháng nào có số tiền ít (nhiều) nhất, và số tiền là bao nhiêu? d. Cho biết những tháng bạn phải trả hơn 200 nghìn tiền điện thoại. Có bao nhiêu tháng như thế? e. Tính xem có bao nhiêu tháng mà tiền điện thoại không quá 190 nghìn. f. Tính xem có bao nhiêu tháng mà tiền điện thoại dao động trong khoảng [190, 210] nghìn. g. Tính số tiền điện thoại trung bình một tháng (dùng hàm mean).. Bài 2 Dùng dữ liệu TienDT trên để thực hiện tiếp những yêu cầu sau a. Lưu file dữ liệu này dưới dạng .rda b. Sửa tiền điện thoại tháng 2 thành 175. c. Nhập thêm vào dãy trên tiền điện thoại của 3 tháng tiếp theo nhưng bạn quên mất số tiền tháng thứ 13, biết tháng thứ 14, 15 số tiền lần lượt là 201, 185. Sau đó tính lại số tiền trung bình bạn phải trả mỗi tháng. Bài 3 Cho ba tập dữ liệu dạng véc tơ x = c(1, 3, 5, 7, 9), y = c(1, 2, 8, 6, 4, 5, 7), z = c(2, 8, 1, 0, 3) Hãy thực hiện các thao tác sau: a. z − x, x + z, x⋆z, z/x b. x + 1, y ⋆ 2, length(x), length(y), x + y c. sum(x > 5) và sum(x[x > 5]) Bài 4 Dưới đây là thông tin về 8 sinh viên mới ra trường của một khóa học
  • 2. Bài tập xác suất thống kê và Ứng dụng Thứ tự Lương khởi điểm Giới tính Xếp loại tốt nghiệp Tuổi 1 6 Nam K 22 2 5 Nu K 25 3 4.5 Nam TB 23 4 3.8 Nu K 22 5 8 Nu G 22 6 12 Nam G 23 7 4 Nam TB 22 8 5 Nu TB 24 a. Nhập dữ liệu vào một data frame (đặt tên là SV) gồm các cột TT, Luong, GioiTinh, TotNghiep, Tuoi. b. Đưa ra dữ liệu về những sinh viên nữ. c. Đưa ra dữ liệu về những sinh viên nam. d. Đưa ra danh sách lương khởi điểm của nhóm sinh viên nữ. e. Đưa ra danh sách tuổi của nhóm sinh viên nam. f. Đưa ra danh sách những sinh viên có lương khởi điểm trên 6 triệu/tháng. g Cho biết những thông tin về những người có lương cao nhất trong danh sách. h. Thêm vào danh sách một sinh viên nam tốt nghiệp xếp loại giỏi, lương khởi điểm 7.5 triệu nhưng không có thông tin về tuổi. i. Thêm vào data frame trên một cột điểm khóa luận tốt nghiệp của các sinh viên trên theo thứ tự như sau: 8, 7.5, 7, 7, 9, 9.5, 8, 8, 9. j. Cho biết dữ liệu trong từng cột được đo bằng thang đo nào? k. Loại đi số liệu trống không trong data frame. Nhận xét. Bài 5 Cho file dữ liệu HocSinh.rda. Hãy lấy file dữ liệu và thực hiện các yêu cầu sau: a. Cho biết tập dữ liệu này có bao nhiêu cột, bao nhiêu dòng? b. Lấy ra dữ liệu ở cột thứ 3 (Tuoi). c. Lấy ra toàn bộ dữ liệu ở dòng thứ 10. d. Tính số học sinh nữ, nam. e. Tính tỷ lệ học sinh có mức độ yêu thích thể thao là 4. Tính tỷ lệ này trong nhóm học sinh nam, trong nhóm học sinh nữ. Bài 6 Trong file HocSinh.rda, hãy chọn ngẫu nhiên 50 học sinh và lấy ra tất cả thông tin về 50 người đó. Lưu dữ liệu dưới dạng file .rda. P.T.Hồng, N.T.Nhung - Bộ môn Toán 2
  • 3. Bài tập xác suất thống kê và Ứng dụng Bài 7 a. Tạo dãy số từ 1 đến 100. b. Tạo dãy số chẵn từ 0 đến 100. c. Tạo dãy số trong đó 3 lặp 4 lần, 5 lặp 10 lần, 16 lặp 7 lần. d. Tạo dãy số trong đó có các giá trị 1, 2, 3, 4 lần lượt lặp lại 10 lần. e. Tạo dãy số mà cả cụm 1, 2, 3 lặp lại 8 lần. f. Tạo biến thứ bậc gồm 3 bậc, mỗi bậc lặp 4 lần. g. Tạo biến thứ bậc gồm 4 bậc, mỗi bậc lặp 4 lần, chiều dài biến bằng 15. h. Tạo biến thứ bậc gồm 3 bậc, số lần lặp lại tương ứng là 2, 5, 8 với ký hiệu a, b, c. Bài 8 Xác định loại thang đo trong các trường hợp sau a. Thời gian chờ thang máy của một người tại một khu chung cư. b. Số khối nước một gia đình sử dụng trong một tháng. c. Xếp hạng 5 chiếc máy trong nhà máy theo đánh giá: rất tốt, tốt, trung bình, kém. d. Mã vùng điện thoại của các địa phương. e. Tuổi của các nhân viên trong công ty. f. Doanh thu (VN đồng) của một cửa hàng bán báo trong một tháng g. Mã sinh viên trong một trường đại học. h. Điểm thi một môn của sinh viên một lớp. i. Chiều cao của một người. Bài 9 Chọn ngẫu nhiên 5 người từ danh sách gồm 40 người. Bài 10 Tung một đồng xu 50 lần. Mô phỏng phép thử và đếm số mặt sấp. Bài 11 Tung một con xúc sắc 100 lần. Mô phỏng phép thử và đếm số lần xuất hiện mặt 6 chấm. Bài 12 Chọn ngẫu nhiên năm cây bài từ bộ bài tú lơ khơ. Mô phỏng phép thử và kiểm tra xem có bộ đôi nào trong mẫu không? Hãy lặp lại cho đến khi có được một đôi trong 5 cây bài. P.T.Hồng, N.T.Nhung - Bộ môn Toán 3
  • 4. Bài tập xác suất thống kê và Ứng dụng 2 Tóm tắt dữ liệu Bài 13 Trong file dữ liệu có tên là SoLieu.csv chứa một số thông tin cá nhân của 100 người về giới tính (GioiTinh), tuổi (Tuoi), khu vực sống (KhuVuc) và tổng thu nhập (đơn vị triệu VND) trong năm 2008 (ThuNhap). Hãy lấy file dữ liệu và thực hiện các yêu cầu sau: a. Trong nhóm được điều tra có bao nhiêu nam và có bao nhiêu người sống ở thành phố. b. Tính số nam sống ở hải đảo và nữ sống ở nông thôn trong nhóm những người được điều tra. c. Trong số nữ được điều tra, hãy tính tỉ lệ nữ sống ở thành phố và miền núi. d. Tiến hành phân tổ cột dữ liệu về tuổi thành các tổ với các điểm chia là 20, 30, 40, 50, 60, 70, 80 và tính tỉ lệ những người được điều tra có độ tuổi không vượt quá 50. e. Tiến hành phân tổ cột dữ liệu về thu nhập thành các tổ với các điểm chia là 20, 40, 60, 80, 100 và tính: i. tỉ lệ những người phải đóng thuế thu nhập nếu biết một người phải đóng thuế thu nhập nếu tổng thu nhập trong năm của người đó vượt quá 60 triệu VND. ii. tỉ lệ những người có thu nhập hơn 80 triệu nằm từ độ tuổi 40 đến 50. Bài 14 Hãy phân tổ cho dữ liệu về điểm toán tuyển sinh khối D năm 2008 trong file DiemToanKhoiD 2008.rda với số tổ thích hợp và lập bảng tần số tương ứng với số tổ vừa phân. Bài 15 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàng và 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của tham số type thông qua hàm plot() Bài 16 Dùng tham số mfrow hoặc mfcol trong hàm par để phân chia cửa sổ đồ họa thành 3 hàng và 2 cột. Trên mỗi phần vừa phân chia này, hãy minh họa các kiểu vẽ khác nhau của đường bao quanh hình vẽ của tham số bty thông qua hàm plot() Bài 17 Tập dữ liệu sau cho ta điểm thi của một số sinh viên (thang điểm 100): 61 27 26 37 30 47 87 90 63 46 67 19 81 47 100 25 45 60 65 53 35 28 80 95 57 37 45 25 48 60 48 47 30 47 60 61 55 48 60 90 (Dữ liệu có trong file DiemThi.xls) a. Hãy tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. Nêu ý nghĩa của những giá trị này. b. Tính các đại lượng mô tả độ phân bố của tập dữ liệu như: tứ phân vị, phân vị thứ 10, 60, 90 của tập dữ liệu. Nêu ý nghĩa của những giá trị này. c. Tính các đại lượng mô tả độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa, phương sai và độ lệch chuẩn. P.T.Hồng, N.T.Nhung - Bộ môn Toán 4
  • 5. Bài tập xác suất thống kê và Ứng dụng d. Vẽ biểu đồ hộp và râu cho tập dữ liệu và cho nhận xét. Bài 18 Bảng tần số sau cho ta thông tin về chiều cao của 300 sinh viên: Khoảng giá trị [150,155) [155,160) [160,165) [165,170) [170,175) [175,180) Tần số 30 45 55 100 40 30 Tính chiều cao trung bình, phương sai và độ lệch chuẩn của chiều cao của các sinh viên trong nhóm. Bài 19 File ChiSoIQ.rda cho ta dữ liệu về chỉ số IQ của 200 người. Biết rằng dữ liệu tuân theo phân phối chuẩn, hãy lấy file dữ liệu và thực hiện các yêu cầu sau: a. Lập bảng tần số của tập dữ liệu trên bằng cách phân tập dữ liệu thành các tổ có khoảng cách là 10. b. Vẽ biểu đồ phân phối tần số và đa giác tần số tương ứng với bảng tần số trên. c. Vẽ biểu đồ phân phối tần số và đa giác tấn số tương ứng với bảng tần số trên trên cùng một hình. d. Dựa vào hình dáng của hai biểu đồ trên bạn có nhận xét gì hình dáng của phân phối chuẩn. e. Tính trung bình x và độ lệch chuẩn sx của tập dữ liệu. f. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x − sx , x + sx ], [x − 2sx , x + 2sx ], [x − 3sx , x + 3sx ] và so sánh với qui tắc thực nghiệm. Bài 20 Bảng sau đây cho ta cho ta bảng giá của chỉ số chứng khoán công nghiệp Dow Jones trong 30 tuần khác nhau 2656 2301 2975 3002 2468 2742 2830 2405 2677 2990 2200 2764 2337 2961 3010 2976 2375 2602 2670 2922 2344 2760 2555 2524 2814 2996 2437 2268 2448 2460 (Dữ liệu có trong file ChiSoDowJones.xls) a. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét. b. Lập biểu đồ hộp và râu cho 30 giá trị trên và đưa ra nhận xét. c. Từ hình dáng của hai biểu đồ ở câu a. và câu b. theo bạn biểu đồ thân và lá hay biểu đồ hộp và râu thể hiện tính đối xứng hay nghiêng trái, phải của tập dữ liệu rõ hơn? Bài 21 Bảng dữ liệu sau cho số lượng album (triệu bản) được bán trong vài năm gần đây của một số thể loại âm nhạc: Thể loại Số lượng R&B 146.4 Rock 102.6 Rap 73.7 Đồng quê 64.5 Cổ điển 14.8 Latin 14.5 P.T.Hồng, N.T.Nhung - Bộ môn Toán 5
  • 6. Bài tập xác suất thống kê và Ứng dụng a. Lập biểu đồ thanh mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhận xét. b. Lập biểu tròn mô tả phân phối về số lượng album được bán ra của từng thể loại và cho nhận xét. c. So sánh thông tin có được khi dùng biểu đồ thanh và biểu đồ tròn để mô tả phân phối về số lượng album. Bài 22 Lấy lại file dữ liệu SoLieu.csv và thực hiện các yêu cầu sau: a. Vẽ biểu đồ thân và lá cho cột tuổi và hãy đưa ra nhận xét về hình dáng của phân phối của tuổi trong nhóm được điều tra. b. Vẽ biểu đồ phân phối tần số với độ rộng mỗi cột là 10 cho cột thu nhập. Biểu đồ này cho ta thông tin gì về phân phối của thu nhập của nhóm được điều tra. c. Vẽ biểu đồ thanh minh họa phân phối tần số của khu vực sống và đưa ra nhận xét. d. Vẽ biểu đồ thanh minh họa phân phối tần số giới tính trong nhóm được điều tra theo khu vực sống và khu vực sống theo giới tính của nhóm được điều tra. e. Hãy chọn một trong ba đại lượng là trung bình cộng, trung vị và mode mà bạn cho là thích hợp nhất để miêu tả độ tập trung cho mỗi cột dữ liệu và hãy tính những đại lượng này. Bài 23 Điều tra tổng thu nhập (triệu VND) trong năm 2008 của một số chủ hộ gia đình được chọn ngẫu nhiên trong một phường ở Hà Nội ta thu được bảng số liệu sau: 30 20 35 27 37 30 38 40 42 35 38 44 41 42 47 48 43 50 55 60 70 45 47 49 78 55 60 85 90 100 75 80 85 95 105 47 (Dữ liệu có trong file ThuNhap.xls) a. Tính các đại lượng mô tả độ tập trung của tập dữ liệu: trung bình cộng, trung vị và mode. So sánh các giá trị này với nhau. b. Lập biểu đồ thân và lá cho 30 giá trị trên và đưa ra nhận xét. Những nhận xét về phân phối của tập dữ liệu này có phù hợp với những tính toán ở câu a. không? c. Tính tỉ lệ phần trăm những giá trị của tập dữ liệu rơi vào khoảng [x−2sx , x+2sx ], [x−3sx , x+3sx ], [x − 4sx , x + 4sx ], ở đây x, sx là trung bình cộng và độ lệch chuẩn của tập dữ liệu. So sánh kết quả với định lí Chebyshev. Bài 24 Thống kê tiền điện (nghìn VND) trong tháng 8 năm 2008 của một số gia đình trong một quận ở Hà Nội thu được bảng số liệu sau: P.T.Hồng, N.T.Nhung - Bộ môn Toán 6
  • 7. Bài tập xác suất thống kê và Ứng dụng 5 30 100 150 600 210 85 95 105 120 185 250 310 1500 500 425 480 450 550 175 180 285 350 450 750 65 55 880 1350 270 (Dữ liệu có trong file TienDien.xls) a. Tính các đại lượng đo độ phân tán của tập dữ liệu: khoảng biến thiên, độ trải giữa và độ lệch chuẩn. b. Sử dụng đồ thị hộp và râu để minh họa sự phân bố của tập dữ liệu. Đồ thị này cho ta thông tin gì về giá trị ngoại biên của tập dữ liệu. c. Từ các tính toán ở câu a. và b. theo bạn khoảng biến thiên hay độ lệch chuẩn đo độ phân tán cho tập dữ liệu trên tốt hơn. Bài 25 Theo định lí Chebyshev: a. ít nhất bao nhiêu phần trăm phần tử của tập dữ liệu rơi vào khoảng [µ − kσ, µ + kσ] với những giá trị k sau: k = 1.8, k = 3.5, k = 2.5 và k = 4. b. trong vòng bao nhiêu độ lệch chuẩn từ trung bình chứa ít nhất 80% giá trị của tập dữ liệu. Bài 16: Một tập dữ liệu số có phân phối xấp xỉ hình chuông đối xứng. Nếu trung bình của các số là 125, độ lệch chuẩn là 12, hãy tìm khoảng giá trị mà: a. 68% giá trị của tập dữ liệu rơi vào. b. 95% giá trị của tập dữ liệu rơi vào. c. 99.7% giá trị của tập dữ liệu rơi vào. Bài 26 Cho một tập dữ liệu số có phân phối không tuân theo phân phối chuẩn. Nếu trung bình các số là 38 và độ lệch chuẩn là 6, hãy tính xem: a. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 26 và 50? b. bao nhiêu phần trăm giá trị của tập dữ liệu rơi vào khoảng 14 và 62? c. 89% giá trị của tập dữ liệu rơi vào khoảng hai giá trị nào? 3 Xác suất Bài 27 Ba người cùng vào một cửa hàng trưng bày xe máy, mỗi người có thể mua một chiếc xe (M ) hoặc không mua (K) a. Liệt kê các biến cố sơ cấp của không gian mẫu về tất cả các khả năng có thể xảy ra về quyết định của ba người trên. b. Liệt kê các biến cố sơ cấp thuận lợi cho những biến cố sau: P.T.Hồng, N.T.Nhung - Bộ môn Toán 7
  • 8. Bài tập xác suất thống kê và Ứng dụng 1. Có đúng ba người mua xe. 2. Không quá hai người mua xe. 3. Ít nhất có một người mua xe. 4. Bốn người có quyết định giống nhau. c. Giả sử rằng xác suất của các biến cố sơ cấp bằng nhau, hãy tính xác suất của các biến cố trên. Bài 28 Tiến hành phép thử tung một đồng xu ba lần liên tiếp. Hãy mô tả không gian mẫu của phép thử. Biến cố nào tương ứng với kết quả: số mặt sấp nhiều hơn số mặt ngửa? Bài 29 Tung một con xúc xắc hai lần. Gọi E là biến cố tổng số chấm hai mặt trên là chẵn, F là biến cố mặt trên của con xúc xắc đầu là 1, G là biến cố tổng hai mặt trên bằng 5. Hãy mô tả những biến cố sau: EF , E ∪ F , F G, E F , EF G. ¯ Bài 30 Cho E, F , G là ba biến cố. Xét các biến cố sau: 1. Chỉ có E xảy ra. 2. E và G xảy ra nhưng F không xảy r. 3. Ít nhất hai trong ba biến cố xảy ra. 4. Ít nhất một trong ba biến cố xảy ra. 5. Cả ba biến cố xảy ra. 6. không biến cố nào xảy ra. 7. Nhiều nhất một trong ba biến cố xảy ra. 8. Đúng hai trong ba biến cố xảy ra. 9. Nhiều nhất cả ba biển cố xảy ra. a. Hãy biểu diễn các biến cố trên qua E, F, G. b. Cho P (E) = 0.5, P (F ) = 0.6, P (G) = 0.7. Tính xác suất của các biến cố trên. Bài 31 Một hệ thống chữa cháy tại một toà nhà cao tầng có hai thiết bị báo cháy D1, D2 hoạt động độc lập. Khi xảy ra cháy nếu một trong hai thiết bị này báo động đúng thì hệ thống chữa cháy sẽ hoạt động. Giả sử rằng khi xảy ra cháy D1 báo động đúng với xác suất 0.95 và D2 báo động đúng với xác suất 0.92. Tính xác suất khi có cháy a. Cả D1, D2 báo động đúng. b. Hệ thống chữa cháy hoạt động. c. Hệ thống chữa cháy không hoạt động. P.T.Hồng, N.T.Nhung - Bộ môn Toán 8
  • 9. Bài tập xác suất thống kê và Ứng dụng Bài 32 Trong một nhóm những người nghỉ hưu gồm 1000 người thì có 600 người theo Đảng Cộng hòa và số còn lại theo Đảng Dân chủ. Trong một cuộc bầu cử ở địa phương mà mọi người trong nhóm này đều tham gia bỏ phiếu, có 60 người theo Đảng Cộng hòa bỏ phiếu cho ứng cử viên Đảng Dân chủ và 50 người theo Đảng Dân chủ bỏ phiếu cho ứng cử viên Đảng Cộng hòa. Nếu chọn ngẫu nhiên ra một thành viên trong nhóm đã bỏ phiếu cho Đảng Cộng hòa, xác suất để người này theo Đảng Dân chủ là bao nhiêu? Bài 33 Một người có 10 chiếc chìa khóa và có đúng một chìa mở được cửa. a. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cách ngẫu nhiên và bỏ ra ngoài những chìa không mở được. b. Tính xác suất để người này mở được cửa ở lần thứ ba nếu như người này mở các chìa một cách ngẫu nhiên và không bỏ ra ngoài những chìa không mở được. Bài 34 Rút từ bộ bài tây gồm 52 quân ra 5 quân: a. Tính xác suất để rút được tứ quí át. b. Tính xác suất để rút được cả 5 quân đều cùng một chất. c. Tính xác suất để được một đôi (không nhất thiết cùng màu). Bài 35 Một khách sạn có 10 tầng. Năm khách hàng cùng đi lên thang máy từ tầng một và chọn tầng ra một cách ngẫu nhiên và độc lập. Tìm xác suất để xảy ra các tình huống sau: a. Tất cả cùng ra ở tầng năm. b. Tất cả cùng ra ở một tầng. c. Mỗi người ra ở một tầng khác nhau. d. Năm người ra ở bốn tầng khác nhau. Bài 36 Tung lần lượt hai con xúc xắc. Gọi E là biến cố tổng số chấm hai mặt trên cùng bằng 7. a. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc đầu tiên bằng 4. b. Chứng minh rằng E độc lập với biến cố mặt trên của con xúc xắc thứ hai bằng 3. Bài 37 Một bài thi thể dục tổng hợp gồm ba môn: chạy, nhảy cao, nhảy xa. Xét phép thử Nam và Tiến bốc thăm môn thi đầu tiên. a. Mô tả không gian mẫu của phép thử. b. Xét ba biến cố sau: • Nam bốc môn thi đầu tiên là chạy. • Tiến bốc môn thi đầu tiên là chạy. • Tiến bốc môn thi đầu tiên là nhảy cao. P.T.Hồng, N.T.Nhung - Bộ môn Toán 9
  • 10. Bài tập xác suất thống kê và Ứng dụng 1. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là xung khắc. 2. Kiểm tra xem trong ba biến cố trên, cặp biến cố nào là độc lập. Bài 38 Ở một trường đại học có 52% là sinh viên nữ, 5% sinh viên trong trường chuyên về khoa học máy tính, 2% sinh viên nữ và chuyên về khoa học máy tính. Chọn ngẫu nhiên một sinh viên ở trong trường. a. Tính xác suất để sinh viên này là nữ biết rằng đây là sinh viên chuyên về khoa học máy tính. b. Tính xác suất để sinh viên này chuyên về khoa học máy tính biết rằng đây là sinh viên nữ. c. Hai biến cố "sinh viên được chọn là nữ" và "sinh viên được chọn chuyên về khoa học máy tính" có độc lập với nhau không? Bài 39 Theo một con số thống kê ở Mỹ năm 2007, có khoảng 40% các vụ tai nạn xe cộ gây chết người là có người lái xe say rượu. Giả sử tỉ lệ số người say rượu khi lái xe là 4%. Hỏi việc say rượu khi lái xe làm tăng khả năng gây tai nạn chết người lên bao nhiêu lần? Bài 40 Điều tra sở thích xem ti vi của các cặp vợ chồng cho thấy 30% các bà vợ thường xem chương trình thể thao, 50% các ông chồng thường xem chương trình thể thao, song nếu thấy vợ xem thì tỉ lệ chồng xem cùng là 60%. Chọn ngẫu nhiên một cặp vợ chồng. a. Tìm xác suất để có ít nhất một người thường xem chương trình thể thao. b. Tìm xác suất để nếu chồng xem thì vợ xem cùng. c. Tìm xác suất để nếu chồng không xem thì vợ vẫn xem. d. Hai biến cố "Vợ xem chương trình thể thao" và "Chồng xem chương trình thể thao" có độc lập với nhau không? Bài 41 Thu nhập (triệu đồng) một năm của 500 cặp vợ chồng được ghi lại trong bảng sau: Thu nhập chồng Thu nhập vợ Dưới 60 Trên 60 Dưới 60 212 198 Trên 60 36 54 Chọn ngẫu nhiên một cặp vợ chồng. a. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm. b. Tính xác suất để người chồng có thu nhập trên 60 triệu một năm biết người vợ có thu nhập dưới 60 triệu một năm. Bài 42 Giả sử một công ty bảo hiểm chia người dân ra ba nhóm: ít rủi ro, rủi ro trung bình, rất rủi ro. Số liệu thu thập được cho thấy trong một năm một người thuộc nhóm ít rủi ro, rủi ro trung bình, rất rủi ro có thể gặp tai nạn với xác suất là 0.05, 0.15, 0.30. Cho biết 20% số người dân thuộc nhóm ít rủi ro, 50% thuộc nhóm rủi ro trung bình, và 30% thuộc nhóm rất rủi ro. a. Tỷ lệ số người gặp tai nạn trong một năm là bao nhiêu? P.T.Hồng, N.T.Nhung - Bộ môn Toán 10
  • 11. Bài tập xác suất thống kê và Ứng dụng b. Nếu một người nào đó không bị tai nạn trong năm 2009, xác suất để người đó thuộc nhóm ít rủi ro là bao nhiêu? Bài 43 Xét nghiệm máu cho khả năng phát hiện đến 99% một loại bệnh (tức là một người mắc bệnh khi đi xét nghiệm cho kết quả dương tính với xác suất là 0.99). Tuy nhiên xét nghiệm cũng cho những kết quả "dương tính giả" cho 1% những người khỏe mạnh (tức là, khi một người khỏe mạnh được tiến hành xét nghiệm thì xác suất là 0.01 để kết quả xét nghiệm cho thấy anh ta bị mắc bệnh). Cho biết 0.5% dân số thực sự mắc loại bệnh này. a. Một người xét nghiệm có kết quả dương tính, tính xác suất để anh ta mắc bệnh? b. Một người đi xét nghiệm có kết quả âm tính, tính xác suất để anh ta không mắc bệnh. Bài 44 Bạn nhờ hàng xóm của bạn tưới nước cho một cây hoa mới trồng của bạn khi bạn đi du lịch. Loại cây này nếu không tưới nước sẽ bị chết với xác suất 0.8, nếu được tưới nước thì xác suất bị chết là 0.15. Bạn tin rằng 90% người hàng xóm của bạn sẽ tưới nước cho cây. a. Xác suất để cây hoa của bạn vẫn còn sống khi bạn trở về là bao nhiêu? b. Nếu cây hoa của bạn bị chết, xác suất để người hàng xóm đã quên tưới là bao nhiêu? Bài 45 Có ba ngăn kéo, một ngăn có hai đồng tiền vàng, một ngăn có hai đồng tiền bạc, và một ngăn có một đồng tiền vàng và một đồng tiền bạc. Rút ra một ngăn kéo một cách ngẫu nhiên và từ ngăn kéo này lấy ngẫu nhiên ra một đồng tiền. Giả sử được một đồng tiền vàng. Hỏi xác suất để ngăn kéo được rút ra là ngăn kéo chứa hai đồng tiền vàng là bao nhiêu? Bài 46 Năm 2001 Cộng đồng Châu Âu có một kiểm tra rất rộng rãi các con bò để phát hiện những con bị bệnh bò điên. Không có xét nghiệm nào cho kết quả chính xác 100%. Một loại xét nghiệm, mà ở đây ta gọi là xét nghiệm A, cho kết quả như sau: khi con bò bị bệnh bò điên, thì xác suất để ra phản ứng dương tính trong xét nghiệm A là 70%, còn khi con bò không bị bệnh, thì xác suất để xảy ra dương tính trong xét nghiệm A là 10%. Biết rằng tỉ lệ bò bị mắc bệnh bò điên ở Hà Lan là 1.3 con trên 100000 con. Hỏi rằng khi một con bò ở Hà Lan phản ứng dương tính với xét nghiệm A, thì xác suất để nó mắc bệnh bò điên là bao nhiêu? 4 Biến ngẫu nhiên Bài 47 Xác định trường hợp nào sau đây là bảng phân phối xác suất X -1 0 1 a. p(x) 0.2 0.6 0.2 X 1/2 3/4 1 b. p(x) -1 0 2 X 2 4 6 c. p(x) 0.25 0.35 0.5 X 0.1 0.7 0.8 d. p(x) 2/5 1/5 2/5 P.T.Hồng, N.T.Nhung - Bộ môn Toán 11
  • 12. Bài tập xác suất thống kê và Ứng dụng Bài 48 Xét phân phối xác suất như sau: X 0 1 2 3 4 5 p(x) 0.15 0.35 0.2 0.1 0.15 0.05 Tìm trung bình và phương sai của X. Bài 49 Gọi X là biến ngẫu nhiên chỉ chênh lệch giữa số mặt sấp và mặt ngửa khi tung một đồng xu 4 lần. a. Lập bảng phân phối xác suất của X. b. Tính kì vọng và phương sai của X. Bài 50 Mười quả bóng được chọn ngẫu nhiên từ một chiếc bình có 17 quả bóng trắng và 23 quả bóng đen. Gọi X là biến ngẫu nhiên chỉ số bóng trắng được lấy ra. Tính EX. Bài 51 Trong một rổ có 99 quả bóng đánh số từ 1 đến 99. Nhặt ngẫu nhiên từ rổ ra 5 quả bóng. Gọi X, Y tương ứng là số nhỏ nhất, lớn nhất hiện lên trên 5 quả bóng được nhặt ra. a. Lập bảng phân phối xác suất của X, Y . b. Tính kì vọng EX, EY . Bài 52 Một công ty bảo hiểm bán một bảo hiểm nhân thọ với giá 20000 đô la và số tiền khách hàng phải đóng hàng năm là 300 đô la. Những bảng thống kê bảo hiểm cho thấy, một người mua bảo hiểm có thể chết trong một năm với xác suất 0.001. Gọi X là biến ngẫu nhiên chỉ lợi nhuận của công ty trên mỗi bảo hiểm bán ra trong một năm. a. Hãy cho biết phân phối xác suất của X. b. Tìm lợi nhuận kỳ vọng trên mỗi bảo hiểm của công ty. c. Nếu không có giả thiết số tiền khách hàng phải đóng hàng năm là 300 đô la thì số tiền công ty phải thu của khách hàng mỗi năm là bao nhiêu để lợi nhuận kỳ vọng trên mỗi bảo hiểm lớn hơn 0? Bài 53 Một công ty thuê một luật sư trong một vụ kiện với hai phương án trả công như sau: • Phương án 1: Trả 10 triệu đồng bất kể thắng hay thua kiện. • Phương án 2: Trả 1 triệu đồng nếu thua kiện và 30 triệu đồng nếu thắng kiện. Luật sư đánh giá khả năng thắng kiện của công ty này là 40%. a. Lập bảng phân phối xác suất cho số tiền mà luận sư nhận được trong mỗi phương án. b. Theo bạn luật sư nên chọn phương án nào? Bài 54 Thống kê số khách trên một ôtô buýt tại một tuyến giao thông thu được số liệu như sau: Số khách trên một chuyến 20 25 30 35 40 Xác suất tương ứng 0.3 0.2 0.15 0.1 0.25 P.T.Hồng, N.T.Nhung - Bộ môn Toán 12
  • 13. Bài tập xác suất thống kê và Ứng dụng a. Tìm kì vọng và phương sai của số khách đi mỗi chuyến và giải thích ý nghĩa của kết quả thu được. b. Giả sử chi phí cho mỗi chuyến xe là 1,5 triệu VND không phụ thuộc vào số khách đi trên xe thì để công ty xe buýt có thể thu lãi bình quân cho mỗi chuyến xe là 300 nghìn VND thì phải qui định giá vé là bao nhiêu? Bài 55 Số lượng thuyền gỗ X mà một xưởng đóng thuyền có thể làm được trong một tháng có bảng phân phối xác suất như sau: X 2 3 4 5 6 7 8 PX 0.2 0.2 0.3 0.1 0.1 0.05 0.05 a. Số thuyền có khả năng nhiều nhất mà xưởng đó có thể đóng được trong tháng tới là bao nhiêu? b. Giả sử việc đóng thuyền có chi phí cố định hàng tháng là 25 triệu đồng và chi phí bổ sung cho mỗi con thuyền là 15 triệu đồng. Hãy tìm chi phí bình quân hàng tháng của xưởng đó. Bài 56 Trên một chuyến bay có 70 chỗ ngồi. Thực tế cho thấy đến giờ chót vẫn có khách bỏ chuyến bay. Để tận dụng hết chỗ bay bằng cách bán thêm vé dự phòng người ta đã thống kê 20 chuyến bay và thu được các số liệu sau: Số khách bỏ chuyến bay 1 2 3 4 5 6 7 8 9 10 Số chuyến bay tương ứng 1 4 0 4 2 5 1 1 0 2 a. Hãy tính xác suất để trong một chuyến bay nào đó có nhiều hơn 5 hành khách bỏ chuyến bay. b. Tìm số hành khách bỏ chuyến trung bình của mỗi chuyến bay. Bài 57 Thời gian sửa chữa một chiếc máy tính cá nhân (đơn vị: giờ) là biến ngẫu nhiên có hàm mật độ như sau: { 1/2, 0 < x < 2 f (x) = 0, trường hợp còn lại a. Tìm thời gian trung bình để sửa chữa một chiếc máy. √ b. Chi phí sửa chữa phụ thuộc vào thời gian theo công thức 40 + 30 x trong đó x là thời gian sửa chữa chiếc máy. Tìm chi phí kỳ vọng để sửa chữa một chiếc máy tính cá nhân. Bài 58 Một bài thi trắc nghiệm gồm 50 câu hỏi, mỗi câu có 4 đáp án trả lời nhưng chỉ có một đáp án là đúng. Nam không học bài đi thi trả lời một cách ngẫu nhiên. a. Tính xác suất để Nam trả lời đúng một nửa số câu hỏi. b. Một sinh viên thi đỗ nếu trả lời đúng ít nhất một nửa số câu hỏi. Tính xác suất để Nam thi đỗ. c. Số câu trả lời đúng trung bình của Nam là bao nhiêu? Tính xác suất để Nam trả lời đúng số câu bằng số câu trung bình này và nhận xét. Bài 59 Một bài thi trắc nghiệm gồm 12 câu hỏi, mỗi câu hỏi có 5 phương án trả lời, trong đó chỉ có một đáp án đúng. Giả sử mỗi câu trả lời đúng được 4 điểm, mỗi câu trả lời sai bị trừ 1 điểm. Một sinh viên không học bài làm bài bằng cách trả lời ngẫu nhiên từng câu hỏi. P.T.Hồng, N.T.Nhung - Bộ môn Toán 13
  • 14. Bài tập xác suất thống kê và Ứng dụng a. Tính xem số câu trả lời đúng và số câu trả lời sai để sinh viên này được 13 điểm. b. Tính xác suất để sinh viên này được 13 điểm. c. Tính xác suất để sinh viên này bị điểm âm. Bài 60 Cho X là biến ngẫu ngiên nhị thức với EX = 3, V X = 2.1. Tính các xác suất sau: a. P (X = 7) b. P (X ≤ 7) c. P (X > 7) d. P (X ≥ 7) Bài 61 Một người tập ném bóng rổ, đứng từ một chỗ ném bóng vào rổ 6 lần. Xác suất ném trúng mỗi lần là 2/3. Gọi X, Y tương ứng là số lần ném trúng và ném trượt, hãy tính E(X − Y ). Bài 62 Nếu bạn mua 50 vé xổ số và cơ hội trúng thưởng của mỗi vé số là 1/100. a. Tính xác suất để bạn trúng ít nhất một giải, đúng một giải, ít nhất hai giải. b. Tìm số giải mà bạn có khả năng trúng cao nhất. Bài 63 Số lần một người bị cảm lạnh trong một năm tuân theo phân phối Poisson với λ = 3. a. Tính số lần bị cảm trung bình trong một năm của một người. b. Tính xác suất để một người không bị cảm lạnh lần nào trong năm. c. Tính xác suất để một người bị cảm lạnh không quá ba lần trong một năm. Bài 64 Giả sử một người có mặt tại bến xe buýt lúc 10 giờ sáng, cho biết thời điểm xe buýt đỗ tại bến tuân theo phân phối đều giữa 10h và 10h30. a. Tính xác suất người đó phải đợi trên 15 phút. b. Nếu lúc 10h15 xe buýt vẫn chưa tới bến, tính xác suất để người đó phải đợi thêm ít nhất 5 phút nữa. Bài 65 Cho X là biến ngẫu nhiên phân phối chuẩn với tham số µ = 8, σ 2 = 25, tính các xác suất sau: a. P (X > 5). b. P (2 < X < 6). c. P (X < 15). d. P (X > 10). e. Tìm x0 sao cho P (X < x0 ) = 0.4. f. Tìm x0 sao cho P (X > x0 ) = 0.7. P.T.Hồng, N.T.Nhung - Bộ môn Toán 14
  • 15. Bài tập xác suất thống kê và Ứng dụng Bài 66 Giả sử tuổi thọ của một chiếc đèn hình màu trong tivi tuân theo phân phối chuẩn với trung bình 8.2 năm và độ lệch chuẩn 1.4 năm. Chọn ngẫu nhiên một chiếc đèn hình màu. a. Tính xác suất để chiếc đèn hình màu có tuổi thọ trên 10 năm. b. Tính xác suất để một chiếc đèn hình màu có tuổi thọ ít hơn 4 năm. c. Tính xác suất để một chiếc đèn hình màu có tuổi thọ từ 4 đến 10 năm. d. Nếu qui định thời gian bảo hành là 5 năm thì tỉ lệ bảo hành là bao nhiêu? e. Nếu muốn tỉ lệ bảo hành là 5% thì phải qui định thời gian bảo hành là bao nhiêu năm? Bài 67 Chỉ số IQ của người tuân theo phân phối chuẩn với trung bình 100 và độ lệch chuẩn 14.2. Nhóm 10% những người có chỉ số IQ cao nhất có chỉ số IQ nằm trong phạm vi nào? Bài 68 Giả sử lượng mưa hàng năm (mm) của một địa phương tuân theo phân phối chuẩn với trung bình là 1800, độ lệch chuẩn là 100. Tính xác suất để có 2 năm trong 4 năm có lượng mưa không quá 1600 mm. Giả thiết rằng lượng mưa trong các năm khác nhau là độc lập. Bài 69 Giả sử số dặm (nghìn dặm) một chiếc ôtô đi được cho đến khi không sử dụng được nữa tuân theo phân phối mũ với tham số λ = 1/20. a. Tính số dặm trung bình mà một chiếc ô tô đi được. b. Một người mua một chiếc xe mới, tính xác suất để người này đi được ít nhất 20 nghìn dặm. c. Một người mua một chiếc ôtô cũ đã đi được 10 nghìn dặm, tính xác suất để anh ta có thể sử dụng nó để đi tiếp được ít nhất 20 nghìn dặm nữa. Bài 70 Số lần động đất tại một địa phương có phân phối Poisson với tỷ lệ 5 trận mỗi năm a. Xác suất có ít nhất 3 vụ động đất trong nửa năm đầu tiên của năm 2020 là bao nhiêu? b. Giả sử sự kiện trên xảy ra, xác suất không có động đất ở địa phương trong năm 2020 là bao nhiêu? c. Mới có một vụ động đất vào tháng 5 năm 2020. Tính xác suất để ít nhất một năm nữa không có vụ động đất nào. 5 Ước lượng tham số tổng thể Bài 71 Tại một ngân hàng, người ta muốn cải tiến hệ thống phục vụ để làm giảm thời gian chờ của khách hàng đến giao dịch. Hiện tại trung bình khách hàng phải chờ từ 9 đến 10 phút. Họ tiến hành chọn mẫu ngẫu nhiên 100 khách hàng trong vòng 1 tháng sử dụng hệ thống mới. Thời gian chờ của những người trong mẫu được lưu trong file ThoiGianCho.txt (đơn vị: phút). a. Tìm một ước lượng điểm cho thời gian chờ trung bình của tất cả khách hàng khi ngân hàng dùng hệ thống mới. b. Tìm khoảng tin cậy 99% cho thời gian chờ trung bình của khách hàng khi ngân hàng dùng hệ thống mới. P.T.Hồng, N.T.Nhung - Bộ môn Toán 15
  • 16. Bài tập xác suất thống kê và Ứng dụng Bài 72 Sử dụng file ThoiGianCho.txt hãy thực hiện các yêu cầu sau: a. Tìm một ước lượng điểm cho cho tỷ lệ khách hàng phải chờ ít hơn 6 phút. b. Tìm khoảng tin cậy 90% cho tỷ lệ khách hàng phải chờ ít hơn 6 phút. Bài 73 Thành phần PCBs (đơn vị: ppm) (polychlorynated biphenyls-một nhóm những chất hóa học nhân tạo có hại cho môi trường) trong một con cá tại một chiếc hồ được đo bởi một kỹ thuật mà kết quả tuân theo phân phối chuẩn với trung bình chính là mức PCB thực sự của con cá và độ lệch chuẩn là 0.08). Tiến hành đo thành phần này trên một con cá trong 8 lần với kỹ thuật đó được kết quả như sau 11.2 12.4 10.8 11.6 12.5 10.1 12.2 10.6 Tìm khoảng tin cậy cho mức PCB của con cá này với độ tin cậy 95%. Bài 74 Một mẫu ngẫu nhiên gồm 20 điếu thuốc được chọn để xác định thành phần nicotin, kết quả thu được hàm lượng nicotine trung bình của mẫu là 1.2 mg. Tìm khoảng tin cậy 99% cho lượng nicotine trung bình của các điếu thuốc lá cho biết lượng nicotine trong một điếu thuốc tuân theo phân phối chuẩn với độ lệch chuẩn σ = 0.2 mg. Bài 75 Hãy thực hiện yêu cầu của bài tập trên nếu không biết độ lệch chuẩn tổng thể, thay vào đó ta biết phương sai mẫu là 0.04. Bài 76 Một mẫu ngẫu nhiên gồm 100 sản phẩm được chọn từ một dây chuyền sản suất thấy có 16 sản phẩm phải loại. Tìm khoảng tin cậy 95% cho tỷ lệ sản phẩm bị loại của dây chuyền sản xuất đó. Bài 77 Dùng dữ liệu trong file HocSinh.rda trên hãy tìm khoảng tin cậy 99% cho tỷ lệ học sinh trong độ tuổi được nghiên cứu (9-11) có mức độ yêu thích thể thao là 4. 6 Kiểm định tham số một tổng thể Bài 78 Một công ty dược phẩm ở Anh, Glaxo Holdings, mới phát triển một loại thuốc điều trị chứng đau nửa đầu. Theo công ty dược này, thời gian trung bình để chất somatriptan, một thành phần của thuốc, đi vào máu ít hơn 10 phút. Để thuyết phục cơ quan quản lý về nhận định này, Glaxo tiến hành một thử nghiệm trên một nhóm bệnh nhân bị chứng đau nửa đầu được chọn ngẫu nhiên. Để chứng minh khẳng định của mình, họ cần đưa ra giả thuyết không và giả thuyết đối như thế nào? Bài 79 Trong một quy trình sản xuất hoá học, điều rất quan trọng là một dung dịch được dùng cần có PH chính xác là 8.20. Một phương pháp xác định PH cho dung dịch này được biết sẽ cho các số đo phân phối chuẩn với trung bình là PH của dung dịch và độ lệch chuẩn là 0.02. Giả sử 10 mẫu dung dich độc lập đo được PH bằng phương pháp này như sau: 8.18 8.17 8.16 8.15 8.17 8.21 8.22 8.16 8.19 8.18 a. Để thực hiện bài toán trên, ta sử dụng loại phân phối nào? b. Thực hiện kiểm định bằng phương pháp giá trị tới hạn tại mức ý nghĩa 0.05, giá trị kiểm định là bao nhiêu, giá trị tới hạn là bao nhiêu? Kết luận. P.T.Hồng, N.T.Nhung - Bộ môn Toán 16
  • 17. Bài tập xác suất thống kê và Ứng dụng c. Thực hiện kiểm định bằng phương pháp p - giá trị, cho biết p-giá trị của bài toán. Kết luận với mức ý nghĩa α = 5%. Bài 80 Độ bền trung bình của một loại sợi đòi hỏi phải ít nhất bằng 200 psi. Những thí nghiệm trước đây cho thấy rằng độ lệch chuẩn của độ bền là 5 psi. Một mẫu gồm 8 mẩu sợi được chọn và đo được độ bền như sau: 210 198 195 202 197.5 196 199 195.5 Có thể kết luận, tại mức ý nghĩa 0.05 rằng loại sợi nói trên không đảm bảo tiêu chuẩn không? Bài 81 Chiều cao trung bình của nam giới của một nước được cho là 1.78 m với độ lệch chuẩn 7.6 cm. Để kiểm tra chiều cao của nam giới tại một thành phố có ở mức trung bình như trên toàn quốc hay không, một mẫu ngẫu nhiên gồm 20 người là nam giới được chọn ra. Chiều cao của họ được ghi lại trong file ChieuCao.csv. Thứ tự Chiều cao Thứ tự Chiều cao 1 1.83 11 1.79 2 1.73 12 1.93 3 1.76 13 1.84 4 1.85 14 1.88 5 1.81 15 1.82 6 1.83 16 1.77 7 1.80 17 1.92 8 1.88 18 1.79 9 1.68 19 1.94 10 1.79 20 1.96 Cho biết chiều cao nam giới tại thành phố này tuân theo phân phối chuẩn, hãy kết luận ở mức ý nghĩa 0.01. Bài 82 Trọng lượng của cá hồi trưởng thành tại một khu vực ấp trứng tuân theo phân phối chuẩn với độ lệch chuẩn 1.2 pound. Những người nuôi cá cho rằng vụ thu hoạch năm nay, trọng lượng trung bình của cá ít nhất là 7.6 pound. Một mẫu ngẫu nhiên gồm 16 con cá được chọn ra cân được trọng lượng trung bình là 7.2 pound. Tại mức ý ngĩa α = 1%, có đủ bằng chứng để bác bỏ giả thuyết của những người nuôi cá hồi không? Bài 83 Một quảng cáo về một loại thuốc đánh răng mới cho rằng loại thuốc này làm giảm số răng sâu của trẻ em. Số lượng răng bị sâu trong một năm của nhóm tuổi này có phân phối chuẩn với trung bình 3 và độ lệch chuẩn là 1. Một cuộc nghiên cứu trên 2500 trẻ dùng loại thuốc đánh răng này thấy số răng sâu trung bình 2.95/một trẻ. Giả sử rằng độ lệch chuẩn của số răng sâu của trẻ em dùng loại thuốc này vẫn là 1. Tại mức ý nghĩa α = 5%, dữ liệu này có đủ để tin vào lời quảng cáo trên hay không? Bài 84 Một công ty xăng dầu khẳng định rằng tỷ lệ lưu huỳnh trong dầu diesel của họ nhiều nhất là 0.15%. Để kiểm tra điều này, lượng lưu huỳnh trong mẫu gồm 40 mẫu dầu diesel được xác định và tính được trung bình và độ lệch chuần là 0.162 và 0.04. Với mức ý nghĩa α = 1% ta có thể kết luận rằng lời phát biểu của công ty có cơ sở hay không? P.T.Hồng, N.T.Nhung - Bộ môn Toán 17
  • 18. Bài tập xác suất thống kê và Ứng dụng Bài 85 Một công ty sản xuất những tấm nhựa dụng trong công nghiêp mới đưa ra một sản phẩm mới và cho rằng sản phẩm này có thể chịu được sức ép ít nhất là 30 (psi), ở đây khả năng chịu lực đươc tính bằng số pound cần thiết làm vỡ tấm nhựa trên một diện tích 1 inch vuông. Dữ liệu sau đây cho biết khả năng chịu lực của một mẫu gồm 16 tấm nhựa (file dữ liệu Nhua.txt). 30.1 32.7 22.5 27.5 27.7 29.8 28.9 31.4 31.2 24.3 26.4 22.8 29.1 33.4 32.5 21.7 Giả thiết rằng khả năng chịu lực của tấm nhựa phân phối chuẩn. Dựa vào dữ liệu hãy kết luận về khẳng định của công ty với mức ý nghĩa α = 5% bằng cách dùng phương pháp a. giá trị tới hạn. b. p - giá trị. Bài 86 Trọng lượng sản phẩm của một nhà máy tuân theo phân phối chuẩn với trung bình là 20 kg. Nghi ngờ máy hoạt động không bình thường người ta cân thử 100 sản phẩm và thu được kết quả như sau: Trọng lượng 19 20 21 22 23 Số sản phẩm 10 59 20 6 5 Với mức ý nghĩa 1% hãy kết luận về nghi ngờ nói trên. Bài 87 Theo số liệu trước đây, dây chuyền sản xuất tại một nhà máy có tỷ lệ phế phẩm là 7%. Người ta muốn kiểm tra xem tỷ lệ này có thay đổi không nên đã chọn ngẫu nhiên 250 sản phẩm đem kiểm tra thấy có 20 sản phẩm bị loại. Hãy tiến hành bài toán kiểm định tại mức ý nghĩa 1%. Bài 88 Dùng file dữ liệu ThoiGianCho.csv kiểm định xem tỷ lệ khách hàng phải chờ trên 7 phút không vượt quá 25% hay không tại mức ý nghĩa 0.05. 7 Kiểm định tham số hai tổng thể Bài 89 Trong một nghiên cứu về tác dụng của Vitamin C trong điều trị bệnh cảm lạnh, 22 người bị cảm lạnh tình nguyện được chia làm hai nhóm: nhóm 1 gồm 10 người được sử dụng một ngày 4 viên thuốc chứa 1 gram vitamin C. Nhóm 2 gồm 12 người còn lại cũng dùng thuốc bề ngoài tương tự nhưng không có vitamin C và vô hại. Thời gian bị cảm (đơn vị: ngày) của những người này được ghi lại như sau (VitaminC.xls) P.T.Hồng, N.T.Nhung - Bộ môn Toán 18
  • 19. Bài tập xác suất thống kê và Ứng dụng Điều trị có Viatmin C Điều trị không có viatmin C 5.5 6.5 6.0 6.0 7.0 8.5 6.0 7.0 7.5 6.5 6.0 8.0 7.5 7.5 5.5 6.5 7.0 7.5 6.5 6.0 8.5 7.0 Việc sử dụng 4 gram vitamin C mỗi ngày có làm giảm thời gian bị cảm lạnh hay không? Kiểm định ở mức ý nghĩa 5%. Bài 90 Một kỹ sư xây dựng muốn so sánh sức chịu nén của hai loại bê tông. Anh ta chọn ra một mẫu gồm 10 tấm bê tông loại thứ nhất, dữ liệu về sức chịu nén (đơn vị: psi) của những tấm bê tông này như sau: 3250 3268 4302 3184 3266 3297 3332 3502 3064 3116 Một mẫu ngẫu nhiên khác gồm 10 tấm bê tông loại thứ hai được chọn và có sức chịu nén như sau 3094 3106 3004 3066 2984 3124 3316 3212 3380 3018 Giả sử hai tổng thể phân phối chuẩn có phương sai bằng nhau. Hãy kiểm định ở mức ý nghĩa 5% xem khả năng chịu lực của hai loại bê tông có khác nhau hay không? Bài 91 Dữ liệu về trọng lượng của những bé sơ sinh trong hai mẫu ngẫu nhiên chọn ra từ các bé sơ sinh tại hai thành phố A và B cho những kết quả sau n1 = 55 n2 = 48 x1 = 3.1 x2 = 3.3 s2 = 1.07 1 s2 = 1.01 2 Kiểm định giả thuyết không: trọng lượng của trẻ sơ sinh ở hai thành phố như nhau ở mức ý nghĩa 5%. Bài 92 Để nghiên cứu ảnh hưởng của một loại thuốc ngủ, người ta cho 12 bệnh nhân uống thuốc thật và một lần khác uống thuốc giả, số giờ ngủ của bệnh nhân được ghi lại như sau (file Thuoc.rda) Bệnh nhân 1 2 3 4 5 6 7 8 9 10 11 12 Số giờ ngủ (thuốc thật) 6.1 7.0 8.2 7.6 6.5 8.4 6.9 6.7 7.4 5.8 6.0 7.1 Số giờ ngủ (thuốc giả) 5.2 7.9 3.9 4.7 5.3 5.4 4.2 6.1 3.8 6.3 4.1 5.3 Với mức ý nghĩa 5% có kết luận gì về ảnh hưởng của loại thuốc ngủ trên? Cho biết thời gian ngủ của các bệnh nhân tuân theo quy luật chuẩn. Bài 93 Để so sánh số hành khách đi xe bus trong giờ cao điểm buổi sáng và buổi chiều ở một thành phố, trong một ngày người ta chọn ngẫu nhiên 9 chiếc xe với lộ trình khác nhau và thu thập số liệu về số hành khách đi xe lúc 7h45 và 16h45 P.T.Hồng, N.T.Nhung - Bộ môn Toán 19
  • 20. Bài tập xác suất thống kê và Ứng dụng Xe 1 2 3 4 5 6 7 8 9 Sáng 43 51 37 24 47 44 50 55 46 Chiều 41 49 44 32 46 42 47 51 49 Có sự khác biệt về số hành khách trên các chuyến xe giữa buổi sáng và chiều không? Kiểm định ở mức ý nghĩa 5% cho biết số hành khách đi xe phân phối chuẩn (làm bằng 2 cách). Bài 94 Trong một cuộc điều tra người ta thấy 59% trong số 375 nam giới và 70% trong số 481 phụ nữ nói rằng trọng lượng là một yếu tố quan trọng khi mua một chiếc máy tính xách tay. Điều đó có cho thấy tỷ lệ phụ nữ có ý kiến nói trên cao hơn nam giới hay không. Dùng mức ý nghĩa 0.05. Bài 95 Dùng dữ liệu trong file HocSinh.rda để kiểm định xem có phải tỷ lệ học sinh rất thích thể thao (mức 4) trong nhóm học sinh nam cao hơn so với tỷ lệ này trong nhóm học sinh nữ hay không? Dùng mức ý nghĩa α = 1%. Bài 96 Từ dây chuyền thứ nhất kiểm tra 110 chi tiết người ta loại đi 30 chi tiết, từ dây chuyền thứ hai kiểm tra 150 chi tiết người ta loại đi 40 chi tiết. Ở mức ý nghĩa 5% có thể cho rằng chất lượng sản phẩm của hai dây chuyền là như nhau không? Bài 97 Người ta sử dụng hai phương pháp đo hàm lượng PCBs (polychlorynated biphenyls-một nhóm những chất hóa học nhân tạo có hại cho môi trường) trên cá trong một chiếc hồ. Giả sử kết quả đo của hai phương pháp tuân theo quy luật chuẩn. Hãy kiểm định giả thuyết phương sai của kết quả đo bởi hai phương pháp bằng nhau dựa trên kết quả đo 8 lần tiến hành trên một con cá sau đây Phương pháp 1 6.2 5.8 5.7 6.3 5.9 6.1 6.2 5.7 Phương pháp 2 6.3 5.7 5.9 6.4 5.8 6.2 6.3 5.5 Bài 98 Điều tra về sự biến động của giá xăng tại hai thành phố, chọn ngẫu nhiên từ mỗi thành phố 10 trạm bán xăng và ghi lại giá một gallon xăng bán tại những trạm này trong một ngày. Kết quả như sau Thành phố 1 1.18 1.07 1.13 1.15 1.14 1.13 1.14 1.13 1.03 1.09 Thành phố 2 1.08 1.05 1.19 1.17 1.21 1.12 1.14 1.14 1.13 1.11 Giả thiết giá xăng tuân theo phân phối chuẩn kiểm định về sự khác nhau về phương sai của giá xăng giữa hai thành phố với mức ý nghĩa α = 0.01. Bài 99 Trong file ChiSoIQ CLBToanHoc.csv cho ta thông tin về một số thành viên được chọn ngẫu nhiên từ một vài câu lạc bộ Toán học trong cả nước. Cho biết chỉ số IQ tuân theo phân phối chuẩn, tại mức ý nghĩa α = 5%, hãy kiểm định xem mức độ đồng đều về chỉ số IQ của nam thành viên và nữ thành viên tham gia các câu lạc bộ Toán học trong cả nước có như nhau hay không? 8 Phân tích phương sai Bài 100 Một công ty sản xuất sữa có 4 máy đổ sữa vào các bình. Để kiểm định xem lượng sữa các máy đổ vào bình có như nhau không, người ta chọn ngẫu nhiên 19 bình sữa sau khi được đổ sữa từ 4 máy nói trên. Lượng sữa trong những bình này đo được như sau: P.T.Hồng, N.T.Nhung - Bộ môn Toán 20
  • 21. Bài tập xác suất thống kê và Ứng dụng Máy 1 Máy 2 Máy 3 Máy 4 4.05 3.99 3.97 4.00 4.01 4.02 3.98 4.02 4.02 4.01 3.97 3.99 4.04 3.99 3.95 4.01 4.00 4.00 4.00 4.00 (Dữ liệu có trong file TrongLuongSua.xls) a. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có như nhau không, nếu giả thiết trọng lượng sữa của các bình đổ từ mỗi máy đều tuân theo phân phối chuẩn và có phương sai bằng nhau. Trong trường hợp bác bỏ H0, hãy thực hiện bài toán phân tích sâu để có những thông tin tốt hơn về sự khác nhau giữa trọng lượng sữa từ những máy trên. b. Ở mức ý nghĩa α = 5% hãy kiểm tra xem trọng lượng sữa trong mỗi bình đổ từ 4 máy trên có như nhau không, nếu không có những thông tin về tổng thể trọng lượng sữa của các bình đổ từ mỗi máy. Bài 101 Để kiểm tra ảnh hưởng của ba loại chất phụ gia (A, B, C) và ba loại xăng X1, X2, X3 đến quãng đường đi được của ô tô, người ta chọn ra 9 xe mô tô giống nhau, mỗi xe sử dụng 20 lít một loại xăng có pha thêm một chất phụ gia nhất định. Số dặm đi được của các xe được ghi lại như sau: Chất phụ gia Loại xăng A B C X1 124.1 131.5 127 X2 126.4 130.6 128.4 X3 127.2 132.7 125.6 (Dữ liệu có trong file QuangDuong MotQuanSat.xls) a. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăng không ảnh hưởng đến quãng đường đi được. b. Dùng phương pháp phân tích phương sai, ở mức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởng của các chất phụ gia là như nhau đến quãng đường đi được. Bài 102 Trong bài tập trên, ứng với mỗi loại xăng và chất phụ gia người ta thử nghiệm trên 2 chiếc xe. Quãng đường đi được của những chiếc xe này như sau: Chất phụ gia Loại xăng A B C 126.2 130.4 127 X1 124.8 131.6 126.6 127.2 142.1 129.5 X2 126.6 132.6 142.6 127.2 132.4 125.2 X3 124.9 133.0 120.9 (Dữ liệu có trong file QuangDuong NhieuQuanSat.xls) P.T.Hồng, N.T.Nhung - Bộ môn Toán 21
  • 22. Bài tập xác suất thống kê và Ứng dụng a. Ở mức ý nghĩa α = 5% hãy kiểm định xem có sự tương tác giữa hai yếu tố loại xăng và chất phụ gia không? a. Ở mức ý nghĩa α = 5% hãy kiểm định rằng loại xăng không ảnh hưởng đến quãng đường đi được. b. Ở mức ý nghĩa α = 5% hãy kiểm định rằng ảnh hưởng của các chất phụ gia là như nhau đến quãng đường đi được. Bài 103 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bán tại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứng tại các khu vực trên và hỏi giá khách hàng đã mua xe. Biết rằng giá xe ở mỗi nơi bán tuân theo phân phối chuẩn và có phương sai bằng nhau, thực hiện bài toán phân tích phương sai mô hình một nhân tố ta thu được kết quả sau: Df Sum Sq Mean Sq F value KhuVuc 2 15.53 7.76 0.38 Residuals 13 266.71 20.52 a. Hoàn thành bảng phân tích phương sai sau: Nguồn Tổng Bậc tự do Phương sai Tỉ số biến thiên bình phương (df) (MS) F SSG M SG Giữa các nhóm SSG = k−1= M SG = = F = = k−1 M SW SSW Nội bộ các nhóm SSW = n−k = M SW = = n−k Toàn bộ SST = n−1= b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thành phố và nông thôn có khác nhau không? Bài 104 Một kĩ sư nông nghiệp đã tiến hành một cuộc thực nghiệm để thẩm định sự khác biệt về sản lượng của 4 giống lúa (A, B, C và D) khi dùng 3 loại phân bón khác nhau (Loại 1, Loại 2 và Loại 3). Kĩ sư này đã ghi lại số tạ thóc trồng trên một hecta của từng giống lúa tương ứng với từng loại phân bón. Để xem xét sự khác biệt, kĩ sư thực hiện bài toán phân tích phương sai mô hình hai nhân tố, một quan sát trong một ô và thu được bảng kết quả sau: Df Sum Sq Mean Sq F value PhanBon 2 231.17 115.58 11.04 GiongLua 3 22.92 7.64 0.73 Residuals 6 62.83 10.47 a. Hãy hoàn thành bảng phân tích phương sai sau: Nguồn Tổng Bậc tự do Phương sai Tỉ số biến thiên bình phương (df) (MS) F Giữa các nhóm SSG = K −1= M SG = F1 = Giữa các khối SSB = H −1= M SB = F2 = Phần dư SSE = (K − 1)(H − 1) = M SE = Tổng cộng SST = n−1= P.T.Hồng, N.T.Nhung - Bộ môn Toán 22
  • 23. Bài tập xác suất thống kê và Ứng dụng b. Tại mức ý nghĩa α = 5%, hãy kiểm định xem giống lúa có ảnh hưởng đến sản lượng lúa hay không? c. Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại phân bón có ảnh hưởng đến sản lượng lúa hay không? Bài 105 Trong file TienVayKinhDoanh.txt cho ta số liệu về tiền vay kinh doanh (Tien) và loại hình sở hữu (CongTy) của một số công ty được chọn ngẫu nhiên trong cả nước. Tại mức ý nghĩa α = 5%, hãy xét xem số tiền vay trung bình của các công ty thuộc ba loại hình sở hữu liên doanh, nhà nước và tư nhân có như nhau không, giả sử rằng số tiền vay của từng loại công ty tuân theo phân phối chuẩn có phương sai bằng nhau. 9 Kiểm định phi tham số Bài 106 Một tổ chức sức khỏe công cộng cho rằng lượng nước dùng trung bình của mỗi một hộ gia đình trong ngày là 350 gallons. Để kiểm định lại khẳng định này, một nghiên cứu đã được tiến hành bằng cách chọn ngẫu nhiên ra 20 gia đình và ghi lại lượng nước trung bình họ dùng hàng ngày như sau: 340 344 362 375 356 386 354 364 332 402 340 355 362 322 372 324 318 360 338 370 (Dữ liệu có trong file LuongNuocTrongNgay.xls) Tại mức ý nghĩa α = 5%, hãy kiểm định xem khẳng định của tổ chức sức khỏe công cộng trên là có cơ sở không? Bài 107 Nhà sản xuất một loại lốp xe mới khẳng định rằng tuổi thọ trung bình của những chiếc lốp này ít nhất là 40000 dặm. Để kiểm định lại khẳng định này một mẫu ngẫu nhiên gồm 12 chiếc lốp được đem ra thử nghiệm và tuổi thọ của chúng (đơn vị 1000 dặm) được ghi lại như sau: Lốp 1 2 3 4 5 6 7 8 9 10 11 12 Tuổi thọ 36.1 40.2 33.8 38.5 42 35.8 37 41 36.8 37.2 33 36 (Dữ liệu có trong file TuoiThoLopXe.xls) Tại mức ý nghĩa α = 5%, hãy kiểm định xem lời khẳng định của nhà sản xuất có cơ sở không? Bài 108 Để xét xem giá (đơn vị 100$) của một loại xe máy mới sản xuất có khác nhau khi được bán tại thị xã, thành phố và nông thôn hay không, người ta chọn ngẫu nhiên một số cửa hàng tương ứng tại các khu vực trên và hỏi giá khách hàng đã mua xe. Bảng số liệu sau cho ta giá của cùng một kiểu xe của ba khu vực đang điều tra: Thị xã Thành phố Nông thôn 158.0 163.0 160.0 165.0 159.0 166.0 157.5 159.0 168.0 162.0 166.5 160.5 156.0 158.0 152.5 165.5 P.T.Hồng, N.T.Nhung - Bộ môn Toán 23
  • 24. Bài tập xác suất thống kê và Ứng dụng (Dữ liệu có trong file GiaXeMay.xls) a. Để giá của loại xe mới này có khác nhau tại các khu vực thị xã, thành phố và nông thôn hay không, bạn sẽ dùng kiểm định tham số hay phi tham số. b. Ở mức ý nghĩa α = 5%, hãy xét xem giá trung bình của loại xe trên tại ba khu vực thị xã, thành phố và nông thôn có khác nhau hay không? Bài 109 Người ta thử nghiệm một loại thuốc làm giảm hàm lượng albumin trong máu. Một mẫu gồm 12 bệnh nhân có hàm lượng albumin cao trong máu được điều trị bởi loại thuốc thuốc này. Bảng sau cho ta hàm lượng albumin trong máu của những bệnh nhân này trước và sau khi điều trị: Hàm lượng albumin (g/100ml) Bệnh nhân Trước khi điều trị Sau khi điều trị 1 5.02 4.66 2 5.08 5.15 3 4.75 4.30 4 5.25 5.07 5 4.80 5.38 6 5.77 5.10 7 4.85 4.80 8 5.09 4.91 9 6.05 5.22 10 4.77 4.50 11 4.85 4.85 12 5.24 4.56 (Dữ liệu có trong file HamLuongAlbumin.xls) Tại mức ý nghĩa α = 5%, hãy kiểm định xem loại thuốc này có công hiệu không? Bài 110 Hai mác xe A và B được chọn một cách ngẫu nhiên để thử nghiệm độ bền của động cơ (tính bằng số ngàn km sử dụng cho đến khi hỏng). Với số liệu đã cho sau đây, tại mức ý nghĩa α = 5% có thể khẳng định mác xe A tốt hơn mác xe B không? Mác xe A Mác xe B 61 26 30 32 49 40 48 35 41 41 45 43 57 30 36 41 (Dữ liệu có trong file DoBenDongCo.xls) Bài 111 Để kiểm định tốc độ xử lí của hai phần mềm mới và hiện dùng, người ta tiến hành điều tra và thu được thời gian xử lí của hai phần mềm đối với 10 lệnh như sau: P.T.Hồng, N.T.Nhung - Bộ môn Toán 24
  • 25. Bài tập xác suất thống kê và Ứng dụng Lệnh 1 2 3 4 5 6 7 8 9 10 Phần mềm đang dùng 9.98 9.98 9.84 9.99 9.94 9.84 9.86 10.12 9.9 9.91 Phần mềm mới 9.88 9.86 9.75 9.8 9.87 9.84 9.87 9.86 9.83 9.86 (Dữ liệu có trong file TocDoXuLi.csv) Hãy kiểm chứng ở mức ý nghĩa 5% về sự khác biệt giữa tốc độ xử lí của hai phần mềm này. Bài 112 Để đánh giá điều kiện kinh doanh theo một số nhân tố, người ta dùng một thang điểm để đo "mức độ lạc quan trong kinh doanh" (điểm càng cao thì mức độ lạc quan càng nhiều). Năm 2001, nhóm điều tra tiếp xúc với 10 người làm việc ở nhiều ngành khác nhau và đề nghị họ đưa ra điểm nhận định về điều kiện kinh doanh trong lĩnh vực của mình. Năm 2002, nhóm điều tra tiếp xúc với 10 người trên và cũng đề nghị họ đưa ra nhận định như năm 2001. Bảng sau cho ta điểm của 10 người được phỏng vấn năm 2001 và 2002: Năm 2001 63.1 67.1 65.5 68.0 66.6 65.7 69.2 67.0 65.2 60.7 Năm 2002 57.4 66.4 61.8 65.3 63.5 66.4 64.9 65.2 65.1 62.2 (Dữ liệu có trong file DiemLacQuan.xls) Tại mức ý nghĩa α = 5%, trong mỗi trường hợp đưa ra dưới đây có thể khẳng định các nhà kinh doanh năm 2002 kém lạc quan hơn các nhà kinh doanh năm 2001 không? a. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên tuân theo phân phối chuẩn. b. Giả sử rằng điểm của tổng thể các nhà kinh doanh trong mỗi năm trên không tuân theo phân phối chuẩn. Bài 113 Bốn qui trình hóa học chuẩn được sử dụng để xác định hàm lượng magiê trong một hợp chất hóa học. Mỗi qui trình được sử dụng năm lần trên cùng một hợp chất và thu được bảng dữ liệu sau: Qui trình 1 2 3 4 76.42 80.41 74.20 86.20 78.62 82.26 72.68 86.04 80.40 81.15 78.84 84.36 78.20 79.20 80.32 80.68 79.30 82.30 77.40 85.50 (Dữ liệu có trong file HamLuongMaGie.xls) Bằng cách thực hiện lần lượt các yêu cầu sau, hãy kiểm định xem có sự khác biệt về hàm lượng magiê đo được theo các qui trình khác nhau không? a. Hãy xét xem bạn nên sử dụng phương pháp tham số hay phi tham số. b. Nêu cặp giả thuyết H0 và H1 thích hợp. c. Dựa trên p− giá trị nêu kết luận tại mức ý nghĩa α = 5%. P.T.Hồng, N.T.Nhung - Bộ môn Toán 25
  • 26. Bài tập xác suất thống kê và Ứng dụng 10 Kiểm định khi- bình phương Bài 114 Một mẫu ngẫu nhiên gồm 100 phụ nữ ở thành phố Hồ Chí Minh được chọn ra để hỏi mức độ ưa thích về 5 loại xà phòng A, B, C, D và E thì thu được kết quả như sau: Loại xà phòng A B C D E Tổng Số phụ nữ chọn 18 16 23 20 23 100 Hãy kiểm tra xem 5 loại xà phòng này có được ưa thích như nhau đối với phụ nữ ở thành phố HCM ở mức ý nghĩa 5% không. Bài 115 Theo hồ sơ lưu trữ thì nếu qui trình sản xuất là bình thường thì có 93% số sản phẩm không bị sai sót, 5% có một sai sót và 2% có hơn một sai sót. Một mẫu ngẫu nhiên gồm 500 sản phẩm được chọn ra từ đợt sản xuất tuần qua thì thấy 458 sản phẩm không sai sót , 30 có một sai sót và 12 có hơn một sai sót. Hãy kiểm chứng ở mức ý nghĩa 5% xem chất lượng sản phẩm tuần qua có bình thường không. Bài 116 Theo số liệu các năm trước, giải thưởng trúng được khi mua một loại xà phòng trong dịp tết Nguyên đán phân về ba miền Bắc, Trung, Nam theo tỉ lệ 3 : 2 : 2. Phỏng vấn 400 người trúng giải nhân lễ trao giải thưởng năm nay, thấy có 180 người miền Bắc, 100 người miền Trung và 120 người miền Nam. Tại mức ý nghĩa α = 5% có thể kết luận tỉ lệ giải thưởng năm nay còn như mọi năm không? Bài 117 Một nhân viên khách hàng mỗi ngày viếng thăm 5 khách hàng. Giả thiết cho rằng số lần bán được hàng tuân theo phân phối nhị thức với p = 0.4. Kết quả trong nhiều ngày như sau: Số lần bán trong ngày 0 1 2 3 4 5 Số ngày 10 41 60 20 6 3 Ở mức ý nghĩa 5% ta có thể kết luận rằng phân phối số lần bán ra thực sự tuân theo phân phối đã giả thiết trên không? Bài 118 Người ta muốn kiểm tra xem số người đến chi cục thuế ở một huyện có tuân theo phân phối Poisson không. Thống kê số người đến trong một giờ trong một số ngày tại chi cục thuế này ta thu được bảng số liệu sau: Số người 0 1 2 3 4 5 trên 5 Số giờ 8 12 20 25 15 15 5 Tại mức ý nghĩa α = 5%, hãy xét xem số người đến chi cục thuế trong một giờ có tuân theo phân phối Poisson với λ = 3 không? Bài 119 Một trong những cách để quyết định ai là tác giả là so sánh tần số xuất hiện của một từ nào đó. Nghiên cứu số lần xuất hiện của từ "có thể" trong một đoạn văn dài xấp xỉ 200 từ người ta ghi lại được như sau: Số lần xuất hiện 0 1 2 ≥3 Tổng Số đoạn văn 156 63 29 14 262 P.T.Hồng, N.T.Nhung - Bộ môn Toán 26
  • 27. Bài tập xác suất thống kê và Ứng dụng Tại mức ý nghĩa α = 5% hãy xét xem phân phối tần số xuất hiện của từ "có thể" có tuân theo phân phối Poisson với λ = 0.6 không? Bài 120 Các phương tiện giải trí ở TPHCM sẽ được đánh giá là tốt, vừa hay xấu. Một mẫu ngẫu nhiên gồm nhiều người có mức thu nhập trên trung bình, trung bình và dưới trung bình được chọn ra để hỏi ý kiến. Kết quả xếp lớp chéo như sau: Ý kiến Mức thu nhập Tốt Vừa Xấu Trên trung bình 175 124 92 Trung bình 118 110 126 Dưới trung bình 127 82 147 Hãy kiểm chứng ở mức ý nghĩa 5% hãy kiểm định xem có mối liên hệ giữa mức thu nhập với thái độ đối với phương tiện giải trí không? Bài 121 Người ta nghiên cứu xem có mối liên hệ giữa thời gian tìm hiểu trước hôn nhân và tình trạng hiện tại của cuộc hôn nhân hay không. Bảng sau cho ta số liệu điều tra về 200 cặp vợ chồng có thời gian kết hôn trên 5 năm, với thời gian tìm hiểu trước hôn nhân được chia làm ba mức là ngắn, trung bình và dài và tình trạng hôn nhân được chia làm ba mức là hạnh phúc, không hạnh phúc và ly dị/ly thân: Thời gian tìm hiểu Tình trạng hôn nhân Ngắn Trung bình Dài Hạnh phúc 38 58 54 Không hạnh phúc 12 14 4 Ly dị/Ly thân 10 8 2 Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian tìm hiểu trước hôn nhân có liên hệ với tình trạng hôn nhân không? Bài 122 Để tìm hiểu xem thời gian nằm bệnh viện của bệnh nhân có phụ thuộc vào các loại bảo hiểm (phần trăm chi phí được bảo hiểm chi trả) không, người ta thu thập một mẫu gồm 660 thời gian nằm viện và được xếp chéo với loại bảo hiểm như sau: Số ngày nằm viện Loại bảo hiểm < 5 5 − 10 > 10 < 25% 40 75 65 25% − 50% 30 45 75 > 50% 40 100 190 Tại mức ý nghĩa α = 5%, hãy kiểm định xem thời gian nằm viện và loại bảo hiểm có phụ thuộc vào nhau không? 11 Hồi qui tuyến tính Bài 123 Để ước lượng giá bán của những chiếc ô tô cũ, người ta xây dựng mô hình hồi qui tuyến tính của giá xe theo số km mà ô tô đã đi được. Bảng sau cho ta giá bán (đơn vị: 1000 euro) và số km (đơn vị 1000 km) của 15 chiếc BMW cũ tại thời điểm 08/11/2009: P.T.Hồng, N.T.Nhung - Bộ môn Toán 27
  • 28. Bài tập xác suất thống kê và Ứng dụng Giá Số km Giá Số km Giá Số km 31.0 24.0 21.0 52.0 11.0 150.0 12.5 115.0 18.5 75.0 13.0 156.0 15.5 80.0 8.6 126.0 11.0 124.0 6.7 195.0 9.0 138.0 9.0 180.0 30.0 53.0 18.0 70.0 8.0 143.0 (Dữ liệu có trong file GiaVaQuangDuong.xls) a. Vẽ biểu đồ tán xạ giữa giá bán và số km đi được. Biểu đồ cho ta nhận xét gì? b. Tính hệ số tương quan tuyến tính mẫu giữa giá bán và số km đi được. Hệ số tương quan tuyến tính mẫu cho ta thông tin gì? c. Giả sử phân phối xác suất đồng thời của giá bán và số km tuân theo phân phối chuẩn, tại mức ý nghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số km đi được hay không. b. Tính hệ số tương quan thứ hạng spearman giữa giá bán và số km đi được. Hệ số tương quan thứ hạng cho ta thông tin gì? c. Giả sử phân phối xác suất đồng thời của giá bán và số km không tuân theo phân phối chuẩn, tại mức ý nghĩa α = 5% hãy kiểm định xem có mối quan hệ tuyến tính âm giữa giá bán và số km đi được hay không. Bài 124 Để xét xem lượng nước tiêu thụ trong một thành phố có thể được dự đoán theo nhiệt độ hay không, người ta thu thập một mẫu gồm lượng nước tiêu thụ trong một ngày và nhiệt độ cao nhất tương ứng trong ngày đó ta được bảng dữ liệu sau: Lượng nước dùng (triệu gallons) Nhiệt độ (độ F) 219 103 56 39 107 77 129 78 68 50 184 96 150 90 112 75 (Dữ liệu có trong file LuongNuocVaNhietDo.xls) Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn. a. Tính hệ số tương quan tuyến tính giữa lượng nước và nhiệt độ cao nhất trong ngày và cho nhận xét. b. Viết phương trình hồi qui tuyến tính tổng thể của lượng nước tiêu thụ (Y) trong ngày theo nhiệt độ cao nhất (X). Nêu ý nghĩa các hệ số trong phương trình hồi qui. c. Tìm phương trình hồi qui tuyến tính mẫu của lượng nước tiêu thụ trong ngày theo nhiệt độ cao nhất của ngày đó. Hệ số độ dốc trong phương trình hồi qui cho ta thông tin gì? P.T.Hồng, N.T.Nhung - Bộ môn Toán 28
  • 29. Bài tập xác suất thống kê và Ứng dụng d. Tính hệ số xác định và cho nhận xét. e. Biểu diễn các cặp điểm (x, y) và đường hồi qui mẫu trên cùng một hệ trục tọa độ. Những minh họa hình học này phù hợp với những tính toán ở hai câu (a), (c), (d) như thế nào? f. Tại mức ý nghĩa α = 5%, hãy xét xem nhiệt độ cao nhất trong ngày có là một yếu tố có ý nghĩa cho lượng nước tiêu thụ trong ngày không? g. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui tổng thể và cho nhận xét. h. Tìm một ước lượng điểm cho lượng nước trung bình trong ngày khi nhiệt độ cao nhất trong ngày là X0 . i. Tìm khoảng tin cậy 90% cho giá trị trung bình của lượng nước tiêu thụ trong ngày E(Y |X0 ) khi nhiệt độ trong ngày đó là X0 = 85. Theo bạn độ rộng của khoảng tin cậy này sẽ nhỏ nhất tại giá trị X0 bằng bao nhiêu? j. Tìm khoảng tin cậy 99% cho giá trị thật của lượng nước tiêu thụ trong ngày Y0 , Y0′ khi nhiệt độ cao ′ nhất trong ngày là X0 = 90, X0 = 100. So sánh độ rộng của hai khoảng tin cậy này đưa ra lời giải thích. Bài 125 Để minh họa luật Galton về giả thuyết chiều cao của con trai đầu qui về chiều cao trung bình của dân chúng, nhà thống kê học người Anh Karl Pearson đã chọn ngẫu nhiên và đo chiều cao (đơn vị inches) của 10 cặp cha và con trai đầu thu được bảng dữ liệu như sau: Chiều cao cha 60 62 64 65 66 67 68 70 72 74 Chiều cao con trai 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70 (Dữ liệu có trong file ChieuCaoChaVaCon.csv) Giả sử các giả thiết trong mô hình hồi qui tuyến tính đơn biến được thỏa mãn. a. Tính hệ số tương quan tuyến tính mẫu giữa chiều cao của con trai và chiều cao của cha. Hệ số tương quan này cho ta những thông tin gì? b. Tìm phương trình hồi qui tuyến tính mẫu mô tả mối liên hệ giữa chiều cao của con trai đầu theo chiều cao của cha. Giải thích ý nghĩa của các hệ số trong phương trình. c. Tính hệ số xác định và cho nhận xét. d. Vẽ biểu đồ tán xạ và đường hồi qui tuyến tính mẫu mô tả chiều cao của con trai đầu theo chiều cao của cha trên cùng một biểu đồ và cho nhận xét. e. Tìm khoảng tin cậy 95% cho hệ số độ dốc của phương trình hồi qui. Khoảng tin cậy này cho ta nhận xét gì? f. Nếu một người có chiều cao là 70 thì con trai anh ta sẽ cao khoảng bao nhiêu? g. Tìm khoảng tin cậy 98% cho chiều cao trung bình của những người con trai khi chiều cao của cha là 68. P.T.Hồng, N.T.Nhung - Bộ môn Toán 29
  • 30. Bài tập xác suất thống kê và Ứng dụng Bài 126 Bộ Nông nghiệp hàng năm công bố dữ liệu về sản lượng của nhiều loại nông sản khác nhau. Bảng dữ liệu dưới đây cho ta những sản lượng (triệu tấn) của ba loại nông sản là ngô, đậu tương và lúa mì trong 7 năm: Ngô Đậu tương Lúa mì 4152 1127 1352 6639 1798 2381 4175 1639 2420 7672 1861 2595 8876 2099 2424 8226 1940 2091 7131 1938 2108 (Dữ liệu có trong file SanLuong.xls) Giả sử các giả thiết trong mô hình hồi qui tuyến tính đa biến được thỏa mãn. a. Lập phương trình hồi qui tuyến tính mẫu của sản lượng ngô theo sản lượng đậu tương và lúa mì. Giải thích ý nghĩa của các hệ số trong mô hình. b. Tính hệ số xác định bội, hệ số xác định hiệu chỉnh và cho nhận xét. c. Bằng cách kiểm định các hệ số của phương trình hồi qui tổng thể bằng không một cách thích hợp, hãy xét xem sản lượng ngô có được giải thích một cách có ý nghĩa qua sản lượng đậu tương và lúa mì hay không? d. Tìm khoảng tin cậy 90% cho sản lượng ngô và sản lượng ngô trung bình khi sản lượng đậu tương là 1535 và sản lượng lúa mì là 2205. So sánh độ rộng của hai khoảng tin cậy này. P.T.Hồng, N.T.Nhung - Bộ môn Toán 30