Báo cáo bài tập lớn xác suất thống kê - Pdf 22


1

ðẠI HỌC QUỐC GIA THÀNH PHỒ HỒ CHÍ MINH
TRƯỜNG ðẠI HỌC BÁCH KHOA
*****¥*¥*****
BÁO CÁO: BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ
TP.HỒ CHÍ MINH , THÁNG 11 NĂM 2010
GVHD: PGS.TS NGUYỄN ðÌNH HUY

B C D A
C D A B
D A B C
A B C D

Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Yếu tố B
Yếu tố
A
B1 B2 B3 B4
A1 C1 Y
111
C2 Y
122
C3 Y
133
C4 Y
144
T
1

A2 C2 Y
212
C3 Y
223
C4 Y
234
C1 Y
241
T

T
.3.
T
.4.
3Bảng ANOVA:
Nguồn sai số Bậc tự do
Tổng số bình
phương
Bình phương trung
bình
Giá trị thống kê
Yếu tố A
(Hàng)
(r-1)
SSR=

=

r
i
i
r
T
r

r
T
1
2
2

2MSC=
)1( −r
SSC

F
C
=
MSE
MSC

Yếu tố C (r-1)
SSF=

=

r
k
k
r
T
r


2
r
T
Y
ijk
−ΣΣΣ
Trắc nghiệm

Giả thiết:
H
0
: µ
1
= µ
2
= = µ
k
↔ Các giá trị trung bình bằng nhau
H
1
: µ
i


µ
j


 Nhập dữ liệu vào bảng tính
4

 Thiết lập các biểu thức và tính các giá trị thống kê
1. Tính các giá trị Ti , T.j., T k và T
• Các giá trị Ti
Chọn ô B7 và chọn biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B4:E4)
• Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo ký hiệu tự điền từ ô B8 đến ô E8
• Các giá trị T k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
• Giá trị T…
Chọn ô B10 và nhập biểu thức=SUM(B2:E5)
2. Tính các giá trị G
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
3. Tính các giá trị SSR, SSC, SSF, SST và SSE

F
C
=11.95 > F
0.05
(3,6)=4.76 => bác bỏ H
0
(nhiệt độ)
F=30.05 > F
0.05
(3,6)=4.76 => bác bỏ H
0
(chất xúc tác)
Vậy chỉ có nhiệt ñộ và chất xúc tác gây ảnh hưởng ñến hiệu suất phản ứng.

B. Ví dụ 4.2/170 SGK
Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135
°
C kết hợp với ba khoảng thời gian là 15,
30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình
bày trong bảng sau:
Thời gian (phút) Nhiệt độ (°C) Hiệu suất (%)
X
1
X
2
Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05

X
1
+ + B
k
X
k
Bảng ANOVA
Nguồn sai số Bậc tự do Tổng số bình phương
Bình phương trung
bình
Giá trị thống

Hồi quy K SSR
MSR=
k
SSR
F=
MSE
MSR

Sai số N-k-1 SSE
MSE =
)1( −− kN
SSETổng cộng N-1 SST = SSR + SSE
Giá trị thống kê
Giá trị R-bình phương:
kFkN

Trắc nghiệm t:
H
0
: β
i
= 0 ↔ Các hệ số hồi quy không có ý nghĩa.
H
1
: β
i


0

↔ Có ít nhất vài hệ số hồi quy có ý nghĩa.
F <
2
α
t
(r-1)(r-2) → Chấp nhận H
0

Trắc nghiệm F
H
0
: β
i
= 0 ↔ Phương trình hồi quy không thích hợp.

7

− Phạm vi của biến số X (input X range)
− Nhãn dữ liệu (Labels)
− Mức tin cậy (Confidence level)
− Tọa độ đầu ra (Output range)
− Đường hồi quy (Line Fit Plots),…
9

Các giá trị đầu ra cho bảng sau:
Phương trình hồi quy:
Ŷx
1
=f(X
1
)
Ŷx
1
=2.73 + 0.04X
1
(R
2
=0.21, S=1.81)

10


) và 0.04 (B
1
) của phương trình hồi quy
Ŷx
1
= 2.73 + 0.04X
1
đều không
có ý nghĩa thống kê. Nói cách khác phương trình hồi quy này không thích hợp. Phương trình hồi quy:
Ŷ
x
2
= f(X
2
)
Ŷ
x
2
= -11.141 + 0.129X
2
(R
2
=0.76,S=0.99)

11
2
= -11.141 + 0.129X
2

đều có ý nghĩa thống kê. Nói cách khác phương trình hồi quy

này thích hợp.
Kết luận: yếu tố nhiệt ñộ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.

Phương trình hồi quy:
Ŷx
1
,x
2
=f(X
1
,X
2
)
Ŷx
1
,x
2
= -12.70 + 0.04X
1
+ 0.13X
2
(R
2
=0.97; S=0.33)

-5
<α=0.05) =>Bác bỏ giả thiết H
0Vậy cả hai hệ số -12.70 (B
0
), 0.04 (B1) và 0.13 (B1) của phương trình hồi quy
Ŷx
1
,x
2
=-12.7 +
0.04X
1
+ 0.13X
2
đều có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này thích hợp.
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời
gian và nhiệt ñộ. Sự tuyến tính của phương trình
Ŷx
1
,x
2
= -12.70 + 0.04X
1
+ 0.13X
Vậy hiệu suất phản ứng theo
dự ñoán ở 115°C trong vòng
50 phút là 4.3109%.

14Bài 2:
Hai máy cùng gia công một loại chi tiết. Người ta muốn kiểm tra xem hai máy này có độ
chính xác như nhau hay không? Để làm điều đó người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết,
đem đo và thu được kết quả sau:

Máy A 135 138 136 140 138 135 139
Máy B 140 135 140 138 135 138 140

Với mức ý nghĩa 0.05 có thể cho rằng hai máy này có độ chính xác như nhau hay không?
Biết kích thước chi tiết có phân phối chuẩn.
Phương pháp: so sánh phương sai
Nhập dữ liệu vào bảng tính: Áp dụng “F-Test Two-Sample for Variances”

Vậy độ chính xác của máy A cao hơn
máy B

BÀI 3:
Một cửa hàng lớn có bán ba loại giày A,B,C. Theo dõi số khách hàng mua các loại giày này
trong 5 ngày, người quản lý thu ñược bảng số liệu sau:

Loại giày
A B C
28 35 33
21 42 38
20 32 31
18 25 42
23 27 29

Với mức ý nghĩa α=1% hãy so sánh lượng tiêu thụ trung bình của ba loại giày nói trên.

Bài làm:

ðây là bài toán phân tích phương sai một yếu tố, mức tiêu thụ ảnh hưởng bởi loại giày
Giả thiết H
0
: µ
1
= µ
2
= µ
3
; tức lượng tiêu thụ trung bình là bằng nhau


Từ giá trị trong bảng Anova:
F = 7.5864 > F
0.01
= 6.9266 => Bác bỏ H
0

=> Lượng tiêu thụ của 3 loại giày trên là khác nhau
Lượng tiêu thụ trung bình của loại giày A là 22
Lượng tiêu thụ trung bình của loại giày B là 32.2
Lượng tiêu thụ trung bình của loại giày C là 34.6
=> Lượng tiêu thụ trung bình: Loại C > Loại B > loại A

17

Câu 4: Với mức ý nghĩa 0.03 hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt
ñộng kinh tế của các hộ gia ñình ở một vùng nông thôn trên cơ sở bảng số liệu về thu
nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau: 1.Cơ sở lý thuyết:
Đây là dạng toán phân tích phương sai hai yếu tố (không lặp):

Giả thiết: H
0
– các giá trị trung bình là bằng nhau
ðối giả thiết: H
1
– các giá trị trung bình là không bằng nhau.
Nhập dữ liệu vào máy tính:


1.5

18

Sau

khi click Ok thì kết quả thu ñược như sau:
F
R
= 1.9966 < F
0.03
= 4.7407 => chấp nhận giả thiết H
0
(nghề chính).
F
C
= 0.1106 < F
0.03
= 4.7407 => chấp nhận giả thiết H
0
(nghề phụ).
Vậy, thu nhập của gia đình giống nhau xét cho nghề chính hay nghề phụ.
250
228
230
222
245
230
220
225
235
240

Bài làm:
Phương pháp: phân tích phương sai hai yếu tố không lặp
Nhập dữ liệu vào bảng tính:
Áp dụng: “Anova: Two – Factor without Replication”

a)Tại nhóm lệnh Data analysis, chọn Anova:Two – Factor without Replication”.
b)Trong hộp thoại Anova: Two – Factor without Replication, lần lượt ấn định các giá trị:
- Phạm vi đầu vào (Input Range): chọn bảng tính ta vừa tạo.
-Nhãn dữ liệu (labels in first row/column)
-Ngưỡng tin cậy: Alpha = 2% = 0.02
-Phạm vi đầu ra (Output Range).
20


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status