Bài báo cáo Bài tập lớn
Xác suất thống kê
MỤC LỤC
Bài báo cáo Bài t p l nậ ớ 1
Xác su t th ng kêấ ố 1
M C L CỤ Ụ 2
I.D ng bài t p: phân tích ph ng sai 2 y u tạ ậ ươ ế ố 33
A. KHÁI NI M TH NG KÊ:Ệ Ố 33
BÀI BÁO CÁO XSTK
NHÓM 4
BÀI 1:
Phần A:(ví du 3.4 trang 161sgk)
Hiệu xuất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3
yếu tố:pH(A),nhiệt độ (B) và chất xúc tác (C)được trình bày trong bảng sau:
Yếu tố
A
Yếu tố B
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 11 C2 14
A4 C4 10 C1 11 C2 13 C3 13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu xuất phản ứng?
Bài làm:
I.Dạng toán: phân tích phương sai ba yếu tố
II.CƠ SỞ LÝ THUYẾT
Mục đích của sự phân tích phương sai ba yếu tố là đánh giá sự ảnh hưởng của ba
yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá
trị quan sát G(i=1,2…r:yếu tố A;j=1,2…r:yếu tố B;k=1,2…r:yếu tố C)
• Mô hình vuông la tinh ba yếu tố được trình bày như sau:
334
C2 Y
342
T
3
A4 C4 Y
414
C1 Y
421
C2 Y
412
C3 Y
443
T
4
T
j
T
1
T
2
T
3
T
4
T
i
:Tổng theo hàng
T
j
Giá trị thống
kê
Yếu tố A (r-1)
SSR=
MSR=
F
R
=MSR/MSE
Yếu tố B
(r-1)
SSC=
MSC=SSC/(R-1) F
C
=MSC/MSE
Yếu tố C (r-1)
SSF=
MSF=
F=MSF/MSE
Sai số
(r-1)
(r-2)
SSE=SST-
(SSF+SSR+SSC)
MSE=SSE/(r-1)(r-2)
Tổng
cộng
(r
2
-1)
SST=
Chọn ô B7 và chọn biểu thức=SUM(B2:E2)
Chọn ô C7 và nhập biểu thức=SUM(B3:E3)
Chọn ô D7 và nhập biểu thức=SUM(B4:E4)
Chọn ô E7 và nhập biểu thức=SUM(B4:E4)
• Các giá trị T.j.
Chọn ô B8 và nhập biểu thức=SUM(B2:B5)
Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8
• Các giá trị T k
Chọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4)
Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5)
Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)
• Giá trị T…
Chọn ô B10 và nhập biểu thức=SUM(B2:B5)
2. tính các giá trị G
• Các giá trị G
Chọn ô G7 và nhập biểu thức=SUMSQ(B7:E7)
Dung con trỏ kéo ký hiệu tự điền từ G7 đến ô G9
Chọn ô G10 và nhập biểu thức=POWER(B10,2)
Chọn ô G11 và nhập biểu thức=SUMSQ(B2:E5)
3. tính các giá trị SSR.SSC.SSF.SST và SSE
• Các giá trị SSR.SSC.SSF
Chọn ô I7 và nhập biểu thức=G7/4-39601/POWER(4,2)
Dung con trỏ kéo ký tự điền từ ô I7 đến ô I9
• Giá trị SST
Chọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)
• Giá trị SSE
Chọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)
4. tính các giá trị MSR.MSC.MSF và MSE
• Giá trị SST
0
C kết hợp với 3 khoảng
thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.các hiệu xuất
của phản ứng(%) được trình bày trong bảng sau:
Thời gian (phút)
X1
Nhiệt độ (
0
C)
X2
Hiệu xuất (%)
Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26
Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan
tuyến tính với hiệu xuất của phản ứng tổng hợp?nếu có thì điều kiện nhiệt độ
115
0
C trong vòng 50 phút thì hiệu xuất phản ứng sẻ là bao nhiêu?
Giải:
I.Dạng toán: hồi quy tuyến tính đa tham số
II.Cơ sở lý thuyết:
HỒI QUY TUYẾN TÍNH ĐA THAM SỐ
• Giá trị thống kê:
• Giá trị R-bình phương
• Giá trị R
2
-được hiệu chỉnh
• R
2
= =Kf/((N-k-1)+Kf) (R
2
>=0,81 là khá tốt)
• Giá trị R
2
được hiệu chỉnh
• R
ii
2
= = R
2
-
• Độ lệch chuẩn
• S= (S=<0,30 là khá tốt)
Trắc nghiệm thống kê
Đối với một phương trình hồi quy ý nghĩa thống kê của các hệ số B
i
được đánh
giá bằng trắc nghiệm t (phân phối student) trong khi tính chất thích hợp của
phương trình được đánh giá bằng trắc nghiệm F (phân phối Fisher)
-Trong trắc nghiệm t
H
0
≠ 0 ó Các hệ số hồi quy có ý nghĩa
-Trong trắc nghiệm F:
H
0
: Β
i
= 0 ó Phương trình hồi quy không thích hợp
H
1
: Β
i
≠ 0 ó Phương trình hồi quy thích hợp với ít nhất vài B
i
Bước 1:nhập dử liệu vào bản tính
Dử liệu nhất thiết phải được nhập theo cột.
Bước 2:áp dụng Regression
Nhấn lần lượt đơn lệnh tools và lệnh data Analysis
Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK
Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
Phạm vi của biến số Y (input Y range)
Phạm vi của biến số X (input X range)
Nhãn dử liệu(Labels)
Mức tin cậy(Confidence level)
Tọa độ đầu ra(Output range)
Đường hồi quy(line Fit Plots),…
Các giá trị đầu ra cho bảng sau:
Phương trình hồi quy:
X1
=f(X
1
=0.209>α=0.05)
=>Chấp nhận giả thiết H
0
Vậy cả hai hệ số 2.73(B
0
) và 0.04(B
1
) của phương trình hồi quy
X1
=2.73+0.04X
1
đều không có ý nghĩa thống kê.nói cách khác phương trình
hồi quy này không thich hợp.
Phương trình hồi quy:
X2
=f(X
2
)
Y
X2
=2.73+0.04X
2
(R
2
=0.76,S=0.99)
t
0
=3.418> t
0.05
=2.365(hay P
X1,X2
=-12.70+0.04X
1
+0.13X
2
(R
2
=0.97; S=0.33)
X1.X2
=-12.7+0.04X
1
+0.13X
2
t
0
=11.528> t
0.05
=2.365(hay P
v
2
=2.260*10
-5
<α=0.05)
=>Bác bỏ giả thiết H
0
t
1
=7.583> t
0.05
=2.365(hay P
BIỂU ĐỒ:
Kết luận: hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là thời gian và nhiệt độ.
Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy Y=-
12.70+0.04X
1
+0.13X
2
,chỉ cần chọn một ô,ví dụ như
E20,sau đó nhập hàm=E17+E18*50+E19*115 và được kết quả như sau:
Ghi chú: E17 tọa độ của B0 ,E18 tọa độ của B1,E19 tọa độ của B2,50 là giá trị của
X
1
(thời gian) và 115 là giá trị của X
2
(nhiệt độ)
BÀI 2:
Có 4 báo cáo viên A,B,C,D nói về cùng một chủ đề.sau đây là thời gian(tính
bằng phút)mà mỗi báo báo cáo viên đó sử dụng trong 5 buổi báo ở các địa điểm
khác nhau:
A: 25 29 30 42 35
B: 35 20 20 17 30
C: 30 27 18 19 26
D: 28 32 33 35 24
Hãy thiết lập bảng ANOVA cho các số liệu trên.Gỉa thiết H
0
là gì?giả thiết H
0
có bị bác bỏ mứ ý nghĩa 5% hay khơng.
ra một số kí
hiệu sau
Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng
trên):
=
= =
∑
i
n
ji
j 1
i
i
i i
x
T
x
n n
Trung bình chung
= =
= = =
∑∑
∑∑
j
n
k
ij
ij i 1 j 1
x
x
n n n
2 2 2
i1 i2 ik
i 1 i 1 i 1
n
n
2
ij
j 1 i 1
SST x x x x x x
x x
có thể chứng minh rằng
,
= = =
= + + + −
= −
∑ ∑ ∑
∑
L
1 2 k
n n n
2
2 2 2
i1 i2 ik
i 1 i 1 i 1
2
2
ij
i j
1
1n
x
2
2n
x
k
n k
x
Tổng
số
T
1
T
2
T
k
=
=
∑
1
k
k
i
T T
Trung
bình
1
1 2 k
n n n
2 2 2
i1 i 2 2 ik k
i 1 i 1 i 1
n n n
2 2 2
2 2 2
1 2 k
i1 i 2 ik
1 2 k
i 1 i 1 i 1
2 2
2
1 k
ij
1 k
SSE x x x x x x
T T T
x x x
n n n
T T
x
n n
= = =
= = =
= − + − + + −
= − + − + + −
= − + +
F
MSE
=
Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA
(viết tắt của chũ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn Tổng
bình
Bậc tự
do
Trung
bình bình
Tỷ số F
phương phương
Nhân tố SSF k – 1 MSF MSF/MS
E
Sai số SSE n – k MSE
Tổng số SST n – 1
- Người ta chứng minh được rằng nếu giả thiết H
o
đúng thì tỷ số F
MSF
F
MSE
=
sẽ có phân bố Fisher với bậc tự do là (k – 1, n – k)
Thành thử giả thiết H
o
sẽ bò bác bỏ ở mức ý nghóa α của phân bố Fisher
với bậc tự do là (k – 1, n – k), k – 1 được gọi là bậc tự do ở mẫu số.
T
i
161 122 120 152 555
Bước 1: Tính SSF:
SSF = (161
2
+122
2
+120
2
+152
2
)/5 – 555
2
/20=260,55
Bước 2: Tính SST:
SST = (25
2
+29
2
+30
2
+42
2
+35
2
+… 24
2
)- 555
2
Khởi động Ms- EXCEL
Nhập dử liệu vào bảng:
Áp dụng “anova:single-factor”
Nhấn lần lượt lệnh tools và lệnh data analysis
Từ hộp thoại data analysis ta chọn” single-factor” rồi nhấp nút OK
Trong hộp thoại anova:single factor, lần lượt ấn định các chi tiết:
Phạm vi đầu vào(input range)
Nhãn dử liệu (labels in fisrt row/column)
Ngưởng tin cậy (alpha)
Phạm vi đầu ra(output range)
Sau khi nhấn OK ta thu được kết quả được thể hiện qua bảng anova sau:
V.Kết luận
F=2.33 < Fcrit= 3.23 Chấp nhận Ho
Thời gian trung bình mà các báo cáo viên cần cho các bài báo cáo của mình là
bằng nhau
BÀI 3:
Một cửa hàng lớn có bán ba loại giầy A,B,C.theo dõi số khách hàng mua các
loại giầy này trong 5 ngày,người quả lý thu được bảng số liệu sau:
A B C
28
21
20
18
23
35
42
32
25
27
33
k
rút
ra từ tập hợp chính các giá trò của X
k
. Các số liệu thu được trình bày thành
bảng ở dạng sau đây:
Các mức nhân tố
1 2 k
=
=
∑
1
1
k
i
n n
x
11
x
12
x
1k
x
21
x
22
x
2k
1
x
=
T
x
n
Ta đưa ra một số kí hiệu sau
Trung bình của mẫu thứ i (tức là mẫu ở cột thứ i trong bảng
trên):
=
= =
∑
i
n
ji
j 1
i
i
i i
x
T
x
n n
Trung bình chung
= =
= = =
∑∑
∑∑
j
n
∑∑
L
1 2 k
j
k
n n n
2 2 2
i1 i2 ik
i 1 i 1 i 1
n
n
2
ij
j 1 i 1
SST x x x x x x
x x
có thể chứng minh rằng
,
= = =
= + + + −
= −
∑ ∑ ∑
∑
L
1 2 k
n n n
2
2 2 2
i1 i2 ik
n n n n
Tổng bình phương do sai số ký hiệu là SSE (viết tắt của chữ Sum
of Squares for the Error) được tính theo công thức:
( ) ( ) ( )
1 2 k
1 2 k
n n n
2 2 2
i1 i 2 2 ik k
i 1 i 1 i 1
n n n
2 2 2
2 2 2
1 2 k
i1 i 2 ik
1 2 k
i 1 i 1 i 1
2 2
2
1 k
ij
1 k
SSE x x x x x x
T T T
x x x
n n n
T T
x
n n
= = =
−
n – k được gọi là bậc tự do của sai số.
Tỷ số F được tính bởi công thức
MSF
F
MSE
=
Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA
(viết tắt của chũ Analysis of Variance: phân tích phương sai)
Bảng ANOVA
Nguồn Tổng
bình
phương
Bậc tự
do
Trung
bình bình
phương
Tỷ số F
Nhân tố SSF k – 1 MSF MSF/MS
E
Sai số SSE n – k MSE
Tổng số SST n – 1
Người ta chứng minh được rằng nếu giả thiết H
o
đúng thì tỷ số F
MSF
F
MSE
= = =
−
354
29,5
15 3
SSE
MSE
n k
= = =
− −
223.8
7,5864
29.5
MSF
F
MSE
= = =
Ta trình bày các kết quả tính toán trên trong bảng ANOVA
Nguồn
Tổng bình
phương
Bậc tự
do
Trung bình
bình phương
Tỷ số F
Nhân tố 447,6 2 223,8 7,5864
Sai số 354 12 29,5
Tổng số
801,6 14