Bài tập lớn xác suất thống kê trong ms excel - Pdf 28

Đại học Quốc Gia TP. HCM
ĐẠI HỌC BÁCH KHOA
oOo
Chương trình Kỹ sư CLC Việt - Pháp
LỚP VP2009/2
NHÓM 6

Sinh viên: Phạm Minh Nhật
MSSV: 40901843
GVGD: PGS.TS Nguyễn Đình Huy
TP.HCM 06/2010
3

BÀI I: Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK 2009.
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phẩn ứng ?
BÀI LÀM
1/ Cơ sở lí thuyết:
Phân tích phương sai ba yếu tố:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát
G (yếu tố A:i=1 r, yếu tố B: j=1 r, yếu tố C: k=1 r)
- Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô
hình hình vuông la tinh n
×
n. Ví dụ:
B C D A
C D A B
D A B C

C4 Y
324
C1 Y
331
C2 Y
342
T
3
A4 C4 Y
414
C1 Y
421
C2 Y
412
C3 Y
443
T
4
T
.j.
T
.1.
T
.2.
T
.3.
T
.4.
- Bảng Anova
Yếu tố

j


“Có ít nhất 2 giá trị trung bình khác nhau”
Giá trị thống kê:
.
G

.
G
Biện luận: Nếu
.
G
(chấp nhận H
0
(yếu tố A) )
Nếu
.
G
(chấp nhận H
0
(yếu tố B) )
Nếu
.
G
(chấp nhận H
0
(yếu tố C) )
2/ Áp dụng Excel:
Nhập dữ liệu vào bảng :


MSR=
1−r
SSR
F
R
=
MSE
MSR
Yếu tố B
(cột)
r-1
SSC=

=

r
i
j
r
T
T
r
1
2
2

2

MSC=

SSE=SST-
(SSF+SSR+SSC)
MSE=
)2)(1( −− rr
SSE
Tổng cộng (r
2
-1) SST=
r
T
Y
ijk
2
2

2

∑∑∑
5
Tính Tk: Chọn ô B9 và nhập biểu thức = SUM(B2, C5,D4,E3)
Chọn ô C9 và nhập biểu thức = SUM(B3, C2,D5,E4)
Chọn ô D9 và nhập biểu thức = SUM(B4, C3,D2,E5)
Chọn ô E9 và nhập biểu thức = SUM(B5, C4,D3,E2)
Tính T: Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
Tính các giá trị của ô G: Chọn ô G và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC,SST, SSE
Kết quả và biện luận: FR=3.106< F

15 105 1,87
30 105 2,02
60 105 3,28
15 120 3,05
30 120 4,07
60 120 5,54
15 135 5,03
30 135 6,45
60 135 7,26

Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản
ứng tổng hợp? Nếu có thì với điều kiện nhiệt độ 115
o
C trong vòng 50 phút, hiệu suất phản ứng sẽ là
bao nhiêu?
BÀI LÀM
1/ Cơ sở lý thuyết:
Đây là một bài toán hồi quy tuyến tính đa tham số, trong đó, Y (hiệu suất) liên quan đến hai biến số X1
(thời gian), X2 ( nhiệt độ).
Sau khi tìm các giá trị thống kê, ta sẽ có hai phần trắc nghiệm hồi quy gồm :
- Trắc nghiệm t: so sánh giá trị t với giá trị t
0,05
, bậc tự do là γ = N-k-1 (k là số biến) (tra bảng Student)
Kiểm định các giả thuyết: H
0
: “ Các hệ số hồi quy không có ý nghĩa”
H
1
:”Có ít nhất vài hệ số hồi quy có ý nghĩa”
- Trắc nghiệm F: so sánh giá trị F với giá trị F

=0.2139, S=1.8112); N=9; k=1;
t
0
=t Stat(Intercept)=2.129 < t
0,05
(7)=2.365 (hay P value=0.0708 > α=0.05)
=>Chấp nhận giả thiết H
0.
t
1
=t Stat(X1)=1.3802< t
0,05
(7)=2.365 (hay P value=0.2099>α=0.05)
=>Chấp nhận giả thiết H
0.
F=1.9049<F
0,05
(1.7)=5.59 (hay F
S
=Significance F=0.2099>α=0.05)
=>Chấp nhận giả thiết H
0
Vậy các hệ số của phương trình hồi quy Y = 2.7367 +0.04454X1 đều không có ý nghĩa thống kê. Nói
cách khác, phương trình hồi quy này không thích hợp.
Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng tổng hợp
2. Phương trình hồi quy của Y theo X2
Phương trình hồi quy: Y = -11.1411 +0.12856X2 (R
2
=0.7638; S=0.9929);N=9; k=1;
t

0,05
(6)=2.447 (hay P value=0.000026 < α=0.05)
=>Bác bỏ giả thiết H
0.
t
1
= t Stat(X1) = 7.5827 > t
0,05
(6)=2.447 (hay P value=0.0002736 < α=0.05)
=> Bác bỏ giả thiết H
0.
t
2
= t Stat(X2) = 14.3278 > t
0,05
(6)=2.447 (hay P value=0.000007 < α=0.05)
=> Bác bỏ giả thiết H
0.
F=131.3921> F
0,05
(1.6)=5.99 (hay F
S
=Significance F=0.0021 < α=0.05)
=>Bác bỏ giả thiết H
0
Vậy các hệ số của phương trình hồi quy Y = -12.7 + 0.0445X1 + 0.1286X2 đều có ý nghĩa thống kê.
Nói cách khác, phương trình hồi quy này thích hợp.
Kết luận: Cả hai yếu tố nhiệt độ và thời gian cùng đồng thời liên quan tuyến tính với hiệu suất phản
ứng tổng hợp
9

có bò bác bỏ ở mức 5% hay không?
BÀI LÀM
1/ Cơ sở lý thuyết:
Để kiểm định giả thiết H
o
có bị bác bỏ ở mức 5% hay khơng, ta phải thực hiện phép phân tích phương
sai (phân tích phương sai 1 yếu tố)
-Khái niệm thống kê:
+Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai
hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng của trắc nghiệm t hay
z (so sánh hai giá trị trung bình).
+Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố(nhân tạo
hay tự nhiên) nào đó đến các giá trị quan sát,Y
i
,(i=1,2,… ,k).
Mơ hình
Yếu tố thí nghiệm
1 2 … K
Y
11
Y
12

Y
1n
Y
21
Y
22


phương
Bình phương
trung bình
Giá trị thống

Yếu tố
Sai số
k-1
N-k
2
2
1
k
i
i
T
T
SSF
N N
SSE SST SSF
==
= −
= −

MSF=
1
SSF
k −
MSE=
SSE

1
:
i j
µ µ


”Ít nhất có hai giá trị trung bình khác nhau”
+Giá trị thống kê:
MSF
F
MSE
=
+Biện luận:
Nếu F<F
α
(k-1;N-k)

chấp nhận giả thiết H
0
2/ Áp dụng Excel:
Nhập dữ liệu vào bảng tính
Áp dụng “Anova:single Factor”
Nhấp chuột đơn lệnh tools và lệnh Data Analysis.
Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK.
Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu (Input range).
Cách sắp xếp theo hang hay cột (Group by).
Nhấn dữ liệu (Labels in Fisrt Row/Column).
12
Kết quả:
Kết quả và biện luận: F=5.814789 > F

11
Y
12

Y
1n
Y
21
Y
22

Y
2n




Y
k1
Y
k2

Y
kn
Tổng cộng trung bình T
1
Y
1
T
2

==
= −
= −

MSF=
1
SSF
k −
MSE=
SSE
N k−
MSF
F
MSE
=
14
Tổng cộng
2
2
1 1
N N
n
i j
T
SST Y
N
= =
= −
∑∑
Trắc nghiệm:

2/ Áp dụng Excel:
Nhập dữ liệu vào bảng tính:
Áp dụng “Anova:single Factor”:
Nhấp chuột đơn lệnh tools và lệnh Data Analysis.
Chọn chương trình “Anova:single factor” trong hộp thoại Data analysis rồi nhấp nút OK.
Trong hộp thoại “Anova:single factor” lần lượt ấn định: Phạm vi đầu(input range).
Cách sắp xếp theo hang hay cột(group by).
Nhấn dữ liệu(Labels in Fisrt Row/Column).
15
Kết quả:
Kết quả và biện luận: F=1.027069 < Fc=3.410534 =>Chấp nhận giả thiết H

Vậy quê quán khong ảnh hưởng đến thời gian trả lời câu hỏi của sinh viên
16
BÀI IV : Tính tỷ số tương quan của Y đối với X và hệ số xác đònh của tập số liệu sau đây:
(X, Y) = (15, 13), (25, 22), (10, 6), (15, 17), (20, 21), (10, 10), (20, 25), (25, 18), (30, 14), (30,
10). Có nhận xét gì về mối quan hệ giữa X và Y?
BÀI LÀM
1/ Cơ sở lí thuyết:
Phân tích tương quan – Khái niệm thống kê:
Hệ số tương quan Pearson:
σσ
ρ
YX
YX
YXCOV ),(
,
=
;


2
2
)(
1
µ
σ

Sự phân tích tương quan (correlation) khảo sát khuynh hướng và mức độ của sự liên quan, trong sự
phân tích hồi quy (regrestion) xác định sự liên quan định lượng giữa hai biến số ngẫu nhiên Y và X. Hệ
số tương quan có thể được ước tính bởi biểu thức:
∑ ∑
−−

= =
=
−−
===
N
i
N
i
n
i
ii
YYXX
XY
Y
Y
X
X

+BX
B
o
=
XBY −
B=

∑ ∑


)(
2
2
/
X
X
YXYX
N
N
i
iiii
Y - biến số phụ thuộc (dependent/response variable)
X - biến số độc lập (independent/predictor variable)
B0 và B – các hệ số hồi quy (regression coefficients)
Bảng anova
Nguồn sai số Bậc tự do Tổng số bình
phương
Bình phương
trung bình
Giá trị thống kê

Giá trị thống kê:
Giá trị R-bình phương (R-square):
R=SSR/SST (100R
2
: % của biến đổi trên Y được giải thích bởi X)
Độ lệch chuẩn (Standard error):
S=


)-
Y
(
'
i
=
2
1
2
Y
i
N
(Sự phân tán của dữ liệu càng ít thì giá trị của S càng gần zero).
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy, YX = B0 + BX, ý nghĩa thống kê của các số Bi (B0 hay B) được
đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình YX =
f(x) được đánh giá bằng trắc nghiệm F (phân bố Fischer).
Trắc nghiệm t
Giả thiết: H0: Bi=0 “Hệ số hồi quy không có ý nghĩa”
H0: Bi<>0 “Hệ số hồi quy có ý nghĩa”
Giá trị thống kê:

Trắc nghiệm F
Giả thiết: H0: Bi=0 “Phương trình hồi quy không thích hợp”
H0: Bi<>0 “Phương trình hồi quy thích hợp”
Giá trị thống kê:
F=MSR/MSE
Phân bố Fischer v1=1, v2=N-2
Kết luận:
Nếu F<Fα(1,N-2) => chấp nhận giả thiết H0.
2/ Áp dụng Excel:
Nhập bảng giữ liệu theo hàng:
Áp dụng “Correlation” tính hệ số tương quan:
Trên thanh công cụ chọn Tools-> Data Analysis
Chọn “Correlation” rồi Ok
Nhập đầu vào (input range)
18
Cách sắp xếp theo hàng / cột (group by),ở đây ta chon theo hàng
Nhập đầu ra (output range)
Nhấn ENTER
Áp dụng “Regresson” tìm sự tương quan tuyến tính:
Trên thanh công cụ chon Tools-> Data Analysis
Chọn “Regresson” rồi Ok
Nhập đầu vào biến Y (input Y range)
Nhập đầu vào biến X (input X range)
Nhãn dữ liệu (label)
Mức tin cậy (confidence lever)
Nhập đầu ra (output range)
Đường hồi quy (line fit plot)
Biểu thức sai số (residuals plots)
Nhấn ENTER
19

5
4
4
4
4
5
3
4
5
3
4
3
7
2
5
2
Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự khác biệt gì về số
lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần?
BÀI LÀM
1/ Cơ sở lý thuyết:
Phân tích phương sai hai yếu tố (khơng lặp)
Khái niệm thống kê
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1.2…r: yếu
tố A; j=1.2…c: yếu tố B).
Mơ hình
Yếu tố
A
Yếu tố B
1 2 … c
1 Y11 Y12 … Y1c Y1. Y1

2
MSB=
1−r
SSB
F
R
=
MSE
MSB
Yếu tố B
(cột)
Sai số
r-1
(r-1)(c-1)
SSB=

=

c
j
j
rcr
T
T
1
2

2
SSE=SST – (SSF + SSB)
MSF=

1
= μ
2
= …=μ
k


“Các giá trị trung bình bằng nhau”
H1: μ
i
≠ μj

“Có ít nhất 2 giá trị trung bình khác nhau”
Giá trị thống kê: F
R
=
MSE
MSB
và F
C
=
MSE
MSF
Biện luận: Nếu F
R
< F
a
[b-1,(k-1)(b-1)] => chấp nhận H
0
(yếu tố A)

HẾT
23


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status