TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA HTTT VÀ TMĐT
----------
ĐẠI HỌC THƯƠNG MẠI
MÔN: LÍ THUYẾT XÁC SUẤT THỐNG KÊ
Đề tài:
Vấn đề 1 : Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên
ngoại tỉnh
Vấn đề 2 : có ý kiến cho rằng mức chi tiêu trung bình hàng tháng của các bạn
ngoại tỉnh là 2,3 triệu đồng . Hãy kiểm tra lại ý kiến trên.
Vấn đề 3 : hãy so sánh mức chi tiêu trung bình hàng tháng của các bạn sinh viên
ngoại tỉnh có đi làm thêm và không đi đi làm thêm
Giáo viên hướng dẫn: Mai Hải An
Nhóm sinh viên thực hiện: Nhóm 09
Mã LHP: 1996AMAT0111
Hà nội, 5/10/2019
MỤC LỤC.
LỜI MỞ ĐẦU.
Xác suất và thống kê đóng vai trò rất quan trọng trong hầu hết mọi lĩnh vực của
thế giới hiện đại, từ khoa học, công nghệ, đến kinh tế, chính trị, đến sức khỏe, môi
trường, v.v Việc rút ra thông tin đó có thể là kiểm định một giả thiết khoa học, ước
lượng một đại lượng chưa biết hay dự đoán một sự kiện trong tương lai. Phương pháp
1.1.
Đám đông
Giả sử ta cần nghuyên cứu 1 hay nhiều dấu hiệu thể hiện trên 1 tập hợp gồm N phần
tử, thì tập hợp N phần tử được gọi là đám đông (còn được gọi là tổng thể hay tập nền),
N được gọi là kích thước cuả đám đông
Thông thường kích thước đám đông là hữu hạn ,song trong trường hợp sô lượng các
phần tử của đám đông là qua lớn hoặc không thể nắm bắt được toàn bộ các phần tử của
đám đông thì ta có thể coi kích thước của đám đông là vô hạn. VD: Cần nghiên cứu
trọng lượng X của các gói hàng do 1 máy tự động đóng thì đám đông là tất cả gói hàng
do máy đóng . Vì máy đã đóng ,đang đóng và tiếp tục đóng nên ta có thể coi kích
thước của đám đông N=+∞
Xét 1 đám đông kích thước N hữu hạn .Giả sử dấu hiệu định lượng cần nghiên cứu
X chỉ có thể nhận các giá trị ,...,,...., với các tần số tương ứng ,....,.....,. Tất nhiên ta có
=N, trong đó 0≤Ni≤N với mọi i. Theo định nghĩa cổ điển về xác suất ta có P(X=)=Ni|
N=pi, (i=1,...,k).Như vậy ta có thể coi X là một ĐlNN rời rạc với bảng phân phối xác
suất sau:
X
P
………………...……………
…………………..……………
I.2. Mẫu
Để nghiên cứu dấu hiệu X thể hiện trên một đám đông kích thước N, đáng lẽ ta phải
điều tra tất cả các phần tử của đám đông nhưng điều này thường thường không thể
thực hiện được vì những lý do:
Khi N=+∞ rõ ràng ta không thể điều tra được tất cả các phần tử của đám đông
a, Trung bình mẫu
Giả sử từ ĐLNN gốc X ta rút ra 1 mẫu ngẫu nhiên kích thước n:W(,,...,). Khi đó
trung bình mẫu ký hiệu là được định nghĩa bằng công thức :
b,Tính chất của trung bình mẫu :Nếu ĐLNN gốc X có E(X)=µ và Var(X) = 2 thì
E() =µ
Var(=
5
Thật vậy ,vì ,,..., là các ĐNNN độc lập có cùng phân phối xác suất với X nên:
E(Xi) = E(X)=µ ; Var(Xi)=Var(X)=2 (i=1,2,....,n). Theo các tính chất của kỳ vọng toán
và phương sai ta có:
E( )= E( = =nµ =µ
Var(X) =Var( =
Độ lệch tiêu chuẩn của ĐLNN trung bình mẫu được xây dựng là mẫu lặp.
==
Nếu mẫu là mẫu không lặp thì: Var(X) =
Nếu N vô cùng lớn so với n thì người ta thường sử dụng phương pháp chọn mẫu
không lặp nhưng các kết quả giống như sử dụng mẫu lặp.
c,Phương sai mẫu
Định nghĩa: Giả sử từ ĐLNN gốc X ta rút ra 1 mẫu ngẫu nhiên kích thức
n:W=(,,...,). Khi đó phương sai mẫu , ký hiệu là S2 được định nghĩa bằng công thức:
S2 =
Tính chất của phương sai mẫu : giả sử ĐLNN gốc X có E(X)=µ và Var(X)=,
khi đó:
E(S2)=
Thay U ta được:
=
Như vậy, khoảng tin cậy của là ( – , + ), sai số .
TH2: Khoảng tin cậy phải ()
Với độ tin cậy cho trước, ta tìm được thỏa mãn:
=
Thay U ta được =
Như vậy khoảng tin cậy phải của là (;+) và Min=
TH3: Khoảng tin cậy trái ()
7
Với độ tin cậy cho trước, ta tìm được thỏa mãn:
=
Thay U ta được
Như vậy khoảng tin cậy phải của là (-;) và Max=
b, Đại lượng ngẫu nhiên phân phối chuẩn, phương sai chưa biết, n>30
Vì T = ~T (n-1)
+ Khoảng tin cậy đối xứng (1 = 2 = /2)
Với độ tin cậy = 1 - cho trước, ta tìm được thỏa mãn:
P( < ) = 1 – =
Thay T ta có: P( – < < + ) = 1 – =
Khoảng tin cậy đối xứng của là ( – ; + ) với =
+ Khoảng tin cậy phải()
Với = 1 - cho trước, ta tìm được thỏa mãn:
P(T < ) = 1- =
Thay T vào ta được: P( -
< ) = 1- =
+ Khoảng tin cậy phải của : (-, + ), sai số = U
max
= +U
3. Kiểm định giả thuyết thống kê
a, Giả thuyết thống kê
Giả thuyết về quy luật phân phối xác suất của ĐLNN, về các tham số đặc trưng
của ĐLNN hoặc về tính độc lập của ĐLNN được gọi là giả thuyết thống kê, kí hiệu là
H0.
Một giả thuyết mâu thuẫn với giả thuyết H0 được gọi là đối thuyết, kí hiệu H1.
Các giả thuyết thống kê có thể đúng hoặc sai nên ta cần kiểm định, tức là tìm ra lí
luận về tính thừa nhận hay không thừa nhận được của giả thuyết đó. Việc kiểm định
này được gọi là kiểm định thống kê.
b, Tiểu chuẩn kiểm định
Để kiểm định cặp giả thuyết thống kê H 0 và H1, từ đám đông ta chọn ra mẫu W =
(X1, X2, X3, ..., Xn).
Dựa trên mẫu này ta xây dựng một thống kê
G = f (X1, X2, X3, ..., Xn, 0 )
9
Trong đó 0 là 1 tham số liên quan đến H0 sao cho nếu H0 đúng thì quy luật phân
phối xác suất của G là hoàn toàn xác định.
Khi đó thống kê G được gọi là tiêu chuẩn kiểm định.
c, Miền bác bỏ
+ Nếu một biến cố có xác suất khá bé, ta có thể coi nó không xảy ra trong một lần
thực hiện phép thử.
Từ đám đông lấy ra mẫu W = (X1, X2, …., Xn) và tính được các đặc trưng mẫu , S’2.
Ta xét các trường hợp sau:
Trường hợp X N(,2), với 2 đã biết
Vì →
Xây dựng tiêu chuẩn kiểm định:
U=
Nếu H0 đúng thì U N(0,1). Tùy thuộc vào đối thuyết ta có những bài toán sau:
Bài toán 1:
Với cho trước ta có thể tìm được sao cho P( > = α
Ta có miền bác bỏ W = (utn : > )
Trong đó utn =
Bài toán 2:
Với cho trước ta có thể tìm được sao cho P(U > ) = α
Ta có miền bác bỏ W = (utn : utn> )
Bài toán 3:
Với cho trước ta có thể tìm được U sao cho P(U < - ) = α
Ta có miền bác bỏ W = (utn : utn < -)
4. So sánh kỳ vọng toán của hai ĐLNN
Xét 2 ĐLNN X1,X2. Kí hiệu E(X1)=µ1,E(X2)=µ2, Var(X1)=12, Var(X2)=22 Trong đó µ1
và µ2
chưa
biết. Với mức ý nghĩa α cho trước ta cần kiểm định giả thuyết
H0 :µ1=µ2
chưa biết
XDTK : T=
Nên nếu H0 đúng thì T= T(n₁+n₂-2)
Từ đó miền bác bỏ với mức ý nghĩa cho từng bài toán như sau:
Bài toán 1
Wα= ,trong đó :
Bài toán 2:
Wα=(
Bài toán 3:
Wα=(
12
II.
PHẦN 2: THU THẬP SỐ LIỆU
Phương pháp thu thập số liệu: Thu thập bằng phiếu khảo sát
Đối tượng: Sinh viên Đại học Thương Mại
Số lượng :107 sinh viên
Phiếu khảo sát: Số phiếu xuất ra là 99, số phiếu thu về là 99 số phiếu hợp lệ là 99.
Mức chi tiêu hàng tháng của sinh viên đại học thương mại
Họ và tên *
Câu trả lời của bạn
1,5 1,6 2
2,15 2,2 2,3 2,5 2,75 3
3,5 4
4,5 10
15
Số
sinh
viên
1
12
1
4
1
1
1
8
Số
sinh
viên
0
1
0
3
0
0
0
4
0
4
17
0
7
1
1
1
1
4
2
19
20
1
5
1
0
14
viên
PHẦN 3: BÀI TẬP
2,5
2,75
3
3,5
4
4,5
10
14
15
1
2
1
8
1
2
4,4
55,2
95
2,75
36
14
4
4,5
10
14
15
278,1
0,25
4,5
2,56
S’
Bài làm:
Gọi X là số tiền chi tiêu trong 1 tháng của 1 sinh viên ngoại tỉnh
Gọi là số tiền chi tiêu trung bình trong 1 tháng của 1 sinh viên ngoại tỉnh trên mẫu
Gọi là là số tiền chi tiêu trung bình trong 1 tháng của 1 sinh viên ngoại tỉnh
Do n=99>30 →
XDTK :N(0,1)
Chọn phân vị:
15
P(-
4
0
4 0
0
4
17
0
7 3
0 0
1
0
0
1,5
0
8
0
0
9,2
42,5
0
1
6
3
1
5
0
10,5
0 0
10
0
0
102,
36,7
5
0 0
10
0
0
14
15
1
1
0
0
1
1
1
4
1
2
20
21
1
5
0,2
5
2,2
5
2,5
6
1
6
4,622
5
9,6
8
105,
8
131,2
5
7,562
5
1
5
4
X2 là mức chi tiêu hàng tháng của sinh viên ngoại tỉnh không đi làm thêm
là chi tiêu TB hàng tháng của sinh viên ngoại tỉnh có đi làm thêm trên mẫu
là chi tiêu TB hàng tháng của sinh viên ngoại tỉnh không đi làm thêm trên mẫu
chi tiêu TB hàng tháng của sinh viên ngoại tỉnh có đi làm thêm trên đám đông
17
chi tiêu trung bình hàng tháng của sinh viên ngoại tỉnh không đi làm thêm trên
đám đông
Ta có: =37
S12= x 345,41 – 2,77572
S’12 = ( 345,41 – 37.2,77572
Ta có : =62
2
S22
=
S’22
Với α=0,05 ta có BTKĐ :
Do n1>30 ,Suy ra
Do n2>30 ,Suy ra
XTCKĐ :U=
N(0,1)
Ta có: P(U > ) = α
Miền bác bỏ : Wα=(