Báo cáo Bài tập Lớn Xác suất thống kê trường ĐH Bách Khoa TP.HCM - Pdf 50

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
…………..o..O..o…………..

BÁO CÁO BÀI TẬP LỚN
XÁC SUẤT THỐNG KÊ
Giáo viên hướng dẫn : Nguyễn Bá Thi
Sinh viên : Hồ Duy Anh
MSSV : 1610043
Nhóm 13 - Lớp A01-D


1. Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím
than. Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong
bảng sau:
Đỏ

Xanh

Vàng

Tím than

Nữ

62

34

71




Ta được bảng :

+ Tính các tần số lí thuyết :
Nhập vào B20 biểu thức =B17*F15/F17, sau đó kéo nút tự điền đến E21
Ta có bảng:

+ Áp dụng hàm Chitest để tìm kết quả :
Cú pháp hàm chitest : CHITEST (actual_range, expected_range)
Điền vào ô H33 biểu thức
=CHITEST(B15:E16,B20:E21)
Ta được kết quả của P(X
-

-

Nhập vào hộp thoại Desciptive Statistics.
+Lần 1
-Input Range: phạm vi dữ liệu nhập vào (ô A36 → Z36).
-Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng).
-Labels in first row: nhãn ở cột đầu tiên (chọn).
-Output Range: phạm vi dữ liệu xuất ra (ô A40).
-Tích dấu chọn vào Summary statistics.
- Confidence Level for Mean: Nhập 95 (%)
+Lần 2
-Input Range: phạm vi dữ liệu nhập vào (ô A37 → Z37).
-Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng).
-Labels in first row: nhãn ở cột đầu tiên (chọn).
-Output Range: phạm vi dữ liệu xuất ra (ô A57).
-Tích dấu chọn vào Summary statistics.
- Confidence Level for Mean: Nhập 95 (%)

9
6
9
4


3) Ta được bảng kết quả.


Kết luận:

3.Từ 12 cặp quan sát (xi,yi) sau đây của hai cặp biến (X,Y). Tính tỷ số tương quan
của Y đối với X ,hệ số tương quan và hệ số xác định của tập số liệu sau đây. Với
mức ý nghĩa = 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến
không ? Có tuyến tính không ?).Tìm đường hồi quy của Y đối với X.
11
X 123 356 111 118 123 356 111 118 123 356
1 118
Y 4,2 4,1 3,7 3,9 4,5 4,1 3 3,8 2 3,1 3,4
3
Bài giải
- Dạng bài : Bài toán kiểm định tương quan và hồi quy.
- Phương pháp giải: tiêu chuẩn Student và Fisher
- Công cụ giải : Correlation, Anova Single Factor và Regression trong Data
Analysis
- Quy trình thực hiện bằng EXCEL
1)Phân tích tương quan tuyến tính
- Giả thuyết H0 : X và Y không có tương quan tuyến tính.
- Nhập dữ liệu vào máy tính

Mở hộp thoại

trong thẻ Data, chọn Corelation


-Nhập vào hộp thoại Correlation.
+Input Range: phạm vi đầu vào (ô A81 → M82).
+Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng).
+Labels in first row: nhãn ở cột đầu tiên (chọn).
+Output Range: phạm vi dữ liệu xuất ra (ô A84).








Input Range: phạm vi đầu vào (ô A91 → E94).
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α =0,05
Output Range: phạm vi dữ liệu xuất ra A96

Ta nhận được bảng kết quả :








n = 12 , k = 4
Tổng bình phương giữa các nhóm SSF = 0,24
Tổng bình phương nhân tố SST = 5,366667
η2Y/X = SSF/SST = 0,044720494  Tỷ số tương quan : ηY/X=0,211472206
Giá trị F = 0,055929
Phân bố Fisher mức α = 0,05 với bậc tự do (k-2, n-k) = (2,4)
Dùng hàm FINV tính được
c = 3.68749867 (cú pháp hàm Finv được sử dụng như sau


Hệ số góc = 0,001145
Hệ số tự do =3,363998
Giá trị P của hệ số tự do (P-value) = 99,05E-06< α = 0,05 => chấp
nhận giả thiết H
->Hệ số tự do không có ý nghĩa thống kê
Giá trị P của hệ số góc (P-value) = 0,581892> α = 0,05 => bác bỏ giả thiết
H
->Hệ số góc có ý nghĩa thống kê
Giá trị F (Significance F) = 0,581892224> α = 0,05 => Chấp nhận giả
thiết H
->Phương trình đường hồi quy tuyến tính thích hợp
Kết luận:
Tỷ số tương quan ηY/X =0,211472206
Hệ số tương quan r = 0,177098
Hệ số xác định r² = 0,031364
X và Y không có tương quan tuyến tính với mức ý nghĩa 5%.
X và Y không có tương quan phi tuyến với mức ý nghĩa 5%.
Phương trình đường hồi quy của Y đối với X: Y = 0,001145X


4. Với mức ý nghĩa 0,05 , hãy phân tích sự biến động của thu nhập ($/tháng/người) trên
cơ sở số liệu điều tra về thu nhập cả 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:
Nơi làm việc
Loại ngành nghề

V1

V2

V3


235

4

240

228

230

240

Bài giải:
- Dạng bài: Bài toán phân tích phương sai hai nhân tố không lặp.
- Phương pháp giải: Phân tích phương sai hai nhân tố không lặp
- Công cụ giải: Anova: Two-Factor Without Replication trong Data Analysis
Giả thiết H0: -Trung bình thu nhập tại 4 nơi làm việc bằng nhau
-Trung bình thu nhập cuả 4 loại ngành nghề bằng nhau
- Không có sự tương tác giữa loại ngành nghề và nơi làm việc
Quy trình thực hiện bằng EXCEL. Nhập dữ liệu :

Mở hộp thoại

trong thẻ Data, chọn Anova : Two-Factor without replication


Hộp thoai Anova: Two-Factor Without Replication xuất hiện,ta chọn:
Input range: A174:E178
Labels: chọn


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status