Xác suất thống kê ứng dụng trong KT: Một vài điểm cần nắm vững trước khi thi (Dùng cho phần mềm R) pot - Pdf 20

Xác suất thống kê ứng dụng trong KT: Một số điểm cần
nắm vững trước khi thi .
**I > Những thao tác cơ bản với R :
>>Các phép toán số học và các hàm giải tích cơ bản trong R
>>Cách nhập dữ liệu < scan() vs nhập từ file >,các thao tác với véc tơ và ma trận (nhập),
dãy số, cách đặt đường dẫn <setwd() vs change dir >

*** II > Phần Bài tập dữ liệu và xử lý dữ liệu :
>>Hiểu rõ dữ liệu định lượng và định tính
>>Cách lấy cột dữ liệu (vec tơ) từ dữ liệu data.frame và ngược lại
>>Bảng tần số của vectơ dữ liệu < lệnh table(x) >, tần suất < prop.table(x) > , tần số tích
lũy và tần suất tích lũy < cumsum(table(x)) và cumsum(prop.table(x)) >
>>Cách chia tổ cho DL định lượng
>>Các loại biểu đồ cho DL định tính, định lượng : sử dụng sao cho phù hợp với yêu cầu và
dữ liệu của đề bài . Cách nhận xét biểu đồ
>>Các đại lượng thống kê mô tả dùng cho DL véc tơ và cách nhận xét kết quả thu được.
Lưu ý:
>>> Lệnh vẽ biểu đồ có rất nhiều tham số mặc định ,khi vẽ nếu không có yêu cầu gì thêm
chỉ cần chú ý đến những tham số cơ bản nhất ,tránh rườm rà ,đơn giản hóa câu lệnh.
>>>Phần dữ liệu định tính chỉ áp dụng dụng được một đại lượng thống kê mô tả duy nhất
,đó là Mode .Cách tìm Mode <chung cho cả 2 loại DL> :
>which( table(x)==max(table(x)) )
Eg:
> x=c(1,1,2,2,2,5,5,5,5)
> which(table(x)==max(table(x)))
5
3 # 5,3 ?
> table(x)
x
1 2 5
2 3 4

>library(BSDA) <gọi thư viện BSDA>
>>>Khi ước lượng khoảng tin cậy hay kiểm định về TB của tổng thể (1 hoặc 2) cần xét
xem bài toán rơi vào trường hợp nào để dùng các lệnh z.test(),zsum.test() , t.test() hay
tsum.test() cho phù hợp .
>>>>Xây dựng cặp giả thuyết H0,H1 cho phù hợp: Giả thuyết bao gồm dấu = (giống
nhau,như nhau, không nhỏ hơn, không lớn hơn ) bao giờ cũng để ở H0, và giả thuyết đối
của nó để ở H1 (khác nhau, <>,lớn hơn , nhỏ hơn).Như vậy giả thuyết cần kiểm định có
thể đặt ở H0 hoặc H1 tùy thuộc nó có bao gồm dấu = hay không!
>>>Khi dùng prop.test(x,n,p=NULL,correct=F) để tìm khoảng tin cậy cho tỷ lệ hay kiểm
định tỷ lệ một hay 2 tổng thể thì để giá trị tham số correct = F.
>>Cách viết tắt một số tham số : alternative =alt , TRUE=T, FALSE=F, “greater” = “g”,
“less”=”l”, “two.sided”=”t” ( mặc định là kiểm định 2 phía nên có thể bỏ qua tham số alt=”t”
nếu muốn kiểm định 2 phía !)
>>>Khi kiểm định trung bình 2 tổng thể :
- Trong trường hợp dùng hàm tsum.test( ) thì lưu ý có thêm tham số var.equal ,mặc định
var.equal=TRUE ;nghĩa là giả thiết 2 tổng thể có phương sai bằng nhau
Have a good exam! It’s not so difficult as you expected ! 2
- Trong trường hợp dùng hàm t.test( ) thì có thêm 2 tham số paired và var.equal để
thể hiện lấy mẫu độc lập hay theo cặp và có giả thiết gì về phương sai 2 tổng thể hay
không. Mặc định paired=F và var.equal=F , tức lấy mẫu độc lập và 2 phương sai tổng thể
khác nhau . Tùy vào đề bài mà xem xét có điều chỉnh giá trị các tham số nàu không !
*** V> Phần kiểm định Phi Tham số :
>>>Kiểm định Khi-bình phương :
- Về tính độc lập :Dữ liệu liên hệ giữa 2 tính chất được thể hiện trong một ma trận
H0:2 tính chất cần kiểm định là độc lập
H1:2 tính chất đó phụ thuộc
Lệnh trong R : > chisq.test(X)
Với X là : ma trận những giá trị trong mẫu
-Về sự phù hợp :
H0: Sự kiện xảy ra phù hợp với quy luật thông thường , tức p= p0


Các câu lệnh trong R :
Với x,y :tập dữ liệu mẫu tương ứng với biến độc lập và phụ thuộc

>lm(y~x) # Xác định đường hồi quy mẫu
>summary(lm(y~x)) # Các kết quả phân tích
>confint(lm(y~x),level=) # Khoảng tin cậy cho hệ số beta_0 , beta_1 với độ tin cậy
cân xứng level (mặc định=0.95).
>predict(lm(y~x),newdata,interval= , level= , )
# newdata : là dữ liệu data.frame chứa giá trị mới của x cần xử lý ,nếu không có tham số
này thì sẽ xử lý trên véc tơ x đã nhập .
# Nếu interval = “ confidence” : tìm khoảng tin cậy cho trung bình y khi x nhận giá trị
trong newdata
# Nếu interval = “ prediction: : tìm khoảng dự báo cho giá trị(thực) của y khi x nhận giá trị
trong newdata.
# level : độ tin cậy cân xứng trong phép xử lý (mặc định =0.95)
>plot(x,y) # Vẽ biểu đồ tán xạ thể hiện mối quan hệ giữa hai biến
>abline(lm(y~x)) # Vẽ thêm đường hồi quy mẫu vào biểu đồ trên
>>>> Eg:
> x=1:10
> y=c(2,3,4,5,7,8,9,13,16,18)
> lm(y~x)
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
-1.267 1.776
# Các hệ số ( Coefficients ) :
(Intercept) :beta_0 = -1.267
x : beta_1 = 1.776

lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-2.164e+00 -7.803e-01 -2.082e-16 1.142e+00 1.509e+00
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.2667 0.9150 -1.384 0.204
x 1.7758 0.1475 12.042 2.09e-06 ***

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.339 on 8 degrees of freedom
Multiple R-squared: 0.9477, Adjusted R-squared: 0.9412
F-statistic: 145 on 1 and 8 DF, p-value: 2.087e-06
### Cách đọc các giá trị trong lệnh summary() :độ tin cậy mặc định 95%
>> Residuals : là giá trị phần dư , các đại lượng thống kê cho nó được liệt kê ở dưới
>>>> Coefficients : Các hệ số :
- beta_0 : giá trị ước đoán (Estimate ) -1.2667 , sai số chuẩn (Std. Error ) : 0.9150 , t-
value :-1.384
- beta_1 : giá trị ước đoán : 1.7758 , sai số chuẩn : 0.1475 , t-value : 12.042
Have a good exam! It’s not so difficult as you expected ! 5
Lưu ý : giá tri t (t-value) dùng để kiểm định về độ dốc của đường hồi quy (hay beta_1)
>> Residual standard error : Sai số chuẩn của phần dư : là 1.339 với 8 bậc tự do (=n-2 , ở
đây n=10 và chiều dai véc tơ nhập x,y )
>>>> Multiple R-squared : Là hệ số xác định R^2 : 0.9477
Adjusted R-squared : Hệ số xác định đã điều chỉnh : 0.94124 (nhỏ hơn R^2)
>> F-statistic: 145 on 1 and 8 DF, p-value: 2.087e-06 : Thống kê toàn diện F (xem qua)

> plot(x,y)
> abline(lm(y~x))
# Lệnh vẽ :

x1 x2
1 1 1.5
2 2 3.5
3 5 7.0
Không có các lệnh vẽ trong trường hợp này !

* VII > Phần phân tích phương sai :
Xem qua !

Ghi chú :
Các dấu * (từ * đến *** ) đại diện cho tầm quan trọng của mỗi phần mục lớn.
Các dấu > ( từ >> đến >>>> ) biểu hiện cho mức độ quan trọng của các mục nhỏ.
Dấu > đứng độc lập : biểu diễn câu lệnh trong R !!!
Have a good exam! It’s not so difficult as you expected ! 7


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status