Tài liệu Kiểm định giả thiết thống kê và ý nghĩa của trị số P(P-value) - Pdf 84


1
7
Kim đnh gi thit thng kê
và ý ngha ca tr s P (P-value)
7.1 Tr s P

Trong nghiên cu khoa hc, ngoài nhng d kin bng s, biu đ và hình nh,
con s mà chúng ta thng hay gp nht là tr s P (mà ting Anh gi là P-value). Trong
các chng sau đây, bn đc s gp tr s P rt nhiu ln, và đi đa s các suy lun phân
tích thng kê, suy lun khoa hc đu da vào tr s P. Do đó, trc khi bàn đn các
phng pháp phân tích thng kê bng R, tôi thy cn phi có đôi li v ý ngha ca tr s
này.

Tr s P là mt con s xác sut, tc là vit tt ch “probability value”. Chúng ta
thng gp nhng phát biu đc kèm theo con s, chng hn nh “Kt qu phân tích
cho thy t l gãy xng trong nhóm bnh nhân đc điu tr bng thuc Alendronate là
2%, thp hn t l trong nhóm bnh nhân không đc cha tr (5%), và mc đ khác bit
này có ý ngha thng kê (p = 0.01)”, hay mt phát biu nh “Sau 3 tháng điu tr, mc đ
gim áp sut máu trong nhóm bnh nhân là 10% (p < 0.05)”. Trong vn cnh trên đây,
đi đa s nhà khoa hc hiu rng tr s P phn ánh xác sut s hiu nghim ca thuc
Alendronate hay mt thut điu tr, h hiu rng câu vn trên có ngha là “xác sut mà
thuc Alendronate tt hn gi dc là 0.99” (ly 1 tr cho 0.01). Nhng cách hiu đó
hoàn toàn sai!

Trong “T đin toán kinh t thng kê, kinh t lng Anh – Vit” (Nhà xut bn
Khoa hc và K thut, 2004), tác gi đnh ngha tr s P nh sau: “P – giá tr (hoc giá
tr xác sut). P giá tr là mc ý ngha thng kê thp nht mà  đó giá tr quan sát đc

màu đen” có th b bác b nu ta tìm ra có mt con qu màu đ.

Có th xem qui trình phn nghim là mt cách hc hi t sai lm! Tht vy, trong
khoa hc chúng ta hc hi t sai lm. Khoa hc phát trin cng mt phn ln là do hc
hi t sai lm mà gii khoa hc không ai chi cãi. Sai lm là đim mnh ca khoa hc.
Có th xác đnh nghiên cu khoa hc nh là mt qui trình th nghim gi thuyt, theo các
bc sau đây:

Bc 1, nhà nghiên cu cn phi đnh ngha mt gi thuyt đo (null hypothesis),
tc là mt gi thuyt ngc li vi nhng gì mà nhà nghiên cu tin là s tht. Thí d
trong mt nghiên cu lâm sàng, gm hai nhóm bnh nhân: mt nhóm đc điu tr bng
thuc A, và mt nhóm đc điu tr bng placebo, nhà nghiên cu có th phát biu mt
gi thuyt đo rng s hiu nghim thuc A tng đng vi s hiu nghim ca placebo
(có ngha là thuc A không có tác dng nh mong mun).

Bc 2, nhà nghiên cu cn phi đnh ngha mt gi thuyt ph (alternative
hypothesis), tc là mt gi thuyt mà nhà nghiên cu ngh là s tht, và điu cn đc
“chng minh” bng d kin. Chng hn nh trong ví d trên đây, nhà nghiên cu có th
phát biu gi thuyt ph rng thuc A có hiu nghim cao hn placebo.

Bc 3, sau khi đã thu thp đy đ nhng d kin liên quan, nhà nghiên cu dùng
mt hay nhiu phng pháp thng kê đ kim tra xem trong hai gi thuyt trên, gi
thuyt nào đc xem là kh d. Cách kim tra này đc tin hành đ tr li câu hi: nu
gi thuyt đo đúng, thì xác sut mà nhng d kin thu thp đc phù hp vi gi thuyt
đo là bao nhiêu. Giá tr ca xác sut này thng đc đ cp đn trong các báo cáo
khoa hc bng kí hiu “P value”. iu cn chú ý  đây là nhà nghiên cu không th
nghim gi thuyt khác, mà ch th nghim gi thuyt đo mà thôi.

Bc 4, quyt đnh chp nhn hay loi b gi thuyt đo, bng cách da vào giá
tr xác sut trong bc th ba. Chng hn nh theo truyn thng la chn trong mt

xy ra là bao nhiêu? Do đó, lí thuyt xác sut nh phân có phn ng dng trong trng
hp này, bi vì kt qu ca nghiên cu ch có hai “giá tr” (hoc là thích A, hoc thích
B).

Nói theo ngôn ng ca phn nghim, gi thit đo là nu không có s khác bit v
s thích, xác sut mà mt khách hàng a chung mt loi cà phê là 0.5. Nu gi thit này
là đúng (tc p = 0.5, p  đây là xác sut thích cà phê A), và nu nghiên cu trên đc lp
đi lp li (chng hn nh) 1000 ln, và mi ln vn 50 khách hàng, thì có bao nhiêu ln
vi 35 khách hàng a chung cà phê A? Gi s ln nghiên cu mà 35 (hay nhiu hn)
trong s 50 thích cà phê A là “bin c” X, nói theo ngôn ng xác sut, chúng ta mun tìm
P(X | p=0.50) =?

 tr li câu hi này, chúng ta có th ng dng hàm rbinom đ mô phng vì
nh nói trên thc cht ca vn đ là mt phân phi nh phân:

> bin <- rbinom(1000, 50, 0.5)

Trong lnh trên, chúng ta yêu cu R mô phng 1000 ln nghiên cu, mi ln có 50 khách
hàng, và theo gi thit đo, xác sut thích A là 0.50.  bit kt qu ca mô phng đó,
chúng ta s dng hàm table nh sau:

> table(bin)

4
bin
14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
1 1 2 11 16 24 47 60 83 94 107 132 114 98 65 44 44 26 14 12

34 35
2 3

31 5 7 1

Ln này, chúng ta có nhiu kh nng hn (vì s ln mô phng tng lên). Chng hn nh
có th có nghiên cu cho ra 11 khách hàng (ti thiu) hay 40 khách hàng (ti đa) thích cà

5
phê A. Nhng chúng ta mun bit s ln nghiên cu mà 35 khách hàng tr lên thích cà
phê A, và kt qu trên cho chúng ta bit, xác sut đó là:

> (223+98+21+5+7+1)/100000
[1] 0.00355

Nói cách khác, xác sut P(X ≥ 35 | p=0.50) quá thp (ch 0.3%), chúng ta có bng
chng đ cho rng kt qu trên có th không do các yu t ngu nhiên gây nên; tc có
mt s khác bit v s thích ca khách hàng đi vi hai loi cà phê.

Con s P = 0.0035 chính là tr s P. Theo mt qui c khoa hc, tt c các tr s
P thp hn 0.05 (tc thp hn 5%) đc xem là “significant”, tc là “có ý ngha thng
kê”.

Cn phi nhn mnh mt ln na đ hiu ý ngha ca tr s P nh sau: Mc đích
ca phân tích trên là nhm tr li câu hi: nu hai loi cà phê có xác sut a chung
bng nhau (p = 0.5, gi thuyt đo), thì xác sut mà kt qu trên (35 trong s 50 khách
hàng thích A) xy ra là bao nhiêu? Nói cách khác, đó chính là phng pháp đi tìm tr s
P. Do đó, din dch tr s P phi có điu kin, và điu kin  đây là p = 0.50. bn đc có
th làm thí nghim thêm vi p = 0.6 hay p = 0.7 đ thy kt qu khác nhau ra sao.

Trong thc t, tr s P có mt nh hng rt ln đn s phn ca mt bài báo khoa
hc. Nhiu tp san và nhà khoa hc xem mt nghiên cu khoa hc vi tr s P cao hn
0.05 là mt “kt qu tiêu cc” (“negative result”) và bài báo có th b t chi cho công


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status