PHƯƠNG PHÁP LUẬN TRONG NGHIÊN CỨU KHOA HỌC Y HỌC PHẦN 5 - Pdf 17


64
KIỂM ĐỊNH CÁC GIẢ THIẾT THỐNG KÊ VÀ CÁC QUY
LUẬT PHÂN PHỐI TRONG NGHIÊN CỨU

Trong nghiên cứu dù là mô tả hay phân tích người ta đều cần phải so sánh các kết
quả nghiên cứu với nhau hoặc với hằng số tương ứng xem có sự trùng lặp hoặc khác
nhau hay không? Cũng như xem khả năng can thiệp nào sẽ đem lại hiệu quả tất hơn?
Trong nghiên cứu kiểm định người ta thường dùng hai loại test là test t và test χ
2
(test
khi bình phương).
1. Kiểm định bằng test “t”
Thử nghiệm này thường dùng để kiểm định các trị số trung bình, các tỷ lệ quan
sát của mẫu nghiên cứu trên cơ sở các số liệu mang tính chất hệ thống hoặc mẫu lớn.
1.1 So sánh hai số trung bình quan sát
Vấn đề này thường gặp trong nghiên cứu y sinh học.

Nếu mẫu nghiên cứu có n nhỏ hơn 30 thì công thức tính t sẽ là:

Sau khi tính được trị số “t” ta cần tìm độ tự do rồi tra bảng “t” để tìm giá trị xác
suất p. Độ tự do được tính bằng tích của từng các dữ liệu so sánh (số cột) trừ 1 nhân
với tổng các số liệu so sánh ở mỗi cột (hàng) trừ 1. Tuy vậy, dù độ tự do bằng bao
nhiêu (→ ∞) thì xác suất đều đạt được p < 0,05 khi t > 1,96 (ít nhất là khi n > 30).
Khi đặt vấn đề nghiên cứu, ta có thể đặ
t giả thuyết H
0
(null hypothesis) là giả
thiết cho rằng hai số trung bình nằm trong sự chi phối của quần thể, nên không khác
nhau hoặc tương tự như nhau.
Sau đó nhờ thử nghiệm bằng test “t” hoặc “χ

1.2. So sánh một số trung bình quan sát với một số trung bình lý thuyết
Trường hợp này thường gặp trong so sánh với hằng số sinh học hoặc một nghiên
cứu lớn nào trước đó cho ta
X lý thuyết và S lý thuyết, công thức tính như sau:

Trong đó:
X
qs
: X quan sát
X lt: X lý thuyết
X lt = S lý thuyết
Nếu n < 30 ta có công thức sau:

Sau khi tìm được “t” ta cũng tra bảng và xem xét, đánh giá như test “t” ở phần
“ So sánh hai số trung bình quan sát”. Nếu t ≥ 1,96 ⇒ bác bỏ H
0
với mức ý nghĩa
thống kê P ≤ 0,05. Nếu t < 1,96 ⇒ chấp nhận H
0
với mức ý nghĩa thấp,
(p > 0,05).
1.3. So sánh hai tỷ lệ quan sát
Khi nghiên cứu bệnh lý có thể cho các tỷ lệ cũng như các nghiên cứu mẫu lớn có
tỷ lệ, ta có thể tính “t” theo công thức sau:

66

* P
A
và P

Σ
Tiếp xúc (exp +) a b a + b
Không tiếp xúc (exp -) c d c + d
Σ
a
+ c b + d a + b + c + d (N)

67
Trong công thức o
i
là các trị số quan sát a, b, c, d. Còn e
i
là các trị số tần số lý
thuyết (trị số mong đợi) tương ứng với các ô: a, b, c, d.
Cách tính tần số lý thuyết như sau:
Tổng hàng x tổng cột
e
i
=
Tổng chung (N)
Ví dụ:
(a+c)x(a+b)
e
i
=
N
Công thức cụ thể trong trường hợp bảng 4 ô sẽ là:

Nếu có nhiều hàng cột thì phải tính χ
2

.
Trước hết ta tính các trị số (tần sô) lý thuyết và sẽ có: 68
Ở đây bậc tự do bằng 1 nên ta thấy nếu χ
2
= 3,841 mới có p = 0,05, do vậy tỷ lệ
lợn nuôi khoẻ mạnh và bị bệnh của hai lô giống nhau hoặc là loại lá cây không có giá
trị phòng bệnh lở mồm long móng nên tỷ lệ bệnh tương tự như nhau.
Nếu tần số lý thuyết e
i
nhỏ hơn 5 thì công thức tính χ
2
có thể ứng dụng ở dạng
sau:

3. Số đo kết hợp nhân quả
Để đánh giá nguy cơ phơi nhiễm (expose) với các yếu tố nguy cơ sẽ gây nên hậu
quả bệnh lý hay không, qua bảng tiếp liên (expose và disease) ta có thể xác định được
các số đo kết hợp nhân quả sau đây:
3.1. Chỉ số nguy cơ tương đối (Relative Risk = RR)
Chỉ số này kiểm định một giả thiết nhân quả, xem có đúng là có sự kết hợp gi
ữa
một yếu tố nguy cơ và một bệnh tương ứng. Chỉ số này được ứng dụng trong nghiên
cứu thuần tập và nếu như có kết hợp thì sự kết hợp đó phải được đánh giá mức độ lớn
hay nhỏ. Nguy cơ tương đối RR được tính bằng công thức sau:
Tỷ lệ mắc trong nhóm phơi nhiễm I
c


Ví dụ: Nguy cơ gây nên bệnh A có thể có rất nhiều yếu tố
tiếp xúc X, Y, Z khi
tính AR ta được:
AR
X
= 1,6
AR
V
= 1,4
AR
Z
= 0,7
Ta kết luận nguy cơ X là chỉ số cao nhất, tác động mạnh hơn các yếu tố khác còn
lại.
Nguy cơ quy thuộc phần trăm (AR%) cũng thường được sử dụng.
Công thức tính như sau:

Trong một số nghiên cứu, nếu gặp sự nghi ngờ với số liệu mà ta cho là chưa chắc
chắn hoặc không theo dõi được, phân biệt được chính xác thì AR% có thể được tính
theo công thức sau:

Nguy cơ quy thuộc trong quần thể (Population Attributable Risk) (PAR)
PAR được tính bằng tỷ suất của hiệu số mới mắc ít trong quần thể toàn bộ và số
mới mắc ro trong các cá thể không phơi nhiễm và số mới mắc I
i
trong quần thể toàn
bộ.

Tương tự:


Một nghiên cứu về ảnh hưởng của hoá chất bảo vệ thực vật đối với các rối loạn
thần kinh thực vật được tiến hành theo dõi 2 năm từ những người khoẻ mạnh và chia
làm hai nhóm. Nhóm thứ nhất có 368 người trực tiếp phun hóa chấ
t bảo vệ thực vật
cho rau màu, sau hai năm xuất hiện 75 người bị bệnh. Nhóm thứ hai có 327 người ở
cùng khu vực song tiếp xúc với hóa chất bảo vệ thực vật bất kỳ dạng nào, sau hai năm
chỉ xuất hiện 19 người bị bệnh. Phải chăng hóa chất bảo vệ thực vật có phải là nguy cơ
và có mối liên quan đối với các rối loạn thần kinh thực vật
ở người tiếp xúc?
Với dữ kiện đã cho ở 2 bài toán trên ta cần phải chọn xem phương pháp kiểm
định nào sẽ giúp ta đánh giá sự khác biệt hoặc có liên quan hay không giữa các nhóm
số liệu nghiên cứu đã thu được? Tuy nhiên dù phương pháp nào ta cũng cần đặt giả
thuyết (Ha) hoặc (Ho) sau đó mới chứng minh. Nếu dùng test “t” thì cần thiết phải xác
định các giá trị trung bình, độ phân tán của các số liệu nghiên cứu đã thu được sau đó
lập bảng tính mà trong đó các cột sẽ tương ứng với các thành phần, tổ hợp nhỏ nhất
trong công thức. Nếu dùng test χ
2
tq
thì việc lập bảng tiếp liên đóng vai trò hết sức quan
trọng. Nếu lập bảng tiếp liên đúng thì coi như công việc kiểm định đã hoàn thành 30%.
Tuy nhiên ở bài toán 2 ta cần xác định chỉ số nguy cơ tương đối trước để kết luận xem:
“Phải chăng hóa chất bảo vệ thực vật có phải là nguy cơ đối với các rối loạn thần kinh

71
thực vật ở người tiếp xúc?”.
Kết quả thu được ta sẽ tra bảng “t” hoặc “χ
2
” để xác định xác suất P và kết luận.
Một điểm cần lưu ý là phải kết luận chính xác song vẫn ở mức an toàn bởi nghiên cứu
của chúng ta thường là có cỡ mẫu tối thiểu nên có rất nhiều yếu tố nhiễu xen vào vì thế

1
, X
2
,… X
n
có thể xem như mẫu của một tập hợp
tổng quát 2 (hoặc n) chiều với luật phân bố chuẩn.
2- Giá trị của quan trắc không phụ thuộc vào giá trị những quan trắc trước và sau.
Chúng là các giá trị độc lập, ngẫu nhiên.
3- Khi thay đổi định lượng X
i
+ 1, phương sai của đại lượng ngẫu nhiên X
i

không đổi hoặc tỷ lệ với một hàm số đã xét nào đó của X
i
+ 1.
4- Kỳ vọng toán học nào đó của đại lượng X
i
, khi X
i
+ 1 nhận được một giá trị
xác định, có thể biểu diễn dưới dạng hàm X
i
= f (x
i
+ 1), tuyến tính đối với những
tham số nhất định.
1.2.2. Hồi quy


x : Trung bình của đại lượng x
i

y
: Trung bình của đại lượng y
i

Sx, Sy: Độ lệch chuẩn của x
i
và y
i

Công thức viết lại để tính bằng máy tính bỏ túi như sau:

74

Hệ số Rxy biến thiên trong khoảng (- 1 → + 1)
* Khi Rxy = ± l, lúc này giữa x và y có một liên hệ hàm số tuyến tính, thuận (+),
nghịch (-).
* Rxy = 0, giữa x và y không có mối liên hệ nào cả.
* Khi | Rxy | càng gần 1 thì x và y có một liên hệ tương quan tuyến tính càng chặt
chẽ hơn.
Khi | Rxy | càng gần 0 thì một tương quan tuyến tính giữa x và y càng lỏng lẻo.
Người ta thường lấy các mốc sau đây để tính một liên hệ tương quan tuy
ến tính càng
chặt chẽ hay không: Rxy < 0,3; Rxy = 0,3 - 0,6; Rxy > 0,6.
Giá trị của hệ số tương quan cặp là một đại lượng ngẫu nhiên, phụ thuộc vào kích
thước mẫu. Khi kích thước mẫu giảm thì độ tin của hệ thống tương quan sẽ giam.
2.2.2. Bài toán
Nghiên cứu mỗi tương quan giữa liều độc X với độ sống sót Y của chuột nhắt

* C = A – B
Đối với mẫu số:

75

Tính cụ thể cho bài toán, được như sau:

Rxy mang giá trị (-), đây là mối tương quan ngược chiều, liều độc càng cao thì
thời gian sống sót của chuột càng giảm.
2.3. Đánh giá mức xác suất tin cậy của hệ số tương quan:
2.3.1. Công thức
Hệ số tương quan mẫu dùng làm ước lượng cho hệ số tương quan tổng thể. Như
vậy bản thân Rxy xem như đại lượng ngẫu nhiên. Do đó sẽ có một sai số được xác
định như
sau:

Trường hợp n ≤ 100, ta tính sai số Sr theo công thức sau:

Người ta dùng tỷ số giữa tương quan mẫu và sai số Sr làm tiêu chuẩn để kiểm
định giả thiết H
0
với mức ý nghĩa α nào đó.

Tính được t
tn
so sánh với ta như sau:
- Nếu t
tn
> t
α

= 0,001, hay xác suất p = 0,999.
2.4. Đánh giá mức khác biệt giữa hai hệ số tương quan
2.4.1. Công thức
Khi so sánh hệ số tương quan được xác định trên mẫu độc lập, giả thiết H
0
cho
rằng sự khác nhau của chúng là không có ý nghĩa. Kiểm định giả thiết H
0
bằng tiêu
chuẩn t
tn
được tính như sau:

Trong đó:
- t
tn
: Giá trị dùng kiểm định
- Z
l
, Z
2
đại lượng Fisher của hệ số tương quan thực nghiệm tra trong bảng Z:
Bảng biến đổi hệ số tương quan R thành trị số Z.
- n
1
và n
2
những: Kích thước mẫu 1 và mẫu 2.
Nếu t
tn

2
= 0,69 nên Z
2
= 0,848.
Tính t
tn
theo công thức (4.6) t
tn
= -1,042. Với α = 0,05. BTD = 96,
t
α
= 1,96. Như vậy t
tn
< t
α
hai trị số tương quan R
1
, R
2
không khác biệt nhau một
cách có ý nghĩa với mức ý nghĩa α đã cho.
2.5. Tương quan phi tuyến
2.5.1. Khái niệm
Khi sự liên hệ giữa x
i
và y
i
không tuân theo quan hệ tuyến tính, thì sự phụ thuộc

77

Ta nhận thấy có một số giá trị của x
i
lặp lại, nên có thể xếp như sau:
X
i
2 4 6 8
Y
x
5 6 10 7
Ta đã có các giá trị trung bình Y
i
, theo X
i
là Y x. Nếu xếp ngược lại theo Y

ta sẽ
có:
Y
i
4 4 6 7 8 8 10 12
X
i
2 4 2 8 6 4 6 6

Y
i
4 6 7 8 10 12
X
y
3 2 8 5 6 6


78
tính Y
i
. Xác định đại lượng trung bình của x và y; trung bình của y theo x và x theo y.
- Tính độ lệch riêng phần (
Y
X
- Y ) và X
Y
- X ; Tính bình phương của đại
lượng trên, tính tổng.
- Tính tổng bình phương

Thay các giá trị đã tính được vào công thức để tính ηy/x và ηx/y.
Đánh giá độ tin cậy của hệ số tương quan theo tiêu chuẩn t
α
; BTD = n - 2
Bài toán:
Nghiên cứu sự biến thiên của hai đặc điểm x và y có kết quả như sau:
X
1
17 17 18 18 18 18 20 20 23 23
Y
1
12 13 13 14 14 15 16 16 13 14
Hãy tính hệ số tương quan phi tuyến của hai đặc tính trên.
Bài giải
Lập bảng tính như sau:
Bảng tính các giá trị trung gian của bài toán

) thực nghiệm.
- Bước 2: Từ công thức
Y -
Y = a(X- X ) ta khai triển ra xác định a, y (y = ax + b hay b = y - ax). Đây là
phương trình biểu diễn crường thẳng D. Đặc điểm của đường thẳng D là cắt trục tung
tại b khi x = 0, cắt trục hoành tại x = -b/a khi y = 0. Tính I (0;b); J (-b/a; 0).
2.6.3. Ví dụ
Lấy lại ví dụ bài toán (ở phần 2.2.2.) tính được a = -0,66; b = 4,015
y = 0 66 X + 4,015
I (0; 4,015); J (6,083; 0).
Bảng: Tính giá trị lý thuyết của tương quan giữa X và Y
X 0 1 2 3 4 5 6
Y
tn
4,25 3 3 1,75 1,5 0,5 0,25
Y
it
4,015 3,355 2,695 2,935 1,375 0,715 0,055
Chú ý:
D chỉ là đoạn thẳng thoả mãn điều kiện của bài toán thực tế. Toàn bộ đường
thẳng biểu diễn phương trình tính được có thể không thoả mãn điều kiện của bài toán.

Đồ thị dạng tương quan Y = ax - b 80
2.6.4. Một số dạng hồi quy khác
+ Hồi quy biểu thị bằng phương trình hàm mũ: Khi sự phụ thuộc tuân theo quy
luật cấp số nhân, nó được mô tả bởi phương trình mũ như sau:
y = a.b

bội trong khoảng (0; 1); Chú ý rằng Rx,y,z = 0, các đặc điểm không có tương quan.
2.7.2. Tương quan riêng phần
+ Công thức: Khi mối quan hệ phụ thuộc với các đại lượng khác được loại trừ
chỉ còn quan hệ phụ thuộc giữa hai đại lượng, được gọi là quan hệ riêng phần. Chẳng
hạn ta cố định yế
u tố z, sẽ có:

Trong công thức Rxy (z) là tương quan riêng phần của x và y khi không có mặt
của z. Tương tự ta có hai hệ số còn lại như sau:

82
+ Khi cố định y:

+ Khi cố định x:

Hệ số tương quan riêng phần có cùng ý nghĩa tính chất như hệ số tương quan
cặp.
+ Tiêu chuẩn kiểm định
Sử dụng tiêu chuẩn t để kiểm định giả thiết về sự biến đổi không phụ thuộc giữa
2 đặc điểm khi loại trừ đặc điểm thứ 3 bằng tỷ số sau:

Trong đó:
n - kích thước mẫu
m - số đặc điểm tính Rrp (tương quan riêng phần).
Nếu t
tn
> t
α
mức ý nghĩa α cho trước, BTX = n - 3. Khi đó hai đặc điểm không có
mối tương quan.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status