ĐỒ ÁN MÔN HỌC CÔNG NGHỆ THỰC PHẨM ỨNG DỤNG CỦA THỐNG KÊ BAYESIAN TRONG PHÉP THỬ PHÂN BIỆT - Pdf 25

GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
MỤC LỤC
MỤC LỤC 1
I. TỔNG QUAN VỀ PHÉP THỬ PHÂN BIỆT TRONG ĐÁNH GIÁ CẢM
QUAN [1] [3] 3
1. Sơ lược về đánh giá cảm quan 3
2. Phép thử phân biệt 3
II. TỔNG QUAN VỀ PHƯƠNG PHÁP THỐNG KÊ BAYESIAN 5
[2] [9] [10] [11] 5
1.Nguồn gốc 5
2. Nội dung 5
3. Ý nghóa 8
4. Ứng dụng 8
III. CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ
PHÂN BIỆT [1] [2] [4] 8
1. Nguyên tắc chung 8
Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H0 và H theo
nguyên tắc xử lý số liệu trong phép thử phân biệt 10
2. Các phương pháp xử lý số liệu trong phép thử phân biệt 10
Nếu giả thiết H0 đúng (Hai sản phẩm không khác nhau về tính chất cảm quan),
gọi xác suất người thử trả lời đúng trong mỗi phép thử là p. Ta có trong phép
thử: 12
2.2.2. Ý nghóa 13
2.3.1. Nội dung 13
2.3.2. Ý nghóa 14
3. Nhận xét 14
IV. CÁCH XỬ LÝ SỐ LIỆU TRONG PHÉP THỬ PHÂN BIỆT BẰNG
PHƯƠNG PHÁP THỐNG KÊ BAYESIAN [6] 15
1. Phương pháp xử lý số liệu theo thống kê Bayesian 15
Khác với các phương pháp nêu trên xem xác suất đưa ra câu trả lời đúng của
người thử hay tỉ lệ trả lời đúng (ký hiệu p) là hằng số chưa biết, thống kê

QUAN [1] [3]
1. Sơ lược về đánh giá cảm quan
1.1. Đònh nghóa
“Đánh giá cảm quan là phương pháp khoa học được sử dụng để gợi lên, đo đạc,
phân tích và giải thích cảm giác đối với các sản phẩm vốn được nhận biết thông qua các
giác quan: thò giác, khứu giác, xúc giác, vò giác và thính giác.”
(Stone & Sidel – ASTM)
1.2. Các phương pháp đánh giá cảm quan
Nhìn chung, tất cả các phương pháp đều dựa trên phép xử lý thống kê các thông tin
thu thập được từ người thử. Mỗi phép thử là tập hợp các đánh giá riêng lẻ của mỗi người
tham gia, được sắp xếp theo một phương thức đã đònh trước phù hợp với các phép toán
thống kê.
 Phép thử phân biệt: Tìm hiểu xem các sản phẩm giống hay khác nhau.
 Phép thử mô tả: Tìm hiểu xem cường độ của các tính chất cảm quan là bao nhiêu.
 Phép thử thò hiếu: Tìm hiểu xem các sản phẩm có được ưa thích không, loại sản
phẩm nào hay tính chất cảm quan nào được ưa thích nhất.
1.3. Các nguyên tắc cơ bản trong đánh giá cảm quan
 Sự vô danh của các mẫu đánh giá: Người thử không bò ảnh hưởng bởi bất kì thông
tin nào của sản phẩm ngoại trừ tính chất cảm quan.
 Sự độc lập của các câu trả lời: Ý kiến của những người thử là độc lập với nhau.
 Kiểm soát điều kiện thí nghiệm: Các điều kiện thí nghiệm khác nhau sẽ cho các kết
quả thí nghiệm khác nhau. Các thí nghiệm cảm quan phải luôn được thực hiện
trong phòng thí nghiệm cảm quan, không thực hiện trong phân xưởng sản xuất hay
nhà máy.
1.4. Vai trò của đánh giá cảm quan
Đánh giá cảm quan cho phép giải quyết những bận tâm của nhà sản xuất thực
phẩm trong các quá trình kiểm tra nguyên liệu, quá trình sản xuất, đánh giá ảnh hưởng
của các yếu tố công nghệ và kỹ thuật đến sản phẩm cuối cùng, cũng như xác đònh mối
quan hệ giữa bao bì và chất lượng, xác đònh thời gian sống của sản phẩm và cuối cùng là
phát triển sản phẩm mới.

Có hai mẫu thử được giới thiệu, người thử phải xác đònh hai mẫu này giống hay
khác nhau.
Trình bày mẫu: 4 tổ hợp AA, BB, AB, BA, số lần xuất hiện của mỗi tổ hợp là như
nhau cho cả nhóm người thử.
• Tam giác:
Có ba mẫu thử được giới thiệu, hai mẫu là giống nhau (được chuẩn bò từ một loại
sản phẩm), mẫu thứ ba được giả đònh là khác hai mẫu còn lại và được chuẩn bò từ một loại
sản phẩm khác, người thử phải xác đònh mẫu không lặp lại trong số ba mẫu thử (mẫu khác
với hai mẫu còn lại).
Trình bày mẫu: 6 tổ hợp AAB, ABA, ABB, BAB, BBA, BAA, số lần xuất hiện của
mỗi tổ hợp là như nhau cho cả nhóm người thử.
2.2.3. Phép thử 2-AFC (cặp đôi) và 3-AFC
 Mục đích: Xác đònh sự khác nhau giữa hai sản phẩm về một tính chất cảm quan
xác đònh.
 Nguyên tắc:
• 2-AFC (cặp đôi):
Có hai mẫu thử được giới thiệu, người thử phải xác đònh mẫu nào có cường độ cảm
giác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn mẫu còn lại.
SVTH: Nguyễn Ngọc Bảo Trân Trang 4
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Trình bày mẫu: 2 tổ hợp AB, BA, số lần xuất hiện của mỗi tổ hợp là như nhau cho
cả nhóm người thử.
• 3-AFC:
Có ba mẫu thử được giới thiệu, người thử phải xác đònh mẫu nào có cường độ cảm
giác về một chỉ tiêu cụ thể lớn hơn hoặc bé hơn hai mẫu còn lại.
Trình bày mẫu: hai nhóm (AAB, ABA, BAA) và (ABB, BAB, BBA), trong phép
thử này chỉ có một trong hai nhóm (mỗi nhóm gồm 3 tổ hợp của hai mẫu) được giới thiệu,
số lần xuất hiện của mỗi tổ hợp là như nhau cho cả nhóm người thử.
2.3. Nhóm người đánh giá cảm quan (người thử)
• Thường là người tiêu dùng bình thường đã qua sử dụng sản phẩm.

hiện phép thử, ký hiệu là Φ.
• Sự kiện chắc chắn: là sự kiện luôn xảy ra khi thực hiện phép thử, ký hiệu là Ω.
• Sự kiện ngẫu nhiên: là sự kiện có thể xảy ra hoặc không xảy ra tùy thuộc vào
từng phép thử.
 Hai sự kiện A và B gọi là “xung khắc” nếu A.B = Φ.
 Các sự kiện A
1
, A
2
, … , A
n
gọi là “đôi một xung khắc” nếu hai sự kiện khác nhau
bất kỳ trong đó đều xung khắc, tức là: A
i
.A
j
= Φ với mọi i ≠ j.
 Các sự kiện A
1
, A
2
, … , A
n
gọi là “một nhóm đầy đủ các sự kiện” nếu chúng đôi
một xung khắc và ít nhất một trong chúng chắc chắn xảy ra, tức là:
A
i
.A
j
= Φ với mọi i ≠ j và A

ABP
BAP =
(CT II.2.1)
Với P(AB) = P(A/B).P(B) = P(B/A).P(A) (CT II.2.2)
• Công thức xác suất đầy đủ:
Cho A
1
, A
2
, … , A
n
là một nhóm đầy đủ các sự kiện. Với mọi sự kiện B ta có:
P(B) = P(A
1
).P(B/A
1
) + P(A
2
).P(B/A
2
) + … + P(A
n
).P(B/A
n
)(CT II.2.3)
• Công thức Bayes:
Dạng đơn giản:
)(
)()./(
)/(

hiện phép thử, dùng để kiểm đònh giả thiết H.
• P(H) được gọi là “xác suất tiên nghiệm” (prior probability) của H.
• P(D/H) hay P(E/H) được gọi là “xác suất có điều kiện” (conditional
probability) của việc quan sát thấy dữ kiện D hay bằng chứng E nếu biết rằng
giả thiết H là đúng.
• P(D) hay P(E) được gọi là “xác suất của D hay E”: xác suất của việc chứng
kiến dữ kiện mới D hay bằng chứng mới E dưới tất cả các giả thiết loại trừ
nhau đôi một (một nhóm đầy đủ các giả thiết).
• P(H/D) hay P(H/E) được gọi là “xác suất hậu nghiệm” (posterior probability)
của H nếu biết D hay E.
Từ đó ta cũng thu được các công thức:
• Công thức Bayes nhằm điều chỉnh xác suất của giả thiết theo các dữ kiện hay
bằng chứng mới:

)/().()/().(
)()/(
)(
)()/(
)/(
notHDPnotHPHDPHP
HPHDP
DP
HPHDP
DHP
+
==
(CT II.2.6)
• Với 2 dữ kiện “độc lập” D
1
và D

/notH) = P(D
1
/notH).P(D
2
/notH)
Đònh lý Bayes được sử dụng lặp đi lặp lại hàm ý rằng:
)().(
)()/()./(
),/(
21
21
21
DPDP
HPHDPHDP
DDHP =
 Ví dụ:
Tỉ lệ người nghiện thuốc lá ở một vùng là 30%. Tỉ lệ người bò viêm họng trong số
những người nghiện là 60%, còn tỉ lệ người bò viêm họng trong số những người không
nghiện là 40%.
Lấy ngẫu nhiên một người thấy rằng người ấy bò viêm họng. Tính xác suất người
ấy ngiện thuốc.
 Giải:
Gọi H: sự kiện nghiện thuốc và notH: sự kiện không nghiện thuốc.
D: sự kiện viêm họng.
SVTH: Nguyễn Ngọc Bảo Trân Trang 7
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Ta có: P(H) = 0,3; P(notH) = 0,7; P(DH) = 0,6; P(DnotH) = 0,4
Suy ra xác suất người viêm họng bò nghiện thuốc: (CT II.2.6)
39130
40706030

hay bằng chứng đối với mức độ tin tưởng vào giả thiết. Nếu rất có khả năng quan sát được
bằng chứng khi giả thiết đang xét là đúng, thì tỉ số này sẽ có giá trò lớn. Khi nhân “xác
suất tiên nghiệm” của giả thiết với tỉ số này, ta được một xác suất hậu nghiệm lớn của giả
thiết khi có bằng chứng. Nhờ đó, trong suy luận Bayes, đònh lý Bayes đo được mức độ mà
dữ kiện hay bằng chứng mới sẽ làm thay đổi sự tin tưởng vào một giả thiết.
4. Ứng dụng
Phương pháp thống kê Bayesian được ứng dụng rộng rãi trong nhiều lónh vực khác
nhau như:
• Trong quản lý dựa án, trong xây dựng: Dự báo, đánh giá rủi ro về tiến độ, kinh
phí, chất lượng, tai nạn lao động…
• Trong y học: Kiểm tra hiệu quả của thuốc và ảnh hưởng của nó trên các đối
tượng khác nhau, dự đoán tỉ lệ người mắc một loại bệnh nào đó, …
• Trong đánh giá cảm quan.
v.v…
III. CÁCH XỬ LÝ SỐ LIỆU THƯỜNG DÙNG TRONG PHÉP THỬ
PHÂN BIỆT [1] [2] [4]
1. Nguyên tắc chung
 Nguyên tắc xử lý số liệu trong phép thử phân biệt thường được tiến hành theo các
bước sau:
• Đề ra giả thiết chính H: “Hai sản phẩm khác nhau về tính chất cảm quan”.
SVTH: Nguyễn Ngọc Bảo Trân Trang 8
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
(Giả thiết mà chúng ta tin là sự thật và muốn chứng minh bằng dữ kiện)
• Từ giả thiết chính đề ra giả thiết đảo H
0
: “Hai sản phẩm không khác nhau về
tính chất cảm quan”.
• Chọn mức xác suất (probability level) hay mức ý nghóa (significance level) α
(thường là một phía) cho sai lầm loại 1 (bác bỏ H
0

) < α: Nếu giả thiết đảo H
0
đúng thì dữ kiện D xem như không xảy
ra (xác suất xảy ra D nếu H
0
đúng là rất thấp). Nhưng thực tế dữ kiện D đã
xảy ra, nên ta loại bỏ giả thiết đảo H
0
, công nhận giả thiết chính H, nghóa là
công nhận sự khác nhau về tính chất cảm quan của hai sản phẩm “có ý
nghóa thống kê” (significant).
 P(DH
0
) ≥ α: Nếu giả thiết đảo H
0
đúng thì dữ kiện D vẫn có khả năng xảy
ra. Ta chưa có đủ bằng chứng để bác bỏ giả thiết đảo H
0
cũng như công
nhận giả thiết chính H, nghóa là chưa thể kết luận hai sản phẩm khác hay
giống nhau về tính chất cảm quan. Để kết luận hai sản phẩm giống nhau, ta
phải đánh giá độ rủi ro β hay lực kiểm đònh (power) 1 - β như đã nêu trên.
 Theo Hình III.1.1, ta có:
• µ
0
và µ lần lượt là trò trung bình của giả thiết đảo H
0
và giả thiết chính H.
• d = µ – µ
0

Điểm dừng
Miền loại bỏ HoMiền chấp nhận Ho
β
α
µ
µ
o
Hình III.1.1: Minh họa các đường cong phân phối của giả thiết H
0
và H theo nguyên tắc xử
lý số liệu trong phép thử phân biệt
 Mối quan hệ giữa α, β, d và n:
• Ứng với d và n không đổi, khi vò trí điểm dừng dòch sang trái thì α tăng, β giảm
và ngược lại.
• Ứng với d không đổi, khi n tăng thì α, β sẽ giảm, độ lệch chuẩn của các phân
phối cũng giảm, các phân phối trở nên cao và hẹp hơn, khoảng tin cậy chung
quanh các trò trung bình cũng co lại nên độ chính xác của phép kiểm đònh tăng.
• Trong nhiều trường hợp, các thí nghiệm được thực hiện chỉ với mối quan tâm
ban đầu là α và kích thước mẫu n. Khi đó, giữa β và d có quan hệ đơn điệu, ta
có thể quan sát sau khi thực hiện thí nghiệm để biết có thể kỳ vọng mức độ tin
cậy 1 – β là bao nhiêu ứng với các độ lớn khác nhau của hiệu ứng.
2. Các phương pháp xử lý số liệu trong phép thử phân biệt
2.1. Kiểm đònh Khi - bình phương
χ
2
2.1.1. Nội dung
 Ta có χ
2
quan sát:
∑

) < α): Ta kết luận hai sản phẩm khác nhau về tính
chất cảm quan.
• χ
2
qs
≤ χ
2
lt
(ứng với P(DH
0
) ≥ α): Ta chưa thể kết luận hai sản phẩm khác nhau
về tính chất cảm quan.
 Ví dụ: Tiến hành thí nghiệm cảm quan với phép thử phân biệt A - nonA để kiểm
đònh sự khác nhau về tính chất cảm quan của sản phẩm mới nonA với sản phẩm đã
có trên thò trường A. Xét trường hợp thí nghiệm không lặp, thực hiện 100 phép thử
cho 100 người thử, ta thu được bảng kết quả sau:
Bảng III.2.1: Số câu trả lời thực tế của người thử
Sản phẩm
Trả lời
Tổng
A nonA
A
33 18 50
nonA
22 27 50
Tổng
55 45 100
Trong tổng số 100 câu trả lời có 60 câu trả lời đúng. Liệu có thể kết luận hai sản
phẩm A và nonA khác nhau về tính chất cảm quan không?
 Xử lý kết quả bằng kiểm đònh

527
52722
527
52733
22222
2
=
−
+
−
+
−
+
−
=
−
=
∑
,
),(
,
),(
,
),(
,
),()(
T
TO
qs
χ

• Loại sản phẩm X = {A, nonA}
• Câu trả lời của người thử Y = {A, nonA}
 Khi này, giả thiết H
0
: “Hai sản phẩm không khác nhau về tính chất cảm quan” sẽ
tương đương với “X và Y độc lập”. Bởi vì khi X và Y độc lập thì câu trả lời của
người thử sẽ là ngẫu nhiên và không phụ thuộc vào sản phẩm là A hay nonA, nói
cách khác người thử không phân biệt được sự khác nhau về tính chất cảm quan của
hai sản phẩm.
 Ứng với bậc tự do btd =1 và mức ý nghóa α cho trước, kết quả thu được ứng với hai
trường hợp:
• χ
2
qs
> χ
2
lt
: Ta bác bỏ giả thiết H
0
, nói cách khác X và Y phụ thuộc vào nhau,
nghóa là người thử phân biệt được sự khác nhau giữa hai sản phẩm. Ta kết luận
hai sản phẩm khác nhau về tính chất cảm quan.
• χ
2
qs
≤ χ
2
lt
: Câu trả lời của người thử có thể chỉ do ngẫu nhiên, ta chưa có đủ
bằng chứng để công nhận sự phụ thuộc của X và Y cũng như bác bỏ giả thiết

−
−−=−
1
0
111
k
i
inii
n
n
ki
inii
n
ppCppC )()(
(CT III.2.4)
 Ứng với mức ý nghóa α cho trước, kết quả thu được chia thành hai trường hợp:
• P(X ≥ k) < α (ứng với P(DH
0
) < α): Ta kết luận hai sản phẩm khác nhau về
tính chất cảm quan.
• P(X ≥ k) ≥ α (ứng với P(DH
0
) ≥ α): Ta chưa thể kết luận hai sản phẩm khác
nhau về tính chất cảm quan.
 Ví dụ: Ta xét lại Ví dụ ở phần II.2.1 với n = 100; k = 60; p = 0,5.
 Xử lý kết quả bằng kiểm đònh nhò phân (CT III.2.4):
 Xác suất để có từ 60 câu trả lời đúng trở lên trong 100 câu trả lời:
P(X ≥ 60) =
∑∑
=

cảm quan” sẽ tương đương với “Người thử không nhận biết được sự khác nhau giữa
hai sản phẩm”, nghóa là câu trả lời người thử đưa ra là ngẫu nhiên với xác suất p.
Ví dụ trong phép thử A - nonA, người thử phải chọn một trong hai câu trả lời A và
nonA nên xác suất trả lời đúng trong mỗi lần thử sẽ là 0,5.
 Ứng với mức ý nghóa α, kết quả thu được chia thành hai trường hợp:
• P(X ≥ k) < α: Nếu H
0
đúng, nghóa là nếu câu trả lời của người thử chỉ là ngẫu
nhiên, thì xác suất có từ k câu trả lời đúng trở lên trong n câu trả lời là rất thấp.
Ta bác bỏ giả thiết H
0
, nói cách khác câu trả lời của người thử không phải do
ngẫu nhiên. Ta kết luận hai sản phẩm khác nhau về tính chất cảm quan.
• P(X ≥ k) ≥ α: Câu trả lời của người thử có thể chỉ do ngẫu nhiên. Ta chưa thể
bác bỏ giả thiết H
0
, cũng như chưa thể kết luận hai sản phẩm khác nhau về tính
chất cảm quan.
2.3. Kiểm đònh Z về tỉ lệ theo phân phối chuẩn (normal distribution)
2.3.1. Nội dung
 Nếu giả thiết H
0
đúng (Hai sản phẩm không khác nhau về tính chất cảm quan), ta
có:
npq
npX
Z
50,−−
=
(CT III.2.5)

,,
=
××
−×−
=Z
 Ứng với mức ý nghóa một phía α = 0,05, ta có Z > Z
α
⇔ 1,9 > 1,645.
SVTH: Nguyễn Ngọc Bảo Trân Trang 13
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
 Kết luận: Hai sản phẩm khác nhau về tính chất cảm quan.
2.3.2. Ý nghóa
Kiểm đònh Z về tỉ lệ theo phân phối chuẩn nhò phân thực chất là kiểm đònh tính
ngẫu nhiên trong các câu trả lời của người thử tương tự như kiểm đònh nhò phân.
3. Nhận xét
Việc sử dụng các kiểm đònh thống kê nêu trên để xử lý số liệu trong phép thử phân
biệt khá đơn giản và tiện lợi. Tuy nhiên chúng cũng có những mặt hạn chế nhất đònh.
 Về mục đích:
Mục đích của các kiểm đònh thống kê trên là so sánh “xác suất dữ kiện D xảy ra
nếu giả thiết đảo H
0
là sự thật” với mức ý nghóa α cho trước. Vậy giá trò P(DH
0
) không
trực tiếp cho ta biết về sự tồn tại của giả thiết chính H, nó chỉ gián tiếp cung cấp bằng
chứng để chúng ta bác bỏ giả thiết đảo H
0
và chấp nhận giả thiết chính H mà thôi. Nói
cách khác, giá trò P(DH
0

c
= p
d
+ (1 – p
d
)p
0
(Jian Bi, 2001) (CT III.3.1)
Với p
c
: xác suất trả lời đúng của mỗi người thử
p
d
: tỉ lệ những người thật sự phân biệt được hai sản phẩm (discriminator
hay detector) trong tổng số người thử
p
0
: xác suất trả lời đúng ngẫu nhiên (phần III.2.2.1)
SVTH: Nguyễn Ngọc Bảo Trân Trang 14
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Tuy nhiên, điều kiện này mâu thuẫn với thực tế vì khả năng trả lời đúng của
mỗi người thử thay đổi theo năng lực, kinh nghiệm cá nhân, điều kiện thí nghiệm
cũng như độ khó của phép thử. Ta không thể quy toàn bộ người thử về hai nhóm
người: “những người phân biệt” thật sự nhìn thấy sự khác biệt nên đưa ra câu trả
lời đúng với xác suất bằng 1, và “những người không phân biệt” chỉ đoán để trả lời
với xác suất trả lời đúng ngẫu nhiên p
0
.
• Các câu trả lời phải độc lập với nhau: Trong trường hợp phải thực hiện các thí
nghiệm lặp (do điều kiện thời gian, chi phí, … không cho phép tiến hành với quá

ba
ba
xx
ba
ba
baB
xx
baxf )(
)()(
)(
),(
)(
),,(
(CT IV.1.1)
Với Γ: hàm gamma và B: hàm beta
• Hàm phân phối tích lũy: (cumulative distribution function)
),(
),(
),(
),(
)(
),,( baI
baB
baB
baB
dttt
baxF
x
x
x

ab
XD
(CT IV.1.4)
Với
1
1
++
=
ba
γ
(CT IV.1.5)
SVTH: Nguyễn Ngọc Bảo Trân Trang 15
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Hình IV.1.1: Các dạng đường cong phân phối beta
1.2. Các bước thực hiện
1.2.1. Xác đònh phân phối tiên nghiệm của tham số tỉ lệ p
 Các đại lượng của phân phối tiên nghiệm đối với tham số p:
• Trung bình (kỳ vọng) tiên nghiệm
µ
.
• Phương sai tiên nghiệm
σ
2
(hay độ lệch chuẩn tiên nghiệm
σ
).
Các đại lượng này được xác đònh dựa trên các thông tin tiên nghiệm (prior
information hay prior knowledge) tức là những hiểu biết hay kinh nghiệm trong việc đánh
giá các tính chất cảm quan của sản phẩm thu được từ những nghiên cứu đi trước.
Nếu ta không có bất kỳ thông tin nào về sự giống – khác nhau của hai sản phẩm

−
−
−= 1
1
1
2
σ
µµ
µ
)(
)(b
(CT IV.1.9)
• Trường hợp p tuân theo phân phối đều, khi đó xác suất P(p = p
i
) là như nhau với
p
i
∈ [0; 1]. Ta có:
Các tham số: a = b = 1.
SVTH: Nguyễn Ngọc Bảo Trân Trang 16
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
Trung bình: µ = 0,5 và phương sai: σ
2
= 1/12 = 0,0833 (CT IV.1.4)
1.2.2. Xác đònh phân phối hậu nghiệm của tham số tỉ lệ p
Phân phối hậu nghiệm đối với tỉ lệ p chính là sự tổng hợp của thông tin tiên
nghiệm và dữ kiện quan sát trong thực tế.
Giả sử thực hiện phép thử phân biệt trong thực tế thu được n câu trả lời trong đó có
x câu trả lời đúng.
Ta có:

*
) (CT IV.1.13)
Với
γ
*

1
1
1
1
++
=
+++
=
∗∗
ba
ban
(CT IV.1.14)
1.2.3. Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm – Xác đònh
khoảng tin cậy của tỉ lệ p ứng với mức ý nghóa
α
cho trước
 Dựng đường cong phân phối beta:
Ta có thể dựng các đường cong phân phối beta tiên nghiệm và hậu nghiệm cũng
như tính toán giá trò các hàm mật độ f(p), hàm xác suất tích lũy F(p), hàm đònh bậc p[F(p)]
bằng cách sử dụng phần mềm thống kê R. Các đoạn code phục vụ cho quá trình tính toán
sẽ được trình bày trong phần Phụ lục.
Đường cong phân phối hậu nghiệm có độ nhọn cao hơn ứng với phương sai nhỏ hơn
phân phối tiên nghiệm (σ
2*

−
=Φ )(Z
với:
Hàm tích phân Laplace:
∫
−
=Φ
u
x
dxeu
0
2
2
2
1
/
)(
π
và Hàm xác suất tích lũy: F(u) = Φ(u) + 0,5
• Dùng phần mềm thống kê R:
Ứng với mức ý nghóa α cho trước, ta dùng phần mềm thống kê R để tính hàm đònh
bậc p[F(p)], từ đó xác đònh được khoảng tin cậy hai phía (p
1
; p
2
) của p theo phân phối hậu
nghiệm dựa trên các điều kiện sau:
SVTH: Nguyễn Ngọc Bảo Trân Trang 17
GVHD: Ts. Nguyễn Hoàng Dũng ĐAMH Công nghệ Thực phẩm
p

Với hàm xác suất tích lũy F(p
H
) được tính bằng phần mềm thống kê R.
 Khi đó, giá trò p
H
để kiểm đònh giả thiết chính H được chọn dựa trên:
• Mục đích của nhà sản xuất hay nghiên cứu: Mong muốn các sản phẩm là giống
hay khác nhau tùy theo chiến lược kinh doanh đối với người tiêu dùng. Một
cách gần đúng, có thể ước tính p
H
= p
c
theo tỉ lệ người phân biệt cho phép dựa
trên CT III.3.1 (tỉ lệ p
d
cao nếu kỳ vọng hai sản phẩm khác nhau và thấp nếu kỳ
vọng hai sản phẩm giống nhau).
• Nếu ta chỉ muốn xét xem hai sản phẩm giống hay khác nhau về tính chất cảm
quan mà không kỳ vọng p
H
đạt một giá trò nào đó thì thường chọn p
H
= p ngẫu
nhiên theo phần III.2.2.1.
 Từ đó, ta có:
• Xác suất của giả thiết chính H:
P(H) = p
H
ứng với P(notH) = 1 – p
H

notHDPnotHPHDPHP
HDPHP
DP
HDPHP
DHP
+
==
)(/)(
)/(/)/(
)/(
)/(
)/()(
)/()(
)/(
)/(
21
21
2
1
22
11
2
1
HPHP
DHPDHP
HDP
HDP
B
HDPHP
HDPHP

phân phối đều. Ta có:
• Các tham số: a = b =1
• Trung bình tiên nghiệm: µ = 0,5
• Phương sai tiên nghiệm: σ
2
= 1/12 = 0,0833
⇒ Độ lệch chuẩn σ = 0,2887.
 Xác đònh phân phối hậu nghiệm:
• Các tham số:
 a
*
= a + x = 1 + 60 = 61 (CT IV.1.10)
 b
*
= n – x + b = 100 – 60 + 1 = 41 (CT IV.1.11)
• Suy ra:
 Trung bình:
µ
*
59800
11100
160
,
=
++
+
=
++
+
=

, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001):
(
)
∗∗∗∗
×+×−=
22
21
σµσµ
αα
ZZpp ;);(
(CT IV.1.15)
Với µ
*
= 0,5980; Z
α
= 1,96 và σ
2*
= 2,333910
-3
⇒ (p
1
; p
2
) = (0,5034; 0,6927)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5034; 0,6927),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5034; 0,6927).
• Hoặc dùng phần mềm thống kê R, ta xác đònh được:

Vậy xác suất để tỉ lệ trả lời đúng p > 0,5 là 97,70% hay xác suất hai sản
phẩm khác nhau là 97,70%.
 Theo (Carlin và Louis, 2000), ta có:
)(/)(
)/(/)/(
)/(
)/(
notHPHP
DnotHPDHP
notHDP
HDP
B ==
(CT IV.1.16)
4842
5050
0230097700
,
,/,
,/,
==
⇒ 2lnB = 7,5 > 6
Ta nói giả thiết H có bằng chứng chắc chắn / thuyết phục (strong evidence).
 Kết luận: Ta chấp nhận giả thiết H: “Hai sản phẩm khác nhau” ứng với P(p >
0,5) = 97,70% và 2lnB = 7,5.
• Ngược lại, nếu ta kỳ vọng vào giả thiết H: “Hai sản phẩm giống nhau” tức là
kỳ vọng p < 0,5 thì ta có:
 P(H) = p
H
= 0,5 ứng với P(notH) = 1 – p
H

hai sản phẩm, nên ta xem tham số tỉ lệ p tuân theo phân phối đều. Ta có:
• Các tham số: a = b =1
• Trung bình tiên nghiệm: µ = 0,5
• Phương sai tiên nghiệm: σ
2
= 1/12 = 0,0833
⇒ Độ lệch chuẩn σ = 0,2887.
 Xác đònh phân phối hậu nghiệm: Biết n = 150 và x = 81
• Các tham số: a
*
= 82 và b
*
= 70
• Trung bình µ
*
= 0,5395
Phương sai σ
2*
= 1,6238.10
-3
≈ 0,0016 ⇒ Độ lệch chuẩn σ
*
= 0,0403
 Dựng đường cong phân phối beta tiên nghiệm và hậu nghiệm: (phần mềm R)
 Xác đònh khoảng tin cậy (p
1
, p
2
) của phân phối hậu nghiệm: Chọn α = 0,05
• Theo (Jian Bi, 2001): (p

= p
c
= p
d
+ (1 – p
d
)p
0
= 0,6 (CT III.3.1)
Ta có giả thiết H: “Tỉ lệ trả lời đúng p < 0,6” (ứng với tỉ lệ người phân biệt p
d
<
0,2) và dữ kiện D: “Có 81 câu trả lời đúng trong 150 câu trả lời”.
Suy ra:
• Các xác suất: P(H) = p
H
= 0,6 và P(HD) = P(p < 0,6) = F(0,6) = 0,9339
Vậy xác suất để tỉ lệ trả lời đúng p < 0,6 là 93,39% hay xác suất không có quá
20% người thử thực sự nhận thấy sự khác biệt là 93,39%.
• Theo (Carlin và Louis, 2000), ta có:
429
60160
93390193390
,
),/(,
),/(,
=
−
−
=B

2
= 0,01 (nghóa là độ lệch chuẩn σ = 0,1).
• Suy ra các tham số:

8131
010
60160
601
1
2
,
,
),(,
,
)(
=






−
−
=






−
−
−=






−
−
−=
σ
µµ
µ
b
(CT IV.1.9)
 Xác đònh phân phối hậu nghiệm: Biết n = 50 và x = 35
• Các tham số: a
*
= 48,8 và b
*
= 24,2
• Trung bình µ
*
= 0,6685
Phương sai σ
2*
= 2,9947.10
-3

(p
H
= 0,5): “Tỉ lệ chọn sản phẩm A: p > 0,5”. Suy ra:
• Các xác suất: P(H) = 1 – p
H
= 0,5 và P(HD) = P(p > 0,5) = 1 – F(0,5) = 0,9983
Vậy xác suất để tỉ lệ chọn sản phẩm A: p > 0,6 là 99,83%.
• Theo (Carlin và Louis, 2000), ta có:
24587
5050
99830199830
,
,/,
),/(,
=
−
=B
⇒ 2lnB = 12,75 > 6
Ta nói giả thiết H
1
có bằng chứng chắc chắn / thuyết phục (strong evidence).
 Kết luận: Ta chấp nhận giả thiết H
1
: “Tỉ lệ chọn sản phẩm A lớn hơn 0,5” do P(p
> 0,6) = 99,83% và 2lnB = 12,75; nghóa là hai sản phẩm A và B khác nhau.
Ta cũng thấy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là(0,5572;
0,7710) không bao gồm p = 0,5, nên nếu không kiểm đònh giả thiết H
1
thì ta cũng có thể
kết luận: “Với khoảng tin cậy 95% thì hai sản phẩm khác nhau”.

vào khả năng tồn tại của thông tin tiên nghiệm ban đầu với µ = 0,6 và σ = 0,1.
- Kiểm đònh tính tương tự theo giới hạn tương tự d’ của mô hình Thurstone ([5], trang
117 – 129):
• Theo (Ennis, 1993), ta có d’ = 1 ứng với tỉ lệ trả lời đúng p = 0,76 và d’ = 0,5
ứng với p = 0,64.
Khi d’ = 1 (p
H
= 0,76) ta có giả thiết H
1
: “Tỉ lệ chọn sản phẩm A (trả lời đúng)
nhỏ hơn 0,76”.
Suy ra: P(H) = 0,76 và P(HD) = P(p < 0,76) = F(0,76) = 0,9581.
Vậy xác suất để tỉ lệ trả lời đúng p > 0,76 là 95,81%.
 Kết luận: Với giới hạn tương tự d’ = 1, ta kết luận hai sản phẩm giống nhau
với xác suất 95,81%.
• Khi d’ = 0,5 (p
H
= 0,64) ta có giả thiết H
2
: “Tỉ lệ chọn sản phẩm A (trả lời
đúng) nhỏ hơn 0,64”.
Suy ra: P(H) = 0,64 và P(HD) = P(p < 0,64) = F(0,64) = 0,2958.
Vậy xác suất để tỉ lệ trả lời đúng p > 0,64 là 29,58%.
 Kết luận: Với giới hạn tương tự d’ = 0,5, ta chưa thể kết luận hai sản phẩm
giống nhau do xác suất để tỉ lệ p < 0,64 thấp, chỉ có 29,58%.
Từ đó, ta thấy việc đưa ra kết luận về tính tương tự của hai sản phẩm phụ thuộc
vào việc chọn giới hạn tương tự của nhà sản xuất hay nghiên cứu. Tùy đối tượng tiêu dùng
mà chọn giới hạn tương tự d’ phù hợp, ta thấy d’ nhỏ đối với người tiêu dùng chặt chẽ và
lớn đối với người tiêu dùng dễ dãi.
2.3.2. Tham số p ban đầu tuân theo phân phối đều

1
, p
2
) = (0,5681; 0,8166)
Vậy khoảng tin cậy 95% của p theo phân phối hậu nghiệm là (0,5681; 0,8166),
nghóa là 95% tỉ lệ trả lời đúng nằm trong khoảng (0,5681; 0,8166).
• Dùng phần mềm thống kê R: (p
1
, p
2
) = (0,5617; 0,8089)
SVTH: Nguyễn Ngọc Bảo Trân Trang 25

Trích đoạn SO SÁNH PHƯƠNG PHÁP THỐNG KÊ BAYESIAN VỚI PHƯƠNG PHÁP

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

ĐỒ ÁN MÔN HỌC CÔNG NGHỆ THỰC PHẨM ỨNG DỤNG CỦA THỐNG KÊ BAYESIAN TRONG PHÉP THỬ PHÂN BIỆT - Pdf 25

Tài liệu, ebook tham khảo khác

Học thêm