TRƯỜNG ĐẠI HỌC SƯ PHẠM HUẾ
KHOA SINH HỌC
BÀI TẬP LỚN
ỨNG DỤNG XÁC SUẤT NHỊ THỨC
ĐỂ GIẢI BÀI TẬP DI TRUYỀN
A
Giáo viên hướng dẫn: HOÀNG TRỌNG PHÁN
Sinh viên thực hiện: LÊ VĂN HÂN
Lớp: sinh 3A
Huế, 27/11/2013
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
TRƯỜNG ĐẠI HỌC SƯ PHẠM HUẾ
KHOA SINH HỌC
BÀI TẬP LỚN
ỨNG DỤNG XÁC SUẤT NHỊ THỨC
ĐỂ GIẢI BÀI TẬP DI TRUYỀN
2
Huế, 27/11/2013
Giáo viên hướng dẫn: HOÀNG TRỌNG PHÁN
Sinh viên thực hiện: LÊ VĂN HÂN
Lớp: sinh 3A
Ho
àn
g
Vũ
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
Lời nói đầu
Thống kê (toán học) là bộ môn toán học rất quan trọng và có nhiều ứng dụng to
lớn trong thực tế, giúp con người rút ra thông tin từ dữ liệu quan sát, nhằm giải quyết
truyền học. Trong đó, xác suất nhị thức (binomial probability) là một trong những
công cụ ứng dụng của xác suất thống kê, được sử dụng trong việc giải nhiều bài toán
trong di truyền học, ứng với 1 số dạng bài tập riêng, trong đó thỏa mãn các tính chất
của dãy phép thử bernoulli.
2. Nhiệm vụ nghiên cứu:
- Khái quát được những đặc trưng cơ bản của xác suất nhị thức và những vấn đề
liên quan.
- Tìm ra điều kiện nghiệm đúng, nói cách khác là khi nào có thể dùng được xác
suất nhị thức.
- Ứng dụng và giải một số dạng bài tập có thể giải được bằng công thức xác
suất nhị thức
5
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
Chương II: CƠ SỞ DI TRUYỀN HỌC MENDEL
1. Hệ thống kiến thức về di truyền học Mendel – Di truyền học Cổ điển
1.1 Gregor Johann Mendel:
Gregor Johann Mendel (20/7/1822 – 6/1/1884), là một nhà khoa học, một linh
mục Công giáo người Áo, ông được coi là "cha đẻ của di truyền hiện đại" vì những
nghiên cứu của ông về đặc điểm di truyền của đậu Hà Lan. Mendel chỉ ra rằng đặc tính
di truyền tuân theo những quy luật nhất định, ngày nay chúng ta gọi là Định luật
Mendel. Nội dung định luật của ông rất đơn giản, tuy nhiên, khi ông còn sống, ý nghĩa
và tầm quan trọng trong các công trình nghiên cứu của ông không được công nhận,
người ta cũng không quan tâm đến các nghiên cứu của ông. Đến tận đến thế kỷ 20 các
kết luận của ông mới được công nhận, khi đó ông được tôn vinh như là nhà khoa học
thiên tài, một danh hiệu ông xứng đáng được nhận từ lúc sinh thời. Ngày nay người ta
vẫn xem năm 1866 là mốc đánh dấu cho sự ra đời của Di truyền học và Mendel là cha
đẻ của ngành này.
Mendel đã thí nghiệm trên nhiều loại đối tượng, nhưng công phu nhất là trên
đậu Hà Lan (có hoa lưỡng tính tự thụ phấn nghiêm ngặt). Ông đã trồng khoảng 37000
2
từ
phép lai hai tính.
7
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
2. Lý thuyết xác suất-thống kê
2.1 Một số khái niệm và tính chất cơ bản của xác suất
Phép thử và các biến cố:
Phép thử là việc thực hiện một nhóm các điều kiện xác định, ví dụ một thí
nghiệm tung đồng xu, hay một phép lai cụ thể… Các kết quả khác nhau có thể có từ
phép thử gọi là các biến cố, được kí hiệu bằng các chữ cái in hoa. Ví dụ: Kiểu gen dị
hợp AaBb có thể cho ra bốn loại giao tử với xác suất ngang nhau là 0,25. Trong khi
hiểu gen đồng hợp tử AABB chỉ cho một loại giao tử là AB với tỉ lệ 100% hay nói
cách khác xác suất là của sự kiện này 1.
Định nghĩa xác suất theo phương pháp thống kê:
Giả sử khi lặp lại n lần một phép thử, có k lần xuất hiện biến cố A. Ta gọi tỉ số
là tần suất của biến cố A. Khi n thay đổi, tần suất k cũng thay đổi. Bằng thực nghiệm
người ta chứng tỏ được rằng tần suất luôn dao động xung quanh một số cố định, khi n
càng lớn thì nó càng gần với số cố định đó. Ta gọi số cố định đó là xác suất của biến
cố A theo nghĩa thống kê và kí hiệu là P(A).
Định nghĩa xác suất cổ điển:
Cho { B
1
, B
2
, B
2
,…,B
n
,…,B
n
} lập thành một nhóm đầy đủ nếu thỏa mãn cả hai điều kiện:
8
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
a. Tổng của chúng là một biến cố chắc chắn = Ω
b. Chúng xung khắc nhau từng đôi một.
Quy tắc cộng xác suất: Xác suất kết hợp của hai (hay nhiều) sự kiện xung khắc
từng đôi là tổng cá xác suất riêng rẽ của chúng.
P(AB) = P(A) P(B) | A và B là hai sự kiện xung khắc
Mở rộng quy tắc cộng xác suất, ta có:
P(AB) = P(A) P(B) + P(AB)
Quy tắc nhân xác suất: Xác suất trùng hợp của cả hai biến cố độc lập bằng tích
các xác suất riêng rẽ của chúng. Hai biến cố độc lập là hai biến cố mà sự xuất hiện
của biến cố này không ảnh hưởng đến xác suất xảy ra của biến cố kia. P(AB) =
P(A).P(B) ) | A và B là hai biến cố độc lập.
Trong di truyền học, mệnh đề trên được phát biểu rằng: Nếu các gene phân ly
độc lập và tổ hợp tự do, thì tỷ lệ phân ly đồng thời của cả hai tính trạng bằng tích các
tỷ lệ phân ly riêng rẽ của các tính trạng đó, và ngược lại.
Xét một phép lai hai tính tuân theo quy luật phân ly độc lập, các gene tổ hợp tự
do và tỷ lệ phân ly của từng tính trạng là 3:1 và 1:1 Ta cũng có thể suy ra kết quả tỷ lệ
phân ly đồng thời của cả hai tính là 3:3:1:1.
Biến cố có điều kiện , có nghĩa sự xuất hiện của biến cố này có ảnh hưởng đến
xác suất xuất hiện của biến cố kia. Khi đó, xác suất điều kiện của biến cố B đối với
biến cố A đã xảy ra là:
P(B/A) = P(AB) : P(A)
Hoán vị, Chỉnh hợp, tổ hợp:
Cho tập hợp A có n phần tử (n > 0). Khi sắp xếp n phần tử này theo một thứ tự,
ta được một Hoán vị các phần tử của tập A. Với số nguyên k (1 ≤ k ≤ n). Khi lấy ra k
có thể lặp thành 1 tam giác Pascal. Trong toán học, Tam giác Pascal là một mảng tam
giác của hệ số nhị thức trong tam giác. Thuật toán được đặt theo tên của nhà toán học
Pháp nổi tiếng Blaise Pascal.
Khi viết các hệ số lần lượt với n=0,1,2, ta được bảng
Trong tam giác số này, bắt đầu từ hàng thứ hai, mỗi số ở hàng thứ n từ cột thứ
hai đến cột n-1 bằng tổng hai số đứng ở hàng trên cùng cột và cột trước nó. Sơ dĩ có
quan hệ này là do có công thức truy hồi
Công thức xác suất nhị thức:
Xét phép thử gồm 2 sự kiện đối lập là sự kiện A và sự kiện B, xác suất của mỗi
sự kiện tương ứng là p và q (p + q = 1), trong mỗi phép thử xác suất xảy ra của mỗi sự
kiện là không thay đổi. Giả sử trong n phép thử độc lập được tiến hành, sự kiện A xuất
hiện k lần, sự kiện B xuất hiện n - k lần. Để tính các xác suất này cần sử dụng công
thức xác suất nhị thức sau:
10
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
P
n
(k) = | (0 ≤ k ≤ n).
Ví dụ 1:
Tỉ lệ nảy mầm của một loại hạt giống đạt 95%. Tìm xác suất để gieo 10hạt
giống, trong đó có đúng 7 hạt nảy mầm. Ta kí hiệu:
Sự kiện M = “gieo ngẫu nhiên một hạt giống thì hạt đó nảy mầm”. P(M) =
0,95%. sự kiện N = “gieo ngẫu nhiên một hạt giống thì hạt đó không nảy mầm”. Vậy
P(N) = 0,05%.
Nhận xét:
• Mỗi phép thử gieo hạt là độc lập với nhau. Sự nảy mầm của hạt này
không liên quan đến xác suất nảy mầm của các hạt còn lại
• Trong mỗi phép thử chỉ có 2 biến cố xảy ra đó là nảy mầm (M) hoặc
không nảy mầm (N). P(M)+P(N)=1. P(MN)=Ø
3
(2) = =0,375
12
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
Chương III: ỨNG DỤNG XÁC SUẤT NHỊ THỨC TRONG GIẢI MỘT SỐ
DẠNG BÀI TẬP DI TRUYỀN
1. Một số dạng bài tập di truyền
1.1 Xác định tính đực cái trong nhiều lần sinh:
Cơ sở lý thuyết:
Mỗi lần sinh là được xem như một phép thử gồm 2 sự kiện sinh đực hoặc sinh
cái với xác suất bằng nhau, không đổi và bằng ½. Giữa các lần sinh xảy ra độc lập với
nhau. Xác suất suất hiện đực cái trong n lần sinh là kết quả của sự tổ hợp ngẫu nhiên
của n phép thử.
Gọi số đực và số cái trong n lần sinh lần lượt là k, n-k. Số tổ hợp chập k của n
phần tử, số tổ hợp chập n-k của n phần tử được tính bằng .
Xác suất để trong n lần sinh có k lần sinh con đực ( hay n-k lần sinh con cái)
được xác định theo công thức xác suất nhị thức:
P
n
(k) =
= P
n
(n-k) = | (0 ≤ k ≤ n).
Bài tập áp dụng:
Một cặp vợ chồng bình thường dự kiến sinh 3 người con. Người bố thích có
nhiều con trai nên mong muốn cả 3 đứa đều là con trai.
a) Tính xác suất để trong 3 lần sinh họ sinh được 2 con trai và 1 con gái.
b) Tính xác suất để trong 3 lần sinh họ đều có con trai và con gái
c) Tính xác suất để trong 3 lần sinh họ đều có con trai hoặc con gái
gene trong đó nhận một allele trội và Sự kiện con sinh ra có kiểu gene trong đó nhận
một allele lặn là hai sự kiện đối lập nhau. Xác suất suất hiện allele trội hoặc lặn trong
n allele ở kiểu gen đời con là kết quả của sự tổ hợp ngẫu nhiên của n alele. Giả sử cần
tính xác suất để con sinh ra kiểu gen ở đời con có x allele trội, y allele lặn (x + y = n).
Các gene phân ly độc lập nên xác suất p = q = 0,5. ta có thể áp dụng công thức nhị
thức.
Xác suất để con sinh ra kiểu gen ở đời con có x allele trội,hay nói cách khác có
y allele lặn (x + y = n) được xác định theo công thức xác suất nhị thức:
P
n
(x) =
1.2.2 Trường hợp tổng quát:
Đối với trường hợp tổng quát, đó là các cặp gen của bố mẹ có a cặp đồng hợp trội,
b cặp dị lặn, c cặp đồng hợp.
Các cặp đồng hợp khi cho giao tử cho tỉ lệ phân ly trội lặn khác nhau. Ví dụ: Cặp dị
hợp Aa, các allele phân ly đồng đều với tỷ lệ bằng nhau và bằng ½ (xác suất bằng 0,5).
Trong khi đó, các cặp đồng hợp chỉ cho một loại giao tử.
Giả sử, cả bố lẫn mẹ có tổng số n cặp gen. (tức có n alelle/ kiểu gen) Trong đó, có a
cặp đồng hợp trội, b cặp đồng hợp lặn, c cặp di hợp. a + b + c = n.
Tính xác suất đời con sinh ra có kiểu gen có x alelle trội, y alelle lặn ( điều kiện: x
a, y>b) lần lượt là
P
c
(x-a) =
P
c
(y-b) =
Chứng minh:
Số alelle trội đời con chắc chắn nhận được từ bố mẹ là a. Số alelle lặn đời con chắc
chắn nhận được từ bố mẹ là b. Do vậy, trong kiểu gen của đời con có a + b allen đã xác
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
1.3 Xác định tần số các cặp alelle đồng hợp hay dị hợp trong trường hợp nhiều
cặp gene:
Đối với trường hợp bố mẹ đều là dị hợp hai cặp tất cả các cặp gen.
Giả sử, cả bố lẫn mẹ có n cặp gen dị hợp, (cũng chính là số alelle trên 1 kiểu
gen). Xét phép lai 1 cặp gen PLĐL: Aa x Aa.
F1 cho ra 4 KG với tỉ lệ ¼ AA : ½ Aa : ¼ aa. Có 3 biến cố AA, Aa, aa nên ta
chưa thể áp dụng ngay vào công thức xác suất nhị thức được. Trước hết, ta phải quy vê
để thỏa mãn tính chất của một dãy bernoulli đã nhắc đến ở phần trước. Quy về hai biến
cố A và B sao cho P(A) + P(B) = 1 hay p + q = 1.
• Xác suất đời con có a cặp đồng hợp trội:
Nếu ta cho A là biến cố “cho ra cặp đồng hợp trội” thì B phải là biến cố “Cho ra
cặp đồng hợp lặn hoặc cặp dị hợp” (tức P(B) là tổng xác xuất của hai biến cố thành
phần: “Cho ra cặp đồng hợp” lặn hoặc “Cho ra cặp dị hợp”).
Khi đó p = P(A) = ¼, q = P(B) = ¼ + ½ = ¾.
P
n
(a) =
• Xác suất đời con có b cặp đồng hợp lặn, (ta chứng minh tương tự
như trên)
P
n
(b) =
• Xác suất đời con có c cặp dị hợp:
Với trường hợp này: ta gom biến cố “Cho ra cặp đồng hợp trội” và
“Cho ra cặp đồng hơpk lặn” thành biến cố B: “Cho ra cặp dị hợp lặn”. Khi
đó: p = P(A)=1/2, q=P(B)= ¼ + ¼ = ½.
P
n
không theo khuôn mẫu định sẵn.
17
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
Chương IV: KẾT LUẬN, KIẾN NGHỊ:
1. Kết luận:
Sự phát triển của toán học đem lại cho chúng ta những công cụ hiệu quả để
phục vụ cho học tập và nghiên cứu các ngành khoa học. Trong đó, xác suất tổ hợp –
thống kê nói chung, xác suất nhị thức nói riêng đã trở thành công cụ đắc lực cho việc
học tập nghiên cứu Di truyền học, đặc biệt là trong giải các bài tập di truyền.
Việc ứng dụng công thức xác suất nhị thức trong giải bài tập di truyền đã đem
lại hiệu quả chính xác, nhanh chóng. Để làm được điều này, cần nẵm vững các kiến
thức xác suất thống kê cũng như di truyền học.
Các dạng bài tập về di truyền học vô cùng đa dạng, với mỗi dạng có thể có
nhiều phương pháp giải riêng, có phương pháp giải nhanh có, chậm có. Từ việc thông
hiểu bản chất của vấn đề, yêu cầu của bàitoán đặt ra, cần vận dụng sáng tạo, linh hoạt
để có phương pháp giải nhanh nhất, chính xác nhất.
2. Kiến nghị
Các dạng bài tập về di truyền học là rất đa dạng, do giới hạn về nội dung và thời
gian thực hiện đề tài em chỉ mới trình bày một số dạng bài tập cơ bản thường hay gặp
và công cụ cần và đủ để có thể ứng dụng xác suất nhị thức, một mảng nhỏ của xác suất
thông kê vào giải bài tập.
Quá trình thực hiện đề tài, em nhận thấy đây là một đề tài rất hay, dù chỉ mới
tiếp cận một phần rất nhỏ các dạng bài tập di truyền. Đề tài này nên cần được mở rộng
phạm vi nghiên cứu hơn nữa, mở rộng các dạng bài tập và các phương pháp giải, thành
đề tài “Ứng dụng xác suất tổ hợp – thống kê trong giải bài tập di truyền học”.
18
BÀI TẬP LỚN
Ứng dụng xác suất nhị thức để giải bài tập di truyền
Tài liệu tham khảo: