ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------------
NGUYỄN VĂN THÀNH
SỬ DỤNG MỘT SỐ CHỈ THỊ PHÂN TỬ TRONG
NGHIÊN CỨU TIẾN HÓA CÁC LOÀI MANG
(MUNTIACINAE) Ở VIỆT NAM NHẰM
PHỤC VỤ BẢO TỒN
LUẬN VĂN THẠC SĨ KHOA HỌC
HÀ NỘI - 2015
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------------
NGUYỄN VĂN THÀNH
SỬ DỤNG MỘT SỐ CHỈ THỊ PHÂN TỬ TRONG
NGHIÊN CỨU TIẾN HÓA CÁC LOÀI MANG
(MUNTIACINAE) Ở VIỆT NAM NHẰM
PHỤC VỤ BẢO TỒN
Chuyên ngành
: Di truyền học
Cuối cùng, tôi muốn gửi lời cám ơn chân thành tới gia đình, người thân,
bạn bè, những người đã luôn ở bên cổ vũ và động viên tôi vượt qua mọi khó
khăn trong quá trình học tập và nghiên cứu.
Hà Nội, tháng 06 năm 2015
Học viên
Nguyễn Văn Thành
MỤC LỤC:
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT
i
DANH MỤC CÁC HÌNH
ii
DANH MỤC CÁC BẢNG
iii
MỞ ĐẦU
1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
2
CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1. Vật liệu nghiên cứu
16
16
1.1. Mẫu vật nghiên cứu
16
1.2. Hóa chất sử dụng trong nghiên cứu
16
1.3. Các cặp mồi sử dụng cho phản ứng PCR
17
1.4. Các thiết bị sử dụng cho nghiên cứu:
23
2. Phương pháp nghiên cứu
23
2.1. Tách chiết ADN tổng số
23
35
4.1. Nhánh A - Nhánh Mang Ấn Độ
36
4.2. Nhánh B
36
5. Kết quả phân tích thời gian tiến hóa
KẾT LUẬN VÀ KIẾN NGHỊ
42
45
KẾT LUẬN
45
KIẾN NGHỊ
46
TÀI LIỆU THAM KHẢO
47
Ethylen Diamine Tetraacetic Acid
Axit ethylen diamin tetraaxetic
kb
kilobase(=1000bp)
Kilo bazơ
ML
Maximum Likelyhood
Hợp lý tối đa
MP
Maximum Parsimony
Tiết kiệm tối đa
mtDNA
mitochondrial DNA
Hệ gen ty thể
OD
unweighted pair group with
arithmetic mean
arithmetic mean
UPGMA
i
DANH MỤC CÁC HÌNH
Hình 1.
Mang Ấn Độ (M. vaginalis)
4
Hình 2.
Mang Vũ Quang (M. vuquangensis)
6
Hình 3.
Mang Trường Sơn (M truongsonensis)
7
(450bp) trên gel Agarose 1%, marker 100bp
Hình 10.
Ảnh điện di một số sản phẩm nhân phân đoạn gen G-fib
(450bp) trên gel Agarose 1%, marker 100bp
Hình 11.
Ảnh điện di sản phẩm PCR lần 1 và lần 2
Hình 12.
Tín hiệu bị nhiễu của các nucleotide đầu trong phản ứng
giải trình tự
Hình 13.
Cây phát sinh chủng loại thu được dựa trên dữ liệu gen
cytochrome b (1140bp) sử dụng phương pháp Bayesian
Hình 14.
31
31
32
32
33
33
33
Số lượng cây không gốc và có gốc với số lượng taxa
10
từ 2 - 10
Bảng 3.
Danh sách và thông tin mồi sử dụng cho nghiên cứu
17
Bảng 4.
Thông tin mã số ngân hàng gen các trình tự cùng tên
18
mẫu, địa điểm thu mẫu
Bảng 5.
Thành phần phản ứng PCR
25
Bảng 6.
Chu trình nhiệt phản ứng PCR
25
MỞ ĐẦU
Việt Nam được biết đến là một đất nước đa dạng cao về hệ sinh thái, sông ngòi,
cũng như hệ thống các loài động thực vật. Các vùng tự nhiên của Việt Nam có
nhiều loài và nhiều trong số đó không tìm thấy ở nơi khác trên thế giới. Các nghiên
cứu nhằm tìm kiếm các loài mới, đánh giá chi tiết về mức độ đa dạng của hệ thống
động thực vật ở Việt Nam đã và đang được tiếp tục thu hút sự quan tâm của các nhà
nghiên cứu. Tuy nhiên, vẫn còn rất nhiều loài ở Việt Nam chưa được nghiên cứu chi
tiết bởi nhiều khó khăn gặp phải trong quá trình nghiên cứu.
Cụ thể, trong 15 năm trở lại đây, năm loài Mang (Muntiacus) đã được tìm thấy
ở Việt Nam dưới dạng loài mới hoặc được xác nhận là có ở trong nước [7 , 12 , 42].
Mặc dù vậy, vẫn chưa có các nghiên cứu chi tiết, đánh giá phân bố, đa dạng di
truyền cũng như quan hệ tiến hóa giữa các loài Mang trên lãnh thổ Việt Nam. Điều
này một phần do tính quý hiếm, khó bắt gặp cùng tập tính nhút nhát của các loài
Mang. Ngoài ra, chúng đã được xếp vào hạng mục thiếu dữ liệu, sắp nguy cấp và
nguy cấp trong sách đỏ thế giới. Do đó, việc điều tra sử dụng các phương pháp
truyền thống có thể không đánh giá được chính xác mức độ đa dạng trong nhóm
này, vì những mẫu thu được từ điều tra thực địa hầu như không cho phép thực hiện
những nghiên cứu so sánh kỹ lưỡng về mặt hình thái. Trong khi đó, với sự phát
triển của sinh học phân tử trong những năm gần đây, những phương pháp sử dụng
ADN đã dần trở thành những công cụ hữu hiệu để điều tra tổng thể những loài khó
bắt gặp và có thể giúp làm sáng tỏ những mối quan hệ tiến hóa của những loài được
nghiên cứu. Trong hoàn cảnh này, việc nhận dạng sử dụng phương pháp thu mẫu
không trực tiếp dựa, và các chỉ thị phân tử ADN đối với các mẫu Mang hứa hẹn có
hiệu quả cao.
Vì vậy, chúng tôi thực hiện đề tài “Sử dụng một số chỉ thị phân tử trong
nghiên cứu tiến hóa các loài Mang (Muntiacinae) ở Việt Nam nhằm phục vụ
bảo tồn” với mục đích đánh giá cụ thể mức độ đa dạng, cũng như phân bố, cùng
mối quan hệ tiến hóa của các loài Mang ở Việt Nam.
2
atherodes) là loài đặc hữu ở Borneo. Trong suốt một thời gian dài, đã có sự nhầm
lẫn giữa loài Mang vàng Borneo và loài Mang thường [30].
Bảng 1. Danh sách các loài Mang trên thế giới
STT
Tên loài
Phân bố
1
Muntiacus atherodes
Đảo Borneo (Brunei, Indonesia và Malaysia)
2
Muntiacus crinifrons
Trung Quốc
3
Muntiacus feaes
Myanmar, Thái Lan
Muntiacus putaoensis
Ấn độ, Myanmar
10
Muntiacus reveesi
Trung Quốc, Đài Loan
11
Muntiacus rooseveltorum
Lào, Việt Nam
12
Muntiacus truongsonensis
Lào, Việt Nam
13
Muntiacus vuquangensis
Lào, Việt Nam
Campuchia, Ấn Độ, Lào, Myanmar, Thái
Lan, Việt Nam, Trung Quốc.
Myanma, Bali và Borneo một số nhà nghiên cứu đã cho thấy loài này có sự đa dạng
rất cao về mặt di truyền và có rất nhiều phân loài đã được mô tả dựa trên vùng phân
bố về địa lý [16].
4
1.1.2.2. Mang Pù Hoạt (M. puhoatensis)
Loài Mang này được mô tả một cách ngẫu nhiên trong một bài báo phổ thông
[10] dựa trên cơ sở các mẫu gạc và một phần trán được Lê Trọng Trải và Đỗ Tước
thu được từ khu vực Pù Hoạt, Quế Phong, Nghệ An, Việt Nam vào năm 1997 [41].
Tuy vậy, loài Mang này chưa từng được nghiên cứu chi tiết về mặt hình thái cũng
như chưa từng được đưa vào những nghiên cứu xây dựng cây phát sinh chủng loại
để đánh giá tính xác thực về mặt di truyền. Vì vậy, trong nghiên cứu này, chúng tôi
sẽ tiến hành phân tích di truyền cho loài này dựa trên các mẫu được xác định về mặt
hình thái là của loài Mang Pù Hoạt.
1.2.3. Mang Roosevelt (M. rooseveltorum)
Loài Mang Roosevelt được mô tả vào năm 1932 bởi Osgood [33] và trong
suốt 60 năm tiếp theo không có bất kỳ mẫu vật nào được ghi nhận. Loài này được
ghi nhận tại 3 địa điểm ở Lào, và các mẫu thu được từ thợ săn đều là các mẫu vật
không nguyên vẹn. Cụ thể, vào tháng 2 năm 1995, hai mẫu xương sọ gần như
nguyên vẹn và 6 phần xương sọ khác đã được tìm thấy tại Lào [7]. Loài này hiện
nay được xếp vào hạng mục thiếu dữ liệu trong danh sách đỏ thế giới (IUCN). Hiện
nay phân loại cho loài này còn khá nhiều tranh cãi. Về mặt hình thái, loài này rất
khó phân biệt với các loài Mang có quan hệ gần khác như Mang Putao và Mang
Trường Sơn. Nguyên nhân của vấn đề này là bởi sự hạn chế của số lượng mẫu vật
cho đến nay rất ít [42]. Trong nghiên cứu của chúng tôi, khi thực hiện khảo sát ở hai
khu bảo tồn ở miền Trung Việt Nam là khu bảo tồn thiên nhiên (KBTTN) Xuân
Liên và khu bảo tồn thiên nhiên Pù Hoạt cùng với khu vực vùng biên giới với Lào,
chúng tôi đã tìm thấy một số mẫu có hình thái được cho là của loài này. Khi thực
chứng minh là một loài mới dựa trên cơ sở về kích thước và sự sai khác của trình tự
6
ADN của các gen ty thể giữa Mang lớn, Mang Ấn Độ, Mang Trung Quốc
(Muntiacus reevesi) [19].
Vncreatures
W. Robichaud
Hình 3. Mang Trường Sơn (M. truongsonensis)
1.2.5. Mang Trường Sơn (M. truongsonensis)
Về mặt hình thái, Mang Trường Sơn (Hình 3) được mô tả có kích thước cơ
thể nhỏ hơn Mang Ấn Độ. Chúng có màu đen, trọng lượng xấp xỉ 15kg; đuôi rộng
và ngắn, đen ở đỉnh đồng thời có dải trắng bên dưới. Hộp sọ của Mang Trường Sơn
nhỏ hơn so với Mang thường, gạc chính ngắn [36]. Trình tự ADN của 6 mẫu có đặc
điểm nhận dạng của Mang Trường Sơn cho thấy đây là loài Mang khác với các loài
đã biết. Với phát hiện mới này, đây là loài móng guốc thứ 3 được xác nhận là loài
mới ở Việt Nam trong vòng 5 năm. Mang Trường Sơn là loài Mang thứ hai được
tìm thấy và mô tả ở dãy Trường Sơn là loài mới sau Mang Vũ Quang (M.
vuquangensis). Các mô tả này dựa trên hình thái xương sọ, trình tự ADN và thông
qua phỏng vấn người dân [36].
Trong các loài trên, ngoại trừ loài Mang Ấn Độ, bốn loài Mang còn lại đều
được tìm thấy trong vòng 15 năm trở lại đây hoặc dưới dạng loài mới hoặc được xác
nhận là có mặt trong nước. Những loài Mang cho đến nay vẫn được coi là không có
ở Việt Nam nhưng phân bố ở gần biên giới , như loài M. reevesi có thể có mặt ở
nước ta nếu có những điều tra chi tiết hơn ở khu vực phía Bắc. Đồng thời loài Mang
7
hành xác định chính xác trình tự các nucleotide trên đoạn gen mong muốn. Dựa vào
8
tốc độ biến đổi của các nucleotide trên các vùng gen, chúng ta có thể xác định mối
quan hệ di truyền giữa các loài. Cụ thể, mức độ thay thế các nucleotide tại mỗi vùng
ADN của hệ gen là khác nhau và phụ thuộc áp lực chọn lọc tự nhiên trên mỗi locut
và chức năng của sản phẩm gen. Tuy vậy, ở các locut có áp lực chọn lọc tương
đương thì tốc độ thay đổi trong các trình tự ADN là ổn định, khi xét trong quãng
thời gian tiến hóa lâu dài. Quan hệ di truyền giữa tất cả các dạng sống đều có thể
được xác định dựa trên việc so sánh các chỉ thị phân tử giữa chúng với nhau. Có
nhiều phương pháp được thiết lập nhằm xác định mối quan hệ di truyền giữa các
loài. Một trong nhưng phương pháp cơ bản nhất là xây dựng sơ đồ hình cây dựa
trên các chỉ thị di truyền để mô tả mối quan hệ giữa các loài, gọi là cây phát sinh
chủng loại hay cây tiến hóa (Phylogenetic tree). Ngoài việc khắc phục được một số
hạn chế của phân loại học truyền thống, nó cũng có nhiều ưu điểm khác như: kết
quả thí nghiệm thường khách quan, chính xác, không phụ thuộc vào chủ quan của
người quan sát như trong phân loại học dựa trên hình thái [25].
Cơ sở phân loại của phương pháp này chủ yếu dựa trên trình tự ADN được xây
dựng từ bốn nucleotide là giống nhau ở mọi sinh vật do đó tiện so sánh, nghiên cứu
ngay cả ở những sinh vật khác xa nhau [25]. Sự sai khác trong các trình tự ADN
được xem là kết quả của quá trình tiến hóa phân tử theo thời gian. Do vậy, các nhà
khoa học xây dựng cây phát sinh chủng loại bằng việc so sánh các trình tự ADN và
phân tích sử dụng các thuật toán xác suất. Cây phát sinh chủng loại thể hiện đa dạng
di truyền, mối quan hệ và tiến hóa giữa các nhóm sinh vật. Dựa trên loại thuật toán
xác suất được sử dụng để phân tích dữ liệu, người ta chia thành nhiều phương pháp
xây dựng cây phát sinh chủng loại khác nhau. Phân tích phát sinh chủng loại sử
dụng trình tự ADN là một phần quan trọng trong các nghiên cứu như: sinh học phân
tử, sinh học phát triển, di truyền học quần thể, tiến hóa và đa dạng sinh học [25].
Số lượng
Số lượng
taxon
cây không gốc
cây có gốc
2
1
1
3
1
3
4
3
15
5
2027025
34459425
2.2. Các phương pháp sử dụng để xây dựng cây loài phát sinh
Để xác định được cây loài phát sinh, các dữ liệu ADN thường được phân tích
bằng các thuật toán xác suất. Hiện nay nhiều dạng thuật toán khác nhau được dùng
trong các phần mềm máy tính là cơ sở của nhiều phương pháp xây dựng cây loài
phát sinh khác nhau như: ma trận khoảng cách (Distance Matrix), neighbour
joining, tiết kiệm tối đa (Maximum Parsimony), hợp lý tối đa (Maximum
Likelihood) và Bayesian. Trong nghiên này, chúng tôi sử dụng đồng thời 3 phương
10
pháp là tiết kiệm tối đa (MP), hợp lý tối đa (ML) và Bayesian nhằm so sánh các kết
quả thu được để tăng độ tin cậy cho kết quả cuối cùng. Ba phương pháp kể trên đều
đã được sử dụng rộng rãi ở các nghiên cứu tiến hóa và đã cho kết quả với độ tin cậy
tốt ở các nghiên cứu trước đây [1 , 25 , 34].
2.2.1. Ma trận khoảng cách (Distance matrix)
Ma trận khoảng cách là nhóm các thuật toán đơn giản nhất, được sử dụng từ
lâu trong các nghiên cứu tiến hóa. Trong số đó, thuật toán UPGMA (unweighted
pair group with arithmetic mean) phân tích tất cả các dấu hiệu, qua đó xác định
khoảng cách di truyền giữa tất cả các cặp mẫu, rồi gộp nhóm từng cặp mẫu có
khoảng cách di truyền ngắn nhất. Thuật toán này coi tốc độ tiến hóa của các
nucleotide là như nhau ở mọi nhánh tiến hóa. Tuy nhiên, điều này không phải lúc
nào cũng đúng, bởi vì tốc độ tiến hóa tại các vùng gen khác nhau có tốc độ khác
nhau phụ thuộc sản phẩm chúng mã hóa và áp lực chọn lọc đối với vùng gen đó [1].
Do vậy, ưu điểm của thuật toán này là có tốc độ phân tích nhanh và đơn giản,
UPGMA sẽ phù hợp nhất khi sử dụng với cây tiến hóa có tốc độ tiến hóa ở các
cấp thông tin chính xác và chi tiết hơn các phương pháp khác [1]. Tuy nhiên, khi dữ
liệu đưa vào lớn thì số cây phát sinh chủng loại thu được sẽ trở nên rất lớn (với số
taxa > 30 thì số cây phát sinh chủng loại thu có thể có > 5x1038 [1]) từ đó khiến khả
năng tính toán rất chậm. Do vậy, phương pháp này bước đầu sẽ chỉ được áp dụng
với một số lượng dự liệu nhỏ và với các mẫu có đủ số liệu.
2.2.4. Bayesian
Trong phân tích Bayesian, kết quả về phát sinh chủng loại dựa trên xác suất
hậu nghiệm thu được qua cây phát sinh chủng loại.
Bayesian là phương pháp xây dựng cây phát sinh chủng loại sử dụng Markov
Chain Monte Carlo (MCMC) có kết hợp của mô hình tiến hóa và dữ liệu đưa vào,
từ đấy tính toán ra giá trị xác suất hậu nghiệm (posterior probability - PP) của cây.
Xác suất hậu nghiệm là xác suất có điều kiện mà cây nhận được khi đưa các mô
hình vào, cơ sở dữ liệu. Phương pháp Bayesian với MCMC đã được được chấp
nhận và sử dụng rộng rãi như là một phương pháp tin cậy trong xây dựng cây phát
sinh chủng loại [22].
12
2.3. Phân tích thời gian tiến hóa
Phân tích xác định thời gian phân tách của các nhóm Mang được thực hiện
dựa trên phần mềm BEAST. Trên thực tế, đây là một gói phần mềm, bao gồm các
chương trình BEAST, BEAUti do đó gọi tắt là BEAUti & BEAST. Gói phần mềm
này sử dụng thuật toán thống kê Bayesian và do đó sẽ cần cung cấp các giá trị tiền
nghiệm kết hợp với các thông tin có được từ hệ dữ liệu phân tử. Để chạy phân tích,
chúng tôi đưa vào hai hệ dữ liệu. Hệ dữ liệu thứ nhất là dữ liệu ADN chúng tôi thu
được, hệ dữ liệu thứ hai là mốc thời gian phân tách (calibration point ) của loài
Mang và các tham số tiền nghiệm (prior) [5]. Cả hai hệ dữ liệu này được đưa vào
chương trình BEAUti, để từ đó, với phần mềm này chúng tôi lựa chọn các tùy chỉnh
phù hợp cho hai hệ dữ liệu trên, cuối cùng sẽ tạo ra file định dạng mà chương trình
hơn sao với gen nhân, bởi vì mỗi tế bào chứa hàng chục tỷ ty thể và trung bình mỗi
ty thể chứa 2 bản sao mtADN. Một khác biệt cơ bản nữa của hệ gen ty thể là gen ty
thể nằm ở tế bào chất, di truyền theo dòng mẹ (không xảy ra trao đổi chéo do không
giảm phân). Do đó, các đột biến xảy ra trên hệ gen ty hầu hết là đột biến thay thế
chứ không phải do tái tổ hợp. Với kích thước nhỏ, cùng với tốc độ đột biến thay thế
cao, hệ gen ty thể là một công cụ hiệu quả cho nghiên cứu tiến hóa, đa dạng di
truyền giữa các loài, và các quần thể [1].
Các vùng gen trong hệ gen ty thể, tùy thuộc vào tốc độ biến đổi khác nhau
được sử dụng với các mục đích nghiên cứu khác nhau. Ví dụ, với gen cytochrome b
(Cyt-b) đã đươc sử dụng trong nhiều nghiên cứu về quan hệ phát sinh chủng loại ở
động vật. Tốc độ biến đổi của gen Cyt-b phù hợp với mục đích so sánh các loài ở
mức độ giống và họ. Kết quả của rất nhiều nghiên cứu phát sinh chủng loại cho
thấy, gen Cyt-b cho các kết quả cây phát sinh chủng loại khá chính xác. Xa hơn nữa,
sử dụng gen Cyt-b có thể hỗ trợ việc xác định giống đối với các loài mới [36]. Dựa
trên các lý do tương tự, các vùng gen khác như Cytochrome c Oxidase subunit I
(COI), NADH dehydrogenase 4 (ND4) được dùng cho di truyền quần thể, quan hệ
phát sinh chủng loại ở mức độ loài và phân loài của lớp thú [24].
Hệ gen nhân có tốc độ, thời gian biến đổi chậm hơn rất nhiều so với hệ gen ty
thể. Do đó, hệ gen nhân phù hợp với việc phân tích, làm rõ các nhánh có thời gian
14
tiến hóa lâu hơn. Tuy nhiên, hệ gen nhân cũng có các hạn chế nhất định. Với các
mẫu có tuổi mẫu lớn (các mẫu của chúng tôi có tuổi mẫu xấp xỉ 10 năm kể từ khi
mẫu được thu bởi người dân) hay điều kiện bảo quản mẫu không tốt, việc nhân
dòng hệ gen nhân gặp khá nhiều khó khăn bởi số lượng bản sao ít hơn rất nhiều so
với hệ gen ty thể. Ngoài ra, kích thước lớn khiến hệ gen nhân dễ bị biến đổi, phá
hủy [1 , 8].
Từ các ưu và nhược điểm riêng của từng loại chỉ thị, chúng tôi lựa chọn sử dung
Ethanol của Merk
PCR Mastermix của Fermentas
Hotstart Taq Mastermix của Qiagen – Đức
Kit GeneJET PCR Purification – Thermo
Agarose của Invitrogen
Tris-Base của Sigma
Boric axit của Merk
EDTA của Merk
Ethidium bromide của Invitrogen
16
Marker 100bp, 1kb của Fermentas
Dye 6X của Fermentas
1.3. Các cặp mồi sử dụng cho phản ứng PCR
Các cặp mồi sử dụng cho phản ứng PCR đã được sử dụng và cho kết quả tốt
trong các nghiên cứu về nhóm Mang cũng như các nhóm thú khác trong các nghiên
cứu trước. Ngoài ra, trình tự mồi cho phản ứng nhân phân đoạn gen ND4 được
chúng tôi tự thiết kế trong nghiên cứu này. Các mồi được đặt tại hãng IDT – Mỹ.
Trình tự các cặp mồi này được thể hiện ở dưới đây (Bảng 3).
Bảng 3. Danh sách và thông tin mồi sử dùng trong nghiên cứu
Phân
Tên
đoạn
mồi
gen
Cyt-b-1
Le et al 2013
5’-CGCCTGTTTATCAAAAACAT-3’
Palumbi
BR
5’-CCGGTCTGAACTCAGATCACGT-3’
Palumbi
GL1
5’-AGAHAAYTGCTGCATCTTAGATG-3’
Gatesy et al 1997
5’-TTCRTATTTCATAATTTCTTC-3’
Gatesy et al 1997
L14724
H15149
L15162
H15915R
ND4-F
ND4-R
1991