Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định gen ở Việt Nam (LV thạc sĩ) - Pdf 41

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

NGUYỄN NHƢ GIANG

KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC
LOCUS GEN (ADN) HỆ IDENTIFILER CỦA
DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC
GIÁM ĐỊNH GEN Ở VIỆT NAM

LUẬN VĂN THẠC SỸ SINH HỌC

HÀ NỘI - NĂM 2014

Số hóa bởi trung tâm Học liệu– ĐHTN




BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

LUẬN VĂN THẠC SỸ SINH HỌC

LỜI CẢM ƠN
Lời đầu tiên, tôi xin được gửi lời cảm ơn tới các Thầy, cô đã giảng dạy tại
Viện sinh thái và tài nguyên sinh vật - Viện hàn lâm khoa học và công nghệ Việt
Nam đã truyền đạt cho tôi những kiến thức cơ bản và chuyên sâu về lĩnh vực
Công nghệ sinh học, làm tiền đề cho tôi hoàn thành Luận văn tốt nghiệp.
Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc tới PGS. TS Nguyễn Văn Hà
- Phó giám đốc Trung tâm giám định sinh học pháp lý - Viện Khoa học hình sự
đã tận tình hướng dẫn trong thời gian tôi thực hiện luận văn này.
Tôi xin cảm ơn Lãnh đạo Viện khoa học hình sự, Lãnh đạo Trung tâm giám
định sinh học pháp lý, toàn bộ tập thể cán bộ Trung tâm đã tạo mọi điều kiện
giúp đỡ tôi.
Cuối cùng, tôi xin cảm ơn gia đình đã luôn tạo điều kiện tốt nhất cho tôi
trong suốt quá trình học cũng như hoàn thành luận văn tốt nghiệp.
Hà Nội, ngày 10 tháng 12 năm 2014
Học viên

Nguyễn Nhƣ Giang

Số hóa bởi trung tâm Học liệu– ĐHTN




CÁC KÍ HIỆU VIẾT TẮT
ADN

Axit Deoxyribonucleic

STR


D13

D13S317

D16

D16S539

D2

D2 S1338

D19

D19S433

D18

D18S51

D5

D5 S818

χ²

Khi bình phương thành phần thí nghiệm

χα


2.2.3. Hóa chất và thiết bị cho nhân bội và điện di ................................. 18
2.3. Phân tích mẫu ................................................................................................. 18
2.3.1. Tách chiết mẫu bằng chelex ......................................................... 18
2.3.2. Định lượng ADN bằng Realtime PCR......................................... 19
2.3.3. Nhân bội ADN (PCR) .................................................................. 20
2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)
................................................................................................................. 22
Số hóa bởi trung tâm Học liệu– ĐHTN




2.4. Xử lý thống kê số liệu và tính tần suất các locus gen .......................... 25
2.4.1. Cơ sở lý thuyết .............................................................................. 25
2.4.2. Phương pháp xử lý thống kê ........................................................ 25
2.4.3. Các bước tính toán thống kê và kiểm định tiến hành trên phần
mềm Excel:.............................................................................................. 26
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN ....................... 27
1. Kết quả ................................................................................................................. 27
1.1. Thu mẫu ........................................................................................... 27
1.2. Phân tích mẫu thu được kiểu gen theo yêu cầu và lập được bảng
kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục) .......................................... 27
1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính được bảng tần
suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với
một số quần thể người Việt và người nước ngoài (Xem bảng 3.31 đến
3.45). ......................................................................................................................... 27
1.3.1. Xử lý số liệu thống kê ................................................................... 27
1.3.2. Bảng tần suất của các mẫu nghiên cứu ......................................... 49
Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15
locus gen (gồm bảng 3.16 đến bảng 3.30) .............................................. 49

(Phần phụ lục)

Số hóa bởi trung tâm Học liệu– ĐHTN




MỞ ĐẦU
Cơ sở khoa học, thực tiễn và tính cấp thiết của việc nghiên cứu đề tài:
Người đầu tiên đặt nền móng cho ngành di truyền học là Mendel. Ông
là người đầu tiên phát hiện ra các quy luật di truyền. Mendel đã gọi những đặc
điểm được truyền từ thế hệ này qua thế hệ khác là “nhân tố di truyền”, mà sau
này được gọi là gen.
Trong nhân tế bào, các nhiễm sắc thể sắp xếp thành 23 cặp, trong đó 22
cặp nhiễm sắc thể thường và 1 cặp nhiễm sắc thể giới tính. Các cặp nhiễm sắc
thể này quy định các tính trạng khác nhau của cơ thể, được bảo tồn duy trì
trong thế hệ và được di truyền từ thế hệ này sang thế hệ khác. Con cái được
thừa hưởng các đặc tính di truyền thông qua 23 nhiễm sắc thể từ tinh trùng
của bố và 23 nhiễm sắc thể từ tế bào trứng của mẹ. Xét nghiệm truy nguyên
cá thể người cũng như xác định huyết thống trực hệ cha - con, mẹ - con chủ
yếu được thực hiện bằng cách sử dụng các marker ADN nằm trên các NST
trong nhân tế bào. Ngoài ra phân tích các marker trên nhiễm sắc thể Y còn có
thể xác định quan hệ huyết thống theo dòng cha.
ADN thường được coi là vật liệu di truyền ở cấp độ phân tử tham gia
quyết định các tính trạng. Trong quá trình sinh sản, phân tử ADN được nhân
đôi và truyền cho thế hệ sau. Năm 1953, Watson và Crick đã xây dựng mô
hình cấu trúc không gian của phân tử ADN. Theo hai ông, ADN có cấu trúc
từ hai sợi xoắn kép có phân tử lượng rất lớn, mỗi sợi ADN là một chuỗi xoắn
nucleotid gồm 4 loại bazơ nitơ: Adenin (A), Guanin (G), Cytosin (C) và
Thymin (T) sắp xếp kế tiếp nhau, xoắn đều quanh một trục theo chiều từ trái

Trong các điều kiện cần phải có khi kết luận giám định ADN thì có một
điều kiện bắt buộc đó là phải có cơ sở dữ liệu tần suất alen của các locus gen
dùng cho giám định gen đối mỗi quần thể người (dân tộc) cụ thể. Hiện nay,
trên thế giới, các đơn vị giám định ADN đang sử dụng phổ biến các bộ Kit
với 16 locus gen như bộ kit Identifiler, Identifiler Plus và Identifiler Direct
2


(hãng AB, Mỹ) hoặc bộ kit Powerplex (hãng Promega, Mỹ)… để tính toán tần
suất xuất hiện của các alen. Trên cơ sở đó tính toán xác suất trùng nhau giữa
các mẫu khi phải truy nguyên đồng nhất hoặc xác suất quan hệ huyết thống
giữa các mẫu khi phải xác định quan hệ huyết thống trong giám định ADN.
Ở Việt Nam hiện nay, Viện Khoa học hình sự và đa số các cơ quan, tổ
chức giám định đang sử dụng các bộ kit Identifiler, Identifiler Plus, và
Identifiler Direct cho giám định ADN. Năm 2011, bảng tần suất các alen của
các locus gen của hệ Identifiler trong quần thể người Việt (Kinh) được công
bố trên tạp chí ForensicAsia. Cho đến nay, chưa có một nghiên cứu nào được
công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ
Identifiler (gồm 15 gen) trong quần thể người H’Mông. Với dân số khoảng
80.000 người (đứng thứ 8 trong tổng số 54 các dân tộc Việt Nam), dân tộc
H’Mông phân bố khắp trên các tỉnh miền núi phía Bắc Việt Nam: Quảng
Ninh, Lạng Sơn, Bắc Cạn, Cao Bằng, Hà Giang, Tuyên Quang, Yên Bái, Lào
Cai, Lai Châu, Điện Biên, Sơn La, Hoà Bình, Thanh Hoá, Nghệ An và số ít ở
Phú Thọ, cũng như các tỉnh Tây Nguyên, đây là những điểm nóng về tình
hình an ninh và trật tự xã hội, số vụ án trong cộng đồng người H’Mông có
diễn biến phức tạp với xu hướng ngày càng gia tăng. Vì vậy, việc tiến hành
triển khai đề tài nghiên cứu: “Khảo sát tần suất các alen trong các locus gen
(ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định
gen ở Việt Nam” là một yêu cầu cấp thiết.
Mục đích của đề tài :

Đề tài này khi được hoàn thành sẽ đáp ứng yêu cầu của giám định
gen ở Việt Nam nói chung và đóng góp vào nhiệm vụ giám định ADN
cho các lực lượng thực thi pháp luật trên toàn cầu, nhất là trong bối
cảnh toàn cầu hóa giữa cảnh sát các nước thông qua Interpol.

4


CHƢƠNG 1. TỔNG QUAN TÀI LIỆU
1. Tình hình nghiên cứu trong và ngoài nƣớc về khảo sát tần suất các
alen của các locus gen sử dụng trong giám định ADN.
1.1. Tình hình nghiên cứu trên thế giới
Trên thế giới, ở các nước có phòng giám định gen đều đã nghiên cứu,
khảo sát và công bố kết quả của mình về sự phân bố tần suất các alen của các
gen hình sự. Ví dụ như tập đoàn Applied Biosystem (Mỹ) khảo sát 15 gen của
người Mỹ - Phi, người Mỹ - Tây Ban Nha ... Kết quả khảo sát 15 gen của
người Malaixia, Philipin, Hàn quốc, Guatemala, Sudan, Thái lan, Vênêzuela,
Bănglađet, Inđônêsia... đã được công bố. Đây là những số liệu rất có giá trị
không chỉ đối với lĩnh vực giám định gen của các nước đó mà còn có giá trị
về mặt khoa học đối với các giám định viên và các nhà khoa học nghiên cứu
về gen sử dụng trong giám định ADN trên thế giới [15, 26, 27].
Trong giám định ADN, bên cạnh việc sử dụng rộng rãi bộ kít của hãng
Applied Biosystem, bộ kít của hãng Promega cũng được nhiều nơi sử dụng
[14]. Ví dụ tại Mỹ, mỗi bang có từ 1 đến nhiều phòng thí nghiệm giám định
ADN và có thể dùng kit hệ Identifiler hoặc kit PowerPlex. Để thống nhất trên
toàn nước Mỹ, cảnh sát liên bang Mỹ (FBI) hiện dùng cơ sở dữ liệu tần suất
của 13 locus gen (trùng nhau trong hệ Identifiler và hệ PowerPlex) trong phần
mềm CODIS (Combined DNA index system) - một phần mềm nổi tiếng để
truy xuất, tìm kiếm, so sánh dữ liệu trong giám định ADN. Phần mềm này
đang được triển khai ở 49 quốc gia và vùng lãnh thổ trên thế giới.

Identifiler trong quần thể người H’Mông được công bố.
2. Giám định gen (ADN)
2.1. Cơ sở khoa học của giám định gen
2.1.1. Cấu trúc, chức năng của phân tử ADN
Năm 1953, hai nhà nghiên cứu khoa học James D.Watson (Mỹ) và
Francis H.C Crick (Anh) đã công bố mô hình cấu trúc chuỗi xoắn kép phân tử
ADN. Đây là dấu mốc chính thức đánh dấu sự ra đời của Sinh học phân tử.
Các nhà khoa học đã phát hiện ra bản chất di truyền nằm trên cấu trúc
nhiễm sắc thể. Nhiễm sắc thể được cấu trúc từ phân tử ADN kết hợp với các
6


protein kiềm (histon). Phân tử ADN là một chuỗi xoắn kép gồm hai mạch
đơn, mỗi mạch đơn là một chuỗi nucleotide. Mỗi nucleotide gồm nhóm
phosphate, đường deoxyribose và một trong bốn base (adenine, cytosine,
guanine và thymine). Hai mạch đơn kết hợp với nhau nhờ các liên kết hydro
hình thành giữa các base bổ xung nằm trên hai mạch: base adenine (A) liên
kết với base thymine (T) bằng hai liên kết hydro (A=T); base cytosine (C) liên
kết với base guanine (G) bằng ba liên kềt hydro (CG). Mỗi mạch đơn là một
trình tự có định hướng với một đầu là đầu 5'phosphate tự do và một đầu là
3'hydroxyl tự do (hướng quy ước là 5’3'). Hướng của hai mạch đơn trong
chuỗi xoắn kép ngược nhau và là hai mạch đối song song.

Hình 1. Cấu trúc ADN
2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính
Năm 1956, Joe Hin Tjio và Albert Levan đã xác định chính xác ở
người, trong nhân tế bào thể (tế bào lưỡng bội) có 46 nhiễm sắc thể (NST)
được xếp thành 23 cặp đồng dạng: 22 cặp nhiễm sắc thể thường và một cặp

7



Các cấu trúc STR đều mang tính bảo thủ cao, được di truyền qua các thế
hệ và mang tính đặc trưng cho cá thể. Các gen này thường có tính đa hình
cao, ít đột biến, tương đối bền vững và cho phép đồng thời thực hiện được
phản ứng nhân gen của nhiều gen khác nhau.
Dựa trên tính đa hình của các cấu trúc STR về chiều dài: Một số gốc
nucleotid được lặp đi lặp lại nhiều lần trên chiều dài của đoạn ADN.
Ví dụ: tại locus D7S820 của một cá thể, các alen phân biệt nhau bằng
số đoạn lặp GATA.
GATA GATA... ............GATA  có 8 đoạn lặp

Alen thứ nhất:
GATA
Alen thứ hai:

GATA GATA GATA... GATA 12 đoạn lặp GATA

Locus D7S820 này là dị hợp tử với các alen là: 8 - 12.
Các locus STR có ưu điểm hơn các locus VNTR vì chúng bền vững
hơn (ít bị đột biến và đứt gãy), có khả năng nhân tổ hợp được nhiều gen trong
cùng một phản ứng PCR và những mẫu đem phân tích ít nhiều có biến tính
vẫn có thể cho kết quả.
Tháng 10 năm 1990, tại Mỹ, Dự án hệ gen người (Human Genome
Project-HGP) chính thức khởi động. Đến ngày 12 tháng 02 năm 2001, HGP
và Celera đã công bố trình tự đầy đủ của hệ gen người. Đây là một sự kiện
trọng đại trong sự phát triển của sinh học phân tử nói chung và trong việc
nghiên cứu gen người nói riêng. Theo công bố này, số lượng gen trong bộ gen
người có khoảng 35000 gen, trong đó có hàng chục gen được nghiên cứu ứng
dụng để sử dụng xác định huyết thống và truy nguyên cá thể [19].

loại giám định truy nguyên theo nhóm …
Số lượng locus gen được sử dụng phân tích càng nhiều thì khi tính toán
xác suất xuất hiện để truy nguyên hoặc tính quan hệ huyết thống cho kết quả

10


có độ tin cậy càng cao. Theo tập đoàn Perkin-Elmer (Mỹ), khi phân tích tổ
hợp 9 locus gen hệ Profiler Plus thì khả năng trùng hợp ngẫu nhiên tổ hợp các
kiểu gen là vô cùng nhỏ, vì tần suất xuất hiện của chúng là khoảng 1/72 tỉ
[29].
Trong vài năm trở lại đây, trên thế giới cũng như ở Viện Khoa học hình
sự đã đưa vào sử dụng bộ kit Identifiler phân tích 16 locus gen bằng máy giải
trình tự gen ABI 3130 Genetic Analyzer [6, 15].
Đây là bộ kit phức hợp dùng nhân bội, phân tích đồng thời 16 locus
STR. Đặc điểm của các locus gen STR trong bộ kit này:
- Locus gen D8S1179 nằm trên nhiễm sắc thể số 8, dài 128 - 168 cặp
bazơ, có 12 alen
- Locus gen D21S11 nằm trên nhiễm sắc thể số 21, dài 189 - 243 cặp
bazơ, có 35 alen
- Locus gen D7S820 nằm trên nhánh dài nhiễm sắc thể số 7, dài 258 294 cặp bazơ, có 11 alen
- Locus CSF1PO nằm trên nhánh dài nhiễm sắc thể số 5, dài 284 - 312
cặp bazơ, có 8 alen
- Locus gen D3S1358 nằm trên nhánh ngắn nhiễm sắc thể số 3, dài 114
- 142 cặp bazơ, có 12 alen
- Locus HUMTH01 nằm ở intron 1 của gen tyrosine hydroxylase
người, trên nhánh ngắn nhiễm sắc thể số 11, dài 168 - 192 cặp bazơ, có 7 alen
- Locus gen D13S317 nằm trên nhánh dài nhiễm sắc thể số 13, dài 206
- 234 cặp bazơ, có 9 alen
- Locus gen D16S539 nằm trên nhiễm sắc thể số 16, dài 245-269 cặp



truyền từ mẹ. Nếu hai alen của một locus hoàn toàn giống nhau thì được gọi
là đồng hợp tử, còn khác nhau được gọi là dị hợp tử [14, 19].
2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN
Giám định ADN hiện nay sử dụng các locus STR là chủ yếu. Phương
pháp giám định gen có độ tin cậy rất cao bởi các locus STR có tính đa alen
(tính đa hình) rất cao, mỗi alen chỉ xuất hiện trong quần thể với tần số rất thấp
[14, 24]. Locus STR ngắn nên có thể đồng thời phân tích được ba hoặc nhiều
STR hơn trong cùng một thời điểm. Việc phân tích đa hệ rất có giá trị vì
chúng có kết quả phân biệt lớn và thành công ngay cả một số trường hợp mẫu
lẫn hoặc đã bị phân hủy phần nào [13].
Một locus STR được sử dụng cho mục đích nhận dạng và xác định cá
thể phải đảm bảo các thông số sau:
- Có tính bền vững cao (tần suất đột biến thấp)
- Locus STR phải có tính đa hình và mức độ dị hợp tử cao. Điều này
giúp các nhà phân tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân
biệt cá thể một cách tốt nhất.
- Các locus STR có độ dài ngắn, trung bình từ 100 - 400 bp so với các
đoạn đa hình ngẫu nhiên khác. Các đoạn ADN ngắn có độ bền vững cao, ít bị
đứt gãy dưới tác động của điều kiện ngoại cảnh. Do vậy, khi tiến hành PCR
sẽ thu được hiệu quả tốt hơn các đoạn ADN dài.
- Các locus chứa đoạn STR phải đảm bảo yếu tố di truyền độc lập, do
vậy nên lựa chọn tổ hợp các locus nằm trên các nhiễm sắc thể khác nhau là rất
quan trọng. Các STR thông thường có rất nhiều alen, độ dài của các alen
thông thường khác nhau số đoạn lặp. Do vậy, việc sử dụng các STR có chiều
dài dưới 400 base để dễ dàng phân tích là một yêu cầu cần thiết trong quá
trình lựa chọn.

13


Giám định gen (ADN) đòi hỏi cơ sở khoa học vững chắc để tính toán
xác suất một người ngẫu nhiên trong quần thể là người có cấu trúc di truyền
đặc trưng trùng lặp với ADN trong các mẫu vật (thu thập được trong quá trình
điều tra, phá án) [7, 21, 23]. Nếu không có tần suất alen thì không tính toán
được tần suất xuất hiện của một kiểu gen nào đó trong một quần thể nhất định
[7, 29].
Trong trường hợp cần xác định huyết thống, để kết luận một người có
phải là cha đẻ hoặc mẹ đẻ của người con không, phải dựa vào khả năng cho
nhận của các alen và phải căn cứ vào tần suất alen để tính ra chỉ số quan hệ
huyết thống (Paternity Index - PI). Từ đó tính độ tin cậy đạt được. Mặt khác,
đó cũng là cơ sở khoa học để so sánh độ tin cậy trong trường hợp phân tích
được nhiều locus gen hoặc ít locus gen hơn [7, 21, 24].
Như vậy Chương I đã trình bày tình hình nghiên cứu, giám định ADN
trong, ngoài nước và tại Viện Khoa học hình sự. Cơ sở khoa học, khái niệm
giám định ADN và các phương pháp giám định ADN. Giám định ADN hiện
nay sử dụng các locus STR là chủ yếu, có độ tin cậy rất cao, mỗi alen chỉ
xuất hiện trong quần thể với tần số rất thấp [14, 24]. Việc xác định tần suất
các alen trong giám định ADN là cần thiết, là cơ sở khoa học để cơ quan
giám định sử dụng để phân tích và đưa ra kết luận trong giám định gen. Hiện
nay đã có một số công trình nghiên cứu tần suất các alen hệ Identifiler của
quần thể một số dân tộc tại Việt Nam song chưa có công trình nào nghiên
cứu tần suất các alen hệ Identifiler của quần thể người H’Mông nên việc lựa
chọn đề tài nghiên cứu tần suất các alen trong các locus gen hệ Identifiler
với quần thể người dân tộc H’Mông là cần thiết và có ý nghĩa cao cả về khoa
học và thực tiễn.

15



Nhân bội ADN (PCR) bằng Kit
Identifiler

Điện di ADN trên máy AB 3130

Phân tích kết quả trên phần mềm
Genmapper ID 3.2

2.2. Hóa chất, thiết bị và dụng cụ:
2.2.1. Hóa chất và thiết bị cho tách chiết ADN
STT
1
2
3
4
5
6

Tên hoá chất, thiết bị
Dung dịch Chelex 100, tỷ lệ 5%
Block nhiệt khô cho ống 1,5ml (1000C) kèm nhiệt kế
Máy li tâm ống 1,5ml 14.000v/p
Tủ an toàn sinh học
Ống tách chiết 1,5ml
Các đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng

17


2.2.2. Hóa chất và thiết bị cho định lƣợng ADN

9
10
11
12

POP 4 (ABI)
Liz 500 Gene scan
HIDI formamide
Buffer 10X for AB - 3130
Capilary 3130 (36cm x 50µl)
Optical plate 96 well
Septa
Ống PCR (0,25 ml) và điện di (0,5 ml)
Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng.

2.3. Phân tích mẫu
2.3.1. Tách chiết mẫu bằng chelex
Chelex là một loại nhựa tạo phức có ái lực cao đối với các ion kim loại
đa hoá trị. Nó là hợp chất trùng ngưng styrene divinylbenzene có chứa các
cặp ion imminodiaxetat hoạt động là nhóm tạo phức. Sự có mặt của chelex ở
nhiệt độ 1000C sẽ ngăn cản sự biến tính của ADN vì nó gắn được với các ion
18



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status