I HC QUC GIA H NI
TRNG I HC KHOA HC T NHIấN
Lê thị bích trâm
Nghiên cứu một số locut đa hình str ở người việt nam
nhằm sử dụng trong khoa học hình sự, nhận dạng cá
thể và xác định huyết thống
Luận án tiến sĩ sinh học
H NI - 2016
1
I HC QUC GIA H NI
TRNG I HC KHOA HC T NHIấN
Lê thị bích trâm
Nghiên cứu một số locut đa hình str ở người
việt nam nhằm sử dụng trong khoa học hình sự, nhận
dạng cá thể và xác định huyết thống
Chuyên ngành
: Di truyền học
Mã số
: 62 42 70 01
Luận án tiến sĩ sinh học
đỡ tôi trong quá trình hoàn thành luận án.
PGS.TS. Trịnh Đình Đạt, Bộ môn Di truyền học - Khoa Sinh học - ĐH
Khoa học tự nhiên, ĐH Quốc Gia Hà Nội đã tận tình hướng dẫn, giúp đỡ tôi
trong quá trình hoàn thành luận án.
TS. Nghiêm Xuân Dũng, Thạc sĩ Trần Minh Đôn, Thạc sĩ Lương Thị
Yến - Tổng cục Hậu cần - Kỹ thuật - Bộ Công an đã giúp đỡ và đóng góp
những ý kiến quý báu cho tôi trong quá trình hoàn thành luận án.
Khoa Sinh học cùng các phòng chức năng, phòng Đào tạo sau ĐH Trường ĐH Khoa học tự nhiên - ĐH Quốc gia Hà Nội đã tạo điều kiện thuận
lợi cho tôi trong quá trình thực hiện luận án.
Tôi cũng xin chân thành cảm ơn PGS.TS. Nguyễn Thị Hồng Vân cùng
tập thể cán bộ, giáo viên Bộ môn Di truyền học - Khoa Sinh học - Trường ĐH
Khoa học tự nhiên - ĐH Quốc Gia Hà Nội và Lãnh đạo Viện Kỹ thuật Hóa
học, Sinh học và Tài liệu nghiệp vụ đã ủng hộ và luôn tạo điều kiện thuận lợi
cho tôi trong quá trình hoàn thành luận án.
Cuối cùng xin gửi lời cảm ơn tới toàn thể cán bộ Phòng Kỹ thuật Sinh
học nghiệp vụ - Viện Kỹ thuật Hóa học, Sinh học và Tài liệu nghiệp vụ cùng
gia đình, bạn bè luôn bên tôi, quan tâm, động viên và tạo điều kiện thuận lợi
nhất để tôi có thể hoàn thành bản luận án này.
Tác giả
4
MôC LôC
Trang
Mục lục
1
Các chữ và từ viết tắt
protein
1.1.3. Nhận dạng cá thể người qua phân tích ADN nhân
19
1.1.4. Phương pháp phân tích ADN ty thể
20
1.2. ADN và các phương pháp phân tích đa hình ADN ứng
22
dụng trong nhận dạng cá thể người
1.2.1. Cấu trúc đa dạng trong trình tự ADN có ý nghĩa
22
trong nhận dạng cá thể
1.2.2. Kü thuËt phân tích ®a h×nh chiÒu dµi đoạn ADN
24
bằng enzym giíi h¹n
1.2.3. Phương pháp nhân bội ADN (PCR)
24
1.2.4. Kỹ thuật PCR đa mồi (multiplex PCR)
31
1.3.4. Vai trò của các STR trong phân tích hình sự
32
1.3.5. Vai trò của việc lựa chọn, phối hợp các locut
34
STR khác nhau trong xác định huyết thống
1.4. Tình hình nghiên cứu nhận dạng cá thể người bằng
35
phương pháp phân tích ADN trên thế giới và tại Việt Nam
1.4.1. Tình hình nghiên cứu trên thế giới
35
1.4.2. Tình hình nghiên cứu tại Việt Nam
41
1.5. Các locut sử dụng trong nghiên cứu luận án
43
1.5.1. Các locut STR
2.2.2. Hóa chất
47
2.3. Các phương pháp nghiên cứu
49
2.3.1. Thiết kế mồi
49
2.3.2. Tách chiết ADN
51
2.3.3. Phương pháp PCR đa mồi (multiplex PCR)
51
2.3.4. Phương pháp điện di và phân tích sản phẩm PCR
53
2.3.5. Phương pháp chế tạo thang alen
55
2
3.1.4. Thiết kế mồi cho locut Amelogenin
62
3.1.5. Sàng lọc multiplex
63
3.1.6. Lựa chọn điều kiện PCR thích hợp cho phức 4
64
locut F13A01, D8S1179, HPRTB và Amelogenin
3.2. Khảo sát tần suất alen và đánh giá mức độ đa hình
74
của 15 locut STR ở quần thể người Việt (Kinh) bằng các
chỉ số thống kê.
3.2.1. Kết quả khảo sát tần suất alen 15 locut STR
74
3.2.2. Đánh giá tính đặc trưng quần thể và mức độ đa
77
hình của 15 locut STR
3.3. Chế tạo thang alen 4 locut F13A01, D8S1179,
110
110
F13A01, D8S1179, HPRTB, Amelogenin.
3.5.2. Phân tích xác định kiểu gen cá thể
111
3.5.3. Phân tích xác định huyết thống
115
KẾT LUẬN
118
KIẾN NGHỊ
120
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ
121
LIÊN QUAN ĐẾN LUẬN ÁN
122
TÀI LIỆU THAM KHẢO
PHỤ LỤC
PI
Power of Discrimination
Power of Exclusion
Paternity Index
PM
FDAH
Matching Probability
F13A01, D8S1179, Amelogenin,
HPRTB
Restriction fragment length
polymorphism
RFLP
Tiếng Việt
Axít Deoxyribonucleic
Axít Ribonucleic
Cặp bazơ
Chỉ số quan hệ huyết
thống kết hợp
Nhiễm sắc thể
Phosphate buffered saline
Polymerase chain reaction
STR
được cắt bằng enzym
giới hạn.
Đoạn ngắn lặp lại liên
tiếp
Nhiệt độ nóng chảy
Đoạn lặp lại liên tiếp
với số lượng thay đổi
Hệ thống chỉ số ADN
kết hợp
Cơ sở dữ liệu
Khoa học hình sự
DANH MỤC CÁC BẢNG
Bảng
Tên bảng
1.1 Tần suất phân bố alen 15 locut STR ở quần thể người Trung
Quốc
1.2
Tần suất phân bố alen 15 locut STR ở quần thể người Ba Lan
Trang
38
39
1.3 Tần suất phân bố alen 15 locut STR ở quần thể người Mỹ (gốc
76
3.5 Số lượng alen khảo sát được của 15 locut STR ở 250 cá thể
người Việt (Kinh)
94
3.6 Kết quả lựa chọn alen cho locut F13A01
99
3.7 Kết quả lựa chọn alen cho locut D8S1179
102
3.8 Kết quả lựa chọn alen cho locut HPRTB
106
3.9 Kết quả phân tích kiểu gen 16 locut cho 10 phạm nhân
115
3.10 Kết quả phân tích kiểu gen 16 locut mẫu (B) và (C)
6
117
65
3.2
Hình ảnh điện di sản phẩm PCR kiểm tra cặp mồi locut
Amelogenin và HPRTB
65
3.3
Ảnh hưởng của nồng độ mồi tới hiệu suất PCR và khả năng
phát hiện băng đặc hiệu tại phức 4 locut FDAH
67
3.4
Ảnh hưởng của nông độ MgCl2 tới hiệu suất PCR và khả
năng phát hiện băng đặc hiệu tại phức 4 locut FDAH
68
3.5
Ảnh hưởng của nồng độ dNTP tới hiệu suất PCR và khả
năng phát hiện băng đặc hiệu tại phức 4 locut FDAH
69
Đồ thị tần suất alen locut D7S820 ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
79
3.11
Đồ thị tần suất alen locut D13S317 ở các quần thể người
Việt (Kinh), người Ba Lan, người Trung Quốc và người Mỹ
81
3.12
Đồ thị tần suất alen locut CSF1PO ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
82
2.1
7
3.13
Đồ thị tần suất alen locut TPOX ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
3.18
Đồ thị tần suất alen locut FES/FPS ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
88
3.19
Đồ thị tần suất alen locut F13B ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
89
3.20
Đồ thị tần suất alen locut LPL ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
90
3.21
Đồ thị tần suất alen locut F13A01 ở các quần thể người Việt
(Kinh), người Ba Lan, người Trung Quốc và người Mỹ
91
3.22
3.27
Kết quả chế tạo thang alen cho locut D8S1179
104
3.28
Kết quả lựa chọn mẫu chế tạo thang alen locut Amelogenin
105
3.29
Kết quả chế tạo thang alen cho locut Amelogenin
106
3.30
Kết quả giải trình tự một số alen locut HPRTB
107
3.31
Kết quả chế tạo thang alen cho locut HPRTB
108
3.36
Hình ảnh điện di phân tích kiểu gen cá thể một số mẫu ADN
sử dụng bộ kit nhân bội ADN 3 locut D16S539 - D3S1358 vWA (FFL)
113
3.37
Hình ảnh điện di phân tích kiểu gen cá thể một số mẫu ADN
sử dụng bộ kit nhân bội ADN 3 locut F13A01 - D8S1179 Amelogenin và HPRTB (FDAH)
114
3.38
Hình ảnh điện di phân tích kiểu gen 16 locut xác định quan
hệ huyết thống cha con.
116
9
MỞ ĐẦU
Lịch sử phát triển của khoa học hình sự chuyển biến sang một bước
ngoặt mới kể từ sau phát hiện của Jeffreys – năm 1985 về khả năng ứng dụng
của các đoạn ADN đa hình trong nhận dạng cá thể người và đặc biệt là sau
phát minh của Kary Mullis - nhà Hóa học người Mỹ về phản ứng PCR vào
Hải Sáng [13], Trần Thị Quỳnh Trang [15] … đến nay đã có một số phòng thí
nghiệm đã ứng dụng thành công công nghệ phân tích ADN trong hình sự và
nhận dạng cá thể người, giám định huyết thống sử dụng các hệ thống thiết bị
phân tích hiện đại với các bộ kit của nước ngoài [6, 8, 14, 92]. Việc sử dụng
các bộ kit cho kết quả phân tích chính xác. Tuy nhiên không phải cơ sở nào
cũng có thể thực hiện được vì đòi hỏi trang bị máy móc công nghệ hiện đại
với chi phí cao đồng thời phụ thuộc nhiều vào các bộ kit sẵn có.
Trước thực tế đó, từ năm 2001 đến nay, Viện Kỹ thuật Hoá học, Sinh
học và Tài liệu nghiệp vụ, Tổng cục Hậu Cần - Kỹ thuật - Bộ Công an đã
nghiên cứu chế tạo thành công một số bộ thang alen chỉ thị và các bộ kit phân
tích đơn gen, 3 gen ứng dụng trong phân tích 12 locut đa hình STR sử dụng
công nghệ điện di nhuộm bạc [2-5, 9]. Việc xây dựng các bộ thang alen chỉ
thị có ý nghĩa vô cùng quan trọng trong xác định một cách chính xác tần suất
alen quần thể người Việt đối với mỗi locut STR. Tần suất alen các locut khảo
sát đặc trưng cho quần thể người Việt là công cụ hỗ trợ đắc lực trong tính toán
độ tin cậy của mỗi ca giám định. Các kết quả nghiên cứu đã giúp chủ động về
công nghệ và hiện nay đã và đang được ứng dụng tốt trong trong phân tích
gen hình sự tại một số cơ sở giám định các đơn vị công an địa phương như Hà
Nội, Hải Phòng, Thanh Hóa, Cần Thơ, Khánh Hòa...
Tuy nhiên, nếu chỉ dừng ở phân tích 12 locut thì thực tế cho thấy trong
nhiều trường hợp cụ thể, đặc biệt là với những ca giám định phức tạp (như
giám định xác định tội phạm có nhiều nghi can mà những người này lại có
quan hệ huyết thống, họ hàng...) khó cho kết quả tin cậy. Trong những trường
hợp này, số locut được sử dụng để giám định thường từ 16 đến 24 locut [30,
35, 79].
11
Từ thực tế nêu trên, chúng tôi nhận thấy việc mở rộng nghiên cứu để
2. Nghiên cứu lựa chọn thành phần và điều kiện phản ứng PCR thích hợp áp
dụng cho phức 4 cặp mồi F13A01, D8S1179, HPRTB và Amelogenin và
điện di phân tích phức 4 locut trên gel polyacrylamide biến tính.
3. Khảo sát tần suất phân bố alen và đánh giá tính đa hình thuộc 15 locut
STR ở người Việt (Kinh), gồm D5S818, D7S820, D13S317, CSF1PO,
TH01, TPOX, D16S539, D3S1358, vWA, F13B, FES/FPS, LPL, F13A01,
D8S1179 và HPRTB.
5. Nghiên cứu xây dựng thang alen chỉ thị cho 4 locut F13A01, D8S1179,
HPRTB và Amelogenin.
6. Đề xuất hướng ứng dụng 15 locut STR trong nhận dạng cá thể và xác định
huyết thống tại Việt Nam.
* Ý NGHĨA KHOA HỌC VÀ THỰC TIẾN
1. Nghiên cứu bổ sung bốn locut F13A01, D8S1179, HPRTB và Amelogenin
kết hợp với các locut đã được nghiên cứu có ý nghĩa vô cùng quan trọng
trong việc:
-
Tăng độ chính xác trong phân tích nhận dạng cá thể và xác định huyết
thống.
-
Chủ động về công nghệ phân tích ADN phù hợp với điều kiện Việt
Nam, đáp ứng kịp thời nhu cầu giám định của các địa phương trong cả
nước.
2. Số liệu khảo sát tần suất alen của các 15 locut đa hình STR cho quần thể
người Việt (Kinh) có ý nghĩa quan trọng, được sử dụng để tính toán độ tin
cậy của các ca giám định nhận dạng cá thể và huyết thống ở Việt Nam.
Ngoài ra có 01 trang liệt kê danh mục các công trình khoa học đã công bố.
* NƠI THỰC HIỆN LUẬN ÁN
Luận án được thực hiện tại Viện Kỹ thuật Hóa học, Sinh học và Tài
liệu nghiệp vụ - Tổng cục Hậu cần Kỹ thuật - Bộ Công an.
14
CHƯƠNG 1. TỔNG QUAN
1.1. CÁC PHƯƠNG PHÁP NHẬN DẠNG CÁ THỂ NGƯỜI
Công tác nhận dạng diễn ra thường xuyên trong các ngành khoa học và
thực tiễn cuộc sống. Quá trình nhận dạng thực chất là cách sắp xếp thành hệ
thống hay còn gọi là phân loại, trong đó các nhóm được phân chia theo các
đặc tính chung và các nhóm có những đặc tính chung này sẽ được gọi một tên
chung. Bằng cách phân loại các nhà thực vật học phân loại cây, nhà động vật
học phân loại động vật và giám định viên pháp y phân loại và nhận dạng cá
thể người. Thông qua các đặc điểm đặc trưng mang tính cá thể của con người
về hình thái khuôn mặt, về đặc điểm của răng, đặc điểm vân da, nhóm máu,
ADN,... của các cá thể khác nhau thì khác nhau để các giám định viên tiến
hành công tác nhận dạng người.
Có nhiều phương pháp để giám định nhận dạng cá thể người. Các
phương pháp nhận dạng thường mang tính bổ trợ cho nhau. Để đạt được mục
đích cuối cùng của công tác nhận dạng cần tiến hành qua các bước như: phân
loại, sàng lọc và cuối cùng là xác định cá thể thì cần phối hợp nhiều phương
pháp với nhau hoặc nhiều phần trong một phương pháp. Ví dụ, phương pháp
vân da cần phân tích nhiều đặc điểm đường vân, phương pháp ADN cần phân
tích nhiều locut.... Việc sử dụng các phương pháp trong nhận dạng cá thể tuỳ
thuộc vào:
- Loại mẫu, số lượng và chất lượng mẫu (bao gồm cả mẫu giám định
nhận dạng và mẫu so sánh).
Đây là các phương pháp rất thông dụng, cho đến nay vẫn được ứng
dụng rộng rãi ở hầu hết các nước trên thế giới trong lĩnh vực pháp y hình sự
[21, 65, 78, 90]. Tuy nhiên độ chính xác của phương pháp này phụ thuộc
nhiều vào yếu tố mẫu thu được và yếu tố so sánh. Ví dụ khi nhận dạng bằng
phương pháp tái tạo khuôn mặt từ hộp sọ thì mẫu thu được phải là xương sọ
tương đối nguyên vẹn; nhận dạng dựa trên đặc điểm về răng thì mẫu thu được
phải là răng hài cốt và đồng thời phải có hồ sơ răng của đối tượng cần xác
định.
16
* Nhận dạng bằng phương pháp xác định vân da:
Từ cuối thế kỷ thứ 19, giá trị nhận dạng bằng vân da đã được khẳng
định qua những nghiên cứu của Galton trong hai cuốn sách “Về các dấu tay”,
“Cách sắp xếp và sử dụng dấu tay”. Từ đó đến nay phương pháp nhận dạng
bằng vân da đã không ngừng được hoàn thiện.
Ngày nay mọi người đã quen thuộc với khái niệm nhận dạng cá thể
bằng vân da và thừa nhận khả năng nhận dạng của chúng. Vân da được mô tả
một cách có hệ thống và được xem là một trong những đặc tính không biến
đổi của mỗi cá thể. Thông qua nghiên cứu và lập tàng thư các nhà khoa học
đã đi đến một kết luận rằng không có hai vân da giống nhau trong hàng triệu
cá thể [55, 80].
Các nhà khoa học xác định rằng vân da (như số lượng đường vân, dạng
đường vân) không phải do một mà do nhiều gen quy định. Nó là kết quả của
sự kết hợp các yếu tố di truyền và không di truyền trong quá trình phát triển
của bào thai. Vì vậy, ngay cả hai anh em sinh đôi cùng trứng cũng có thể khác
nhau [55].
Tuy nhiên, nhận dạng bằng dấu vân da còn gặp phải những trở ngại như
chỉ thu được một vài dấu vân da, dấu vân da bị mờ nhạt, bị tẩy xoá, bị che dấu
Vào những năm 1970, các nhà khoa học đã tìm ra các yếu tố nhóm
protein trong huyết thanh người như hệ thống haptoglobin, hệ thống
transferin, hệ thống 2 globulin, hệ thống Group Specific (GS)... và các hệ
enzym như phosphatase acid, adenilatkinase, lactatdehydrogenase, 6phosphoglucomutase (PGM)... Các hệ thống nhóm này ở các cá thể khác nhau
thì khác nhau, do đó chúng cũng là một công cụ hữu hiệu để nhận dạng cá thể
người trong pháp y hình sự [80].
Tuy nhiên việc sử dụng các yếu tố di truyền có bản chất protein trong
nhận dạng cá thể gặp một số khó khăn như cần nhiều loại kháng huyết thanh
đặc hiệu. Mẫu xét nghiệm phải còn tươi, mới do các yếu tố nhóm có bản chất
protein kém bền vững dưới tác động của các tác nhân như nhiệt độ, độ ẩm, độ
pH, ánh nắng, vi sinh vật... Với các mẫu đã cũ hoặc bị phân huỷ thường
18
không có kết quả hoặc độ chính xác không cao.
1.1.3. Nhận dạng cá thể người qua phân tích ADN nhân
Năm 1985 Alec Jeffreys và cộng sự [48] khi nghiên cứu gen mã hóa
protein đảm nhiệm chức năng liên kết với oxygen trong cơ đã phát hiện đoạn
gen này có một trình tự gồm 33 nucleotit được lặp lại một số lần. Jeffreys và
cộng sự đã tinh sạch đoạn ADN – “tiểu vệ tinh” này, đưa vào plasmid PUC và
giải trình tự một số đoạn của một số người. Họ đã chọn, so sánh trình tự của
nhiều người và phát hiện ra rằng chiều dài của đoạn ADN nhận được từ mỗi
cá thể khác nhau phụ thuộc vào số lượng của các đoạn lặp. Đây là đặc điểm
quan trọng để phân biệt sự khác nhau giữa các cá thể. Các “tiểu vệ tinh” này
(minisatellite), do có số lượng nucleotit trong đoạn lặp tương đối lớn (từ 7 đến
hàng chục nucleotit) được gọi chung là các đoạn đa hình trình tự lặp lại liên
tiếp có số lượng thay đổi (Variable Number of Tandem Repeat).
Đó là thời điểm giám định gen chính thức ra đời, khi đó người ta gọi kết
quả phân tích ADN theo phương pháp này là ADN Fingerprint (dấu vân
lượng các locut ADN được sử dụng và tần suất phân bố alen của các locut
trong quần thể. Với một vài locut thì giá trị xác định cá thể ở mức thấp nhưng
chúng lại có giá trị loại trừ và sàng lọc. Đặc biệt trong nhận dạng với số lượng
mẫu xét nghiệm nhiều thì vai trò sàng lọc và loại trừ là rất quan trọng nhằm
làm giảm thiểu số mẫu cần xét nghiệm xuống con số nhỏ nhất trước khi đi
đến bước cuối cùng trong nhận dạng là xác định cá thể.
1.1.4. Phương pháp phân tích ADN ty thể
1.1.4.1. Tính đa hình trình tự ADN ty thể
ADN nằm trong ty thể của tế bào gọi là ADN ty thể. ADN ty thể có cấu
trúc mạch vòng. Sự khác nhau về trình tự hệ gen ty thể của hai cá thể người
khác nhau trung bình khoảng 9 đến 66 nucleotit. Tỷ lệ đột biến trên ADN ty
thể lớn hơn nhiều lần so với ADN nhân. Tỷ lệ đột biến cao là kết quả của sự
tích luỹ nhiều đột biến thay thế bazơ nitơ trung tính và đặc hiệu cho mỗi quần
thể trong ADN ty thể. Các đột biến này được tích luỹ liên tục theo thời gian,
20
truyền theo dòng mẹ và được chia nhánh xấp xỉ với khoảng thời gian các quần
thể định cư ở các vùng khác nhau trên thế giới. Sự khác nhau của ADN ty thể
liên quan tới chủng tộc, dân tộc và nguồn gốc địa lý của các cá thể thể hiện rõ
nét hơn rất nhiều so với ADN nhân [22].
1.1.4.2. Phân tích ADN ty thể trong nhận dạng cá thể
Nhận dạng cá thể thông qua phân tích ADN ty thể thường dựa trên sự
khác nhau về trình tự vùng D-loop (Displacement loop) hay còn gọi là vùng
HV (Hypervariable). Vùng D - loop có kích thước khoảng 1121 bp, chiếm
khoảng 7% hệ gen ty thể, nằm hai bên vị trí "O". Vùng HV gồm 2 vùng HV1
và HV2. Vùng HV1 và HV2 đều có kích thước trên dưới 400bp. Nhóm
nghiên cứu ADN thuộc các phòng thí nghiệm khoa học hình sự ở Mỹ
(TWGDAM) đưa ra tiêu chuẩn phân tích ADN ty thể là trình tự tối thiểu được