DI TRUYỀN PHÂN TỬ SỬ DỤNG TRONG GIÁM ĐỊNH,
CHẨN ĐOÁN, PHÂN LOẠI, PHẢ HỆ, DỊCH TỄ HỌC
VÀ DI TRUYỀN QUẦN THỂ KÝ SINH TRÙNG
MỞ ĐẦU
Tất cả mọi đặc tính sinh học của một cá thể đều được quyết định bởi hệ gen
của chúng. Hệ gen ở động vật là một tập hợp của các chuỗi nucleotide phân bố
trong các phân đoạn dài ngắn khác nhau gọi là nhiễm sắc thể (đối với hệ gen cá
thể bậc cao), hoặc là một vòng acid deoxyribonucleic (ADN) khép kín (đối với hệ
gen cá thể bậc thấp). Tính chính xác khi so sánh cấu trúc trật tự nucleotide của gen
và hệ gen các cá thể khác nhau cho phép có được sự phân biệt chính xác các đặc
tính di truyền học của cá thể và quần thể, bất luận, sản phẩm gen của chúng có thể
bị ảnh hưởng tương tác của môi trường và đồng loại. Ngày nay khảo sát và phân
tích cấu trúc gen và hệ gen của cá thể để so sánh, hay còn gọi là khai thác chỉ thị di
truyền phân tử ADN (DNA genetic markers) được coi là phương pháp tối ưu trong
nghiên cứu sinh vật nói chung và ký sinh trùng (KST) nói riêng, đặt ra một hướng
mới: hướng giám định, chẩn đoán, phân loại, nghiên cứu phả hệ tiến hoá, dịch tễ
học và di truyền quần thể bằng phương pháp sinh học phân tử
(1),(2),(3),(4)
.
Phương pháp khai thác chỉ thị phân tử ADN cho kết quả có độ nhạy và tính
chính xác cao, đặc biệt trong chẩn đoán phát hiện biến chủng, thậm chí trong các
cá thể đồng chủng, ngay cả khi vùng ADN nghiên cứu không cho sản phẩm gen
(non-coding region), hoặc ADN ở vùng giao gen, hay cả khi một số gen ở trạng
thái câm lặng (silent genes). Phương pháp ADN còn bao quát cả phương pháp
protein, đơn giản, vì khi cấu trúc gen trong chuỗi nucleotide đã được xác định, thì
cấu trúc protein cũng dễ dàng phân tích để đánh giá và so sánh chức năng. Sự phát
triển của kỹ thuật máy tính điện tử (computer) đã tạo dựng công cụ tin-sinh học
(bioinformatics) đa dạng và đa năng, cho phép ứng dụng phương pháp phân tích
ADN một cách hiệu quả và rộng rãi. Tuy phương pháp chỉ thị phân tử đòi hỏi
trang thiết bị đắt tiền, tốn kém và cần các nhân viên kỹ thuật có trình độ cao,
như giun đũa (Ascaris suum), giun chỉ (Onchocerca volvulus), sán máng
(Schistosoma mansoni, S. japonicum, S. mekongi, S. haematobium), sán dây
(Taenia solium, T. asiatica, T. crasiceps ), sán lá gan lớn (Fasciola hepatica, F.
gigantica), sán lá gan nhỏ (Clonorchis sinensis, Opisthorchis viverrini), sán lá ruột
(Fasciolopsis buski) đã được giải mã và phân tích cung cấp nguồn dữ liệu cần
thiết cho nghiên cứu giám định, phân loại, phả hệ, quần thể ký sinh trùng
(9),(10),(11)
.
Vậy những chỉ thị nào của hệ gen ty thể là đối tượng được chọn nghiên
cứu? Thông thường, gen cox1, nad1, cob là những gen có giá trị được chọn trong
giám định và định loại các loài có họ hàng gần gũi; các gen nad3, 16S (rrnL), 12S
(rrnS), vùng không mã hoá (NR, non-coding region) được chọn trong phân loại và
so sánh biến đổi gen của các loài họ hàng xa (Hình 1). Các gen ty thể là các cấu
trúc di truyền đại diện dòng mẹ, do vậy, khi giám định các loài có khả năng lai hay
trong vùng tạp lai ngoại loài (inter-specific hybridization), nhất thiết cần xem xét
thêm chỉ thị hệ gen nhân (ví dụ ITS-2), vì gen nhân đại diện di truyền dòng bố. Từ
đó, việc phân tích dòng lai sẽ xác định được di truyền theo bố hay theo mĐ.
Hình 1. Hệ gen ty thể (A) có các chỉ thị phân tử thường sử dụng (vạch bên
dưới các gen) và sơ đồ cấu trúc tổ hợp ADN ribosome (B) của hệ gen nhân cung
cấp chỉ thị 18S và ITS-2 với các mồi thực hiện PCR.
Hệ gen nhân tế bào và hướng nghiên cứu một phần hay toàn bộ hệ gen
Trong một tế bào của cơ thể, song song tồn tại 2 hệ gen bao gồm hệ gen
nhân tế bào (nuclear genome) và hệ gen ty thể (mitochondrial genome, đối với
động vật) hoặc lạp thể (chloroplast, đối với thực vật). Hai hệ gen này đều có sản
phẩm riêng, hoạt động có tính chất vừa độc lập, vừa tương tác, và dĩ nhiên hệ gen
ty-lạp thể chịu ảnh hưởng điều hoà của hệ gen nhân tế bào.
Hệ gen nhân tế bào bao gồm hàng chục triệu đến hàng trăm triệu
nucleotide. Hệ gen nhân tế bào được phân bố trong các đơn vị sinh học gọi là
nhiễm sắc thể (NST). Số lượng NST trong mỗi một loài có khác nhau. Các gen
được phân bố tập trung trong các vùng riêng biệt gọi là các vùng mã hoá (coding
tích phân loại.
Hình 1 mô tả toàn bộ cấu trúc tổ hợp ADN ribosome (nuclear ribosomal
operon). Các tổ hợp ADN ribosome sắp xếp nối tiếp nhau và cách nhau bằng một
vùng giao tổ hợp IGS (inter-genic spacer). Có khoảng 100 tổ hợp ADNr ở loài sán
máng (S. mansoni)
(11)
và sán phổi (P. ohirai). Trong hệ gen nhân của sán lá gan
nhỏ (Opisthorchis viverrini)
(15)
, ADNr chiếm đến 6,1% thành phần ADN của hệ
gen. Vùng đầu 5’ của gen 18S có định vị một chuỗi ADN ngoại tổ hợp gọi là vùng
ngoại gen ETS (external transcribed spacer).
Giữa gen 18S và 5, 8S là vùng giao gen ITS-1 (internal transcribed spacer
1) có độ dài khoảng 300-600 bp; và giữa gen 5, 8S và 28S là vùng giao gen ITS -2
(internal transcribed spacer 2) có độ dài tương đương khoảng 300-500 bp. Độ dài
ITS-1 và ITS-2 ở một số loài đã được xác định, như ở sán lá gan F. hepatica có
ITS-1 là 433 bp, ITS-2 là 362 bp; ở loài sán máng S. mansoni, ITS-1 là 456 bp và
ITS-2 là 309 bp. ITS-1 và ITS-2 có thể chứa các cấu trúc lặp ngắn (mini-satellite)
có giá trị rất lớn trong định loại (genotyping). Độ dài của gen 18S vào khoảng 1,9-
2,0 kb, của gen 5,8S khoảng 150 bp và của gen 28S là khoảng 3,5-4,1 kb. Khoảng
cách giữa các tổ hợp ribosome (ADNr) rất dao động ở các loài, từ 2 kb đến 5-9 kb,
có khi vượt quá 10 kb.
ITS-1 và ITS-2 có mức độ biến đổi ngoại loài rất cao, khó có thể sử dụng
để so sánh phân tích các loài khác giống, nhưng chúng lại là đối tượng lý tưởng
trong nghiên cứu phả hệ nguồn gốc các chủng trong cùng loài hoặc cùng giống,
đặc biệt về hiện tượng lai nội và ngoại loài. ITS-2 đại diện phả hệ dòng bố
(paternality), nếu được phân tích cùng với một số chỉ thị hệ gen ty thể đại diện
dòng mẹ (maternality) thì việc lai ngoại loài có điều kiện xác định chính xác
nguồn gốc dòng lai.
Dựa trên nhóm gen trong tổ hợp ADN ribosome này, một số loài KST được
thu nhận kết quả về mức độ đồng nhất (homology) và mức độ tương ứng
(similarity), đối chiếu với các dữ liệu lưu trữ trong Ngân hàng gen (GENBANK),
hoặc các Trung tâm lưu trữ số liệu khác. Trên cơ sở này, đặc tính gần (proximity)
và đặc tính xa (distance), cũng như hệ số song chiếu (pairwise identity) được tính
toán và phân tích để có hệ số tiến hoá gần và xa của loài nhằm sử dụng để thiết lập
phả hệ tiến hoá của quần thể.
Vì phân đoạn ADN lấy làm nghiên cứu có tính xác suất, tuỳ hứng, nên có thể
sau khi phân tích số liệu về một số đặc tính, kết quả có thể bị rối (noisy) không phù
hợp sử dụng. Do vậy, để được chính xác và hiệu quả, cần có sự chọn lọc trước từng
vùng cơ bản trong hệ gen để khảo sát và phân tích. Những vùng đó, thông thường là
những vùng ADN có vai trò nhất định trong quan hệ sinh học nội và ngoại loài.
Hướng sử dụng một phần hay toàn phần cấu trúc của một gen
Hệ gen của một sinh vật, dù là bậc thấp hay bậc cao, vẫn là tập hợp chứa
hàng nghìn đến hàng trăm nghìn cấu trúc gen khác nhau. Trong vô vàn các cấu
trúc gen đó, chỉ có khoảng 30-40% gen ở trạng thái hoạt động, số còn lại ở trong
trạng thái bị kìm hãm hoặc hoàn toàn câm lặng.
Về nguyên tắc, các cá thể cùng 1 chủng thuộc 1 loài, bao giờ cũng có một
số lượng ít hay nhiều, thậm chí có khi gần 100% số gen có cấu trúc giống nhau. Sự
sai khác, nếu có, đó là sự biến đổi ở mức độ phân tử, và phải qua phân tích ở mức
độ phân tử mới xác định được. Sự sai khác phân tử chính là các đột biến xuất hiện
trong chuỗi gen của hệ gen, bao gồm đột biến điểm (point-mutation), sự xoá đi hay
thêm vào của ADN có thể đó là các bộ mã nucleotide (insertion and deletion), sự
biến mất hay nhân lên của các chuỗi nucleotide lặp (satellite), sự đảo gen
(invertion), sự chuyển gen (translocation) v.v Sự sai khác này ở mỗi cá thể khác
nhau là khác nhau, biểu thị tính đa dạng sinh học ở mức độ phân tử và đó chính là
đích khai thác của việc nghiên cứu, giám định và phân loại KST bằng phương
pháp SHPT
(8)
.
Hiện nay, một gen hay một phần gen nào đó sau khi được chọn làm đối tượng
tễ học KST cho đến nay vẫn dựa vào các phương pháp truyền thống là chính,
trước hết phương pháp hình thái học chiếm vị trí quan trọng. Các phương pháp
SHPT đã bước đầu được ứng dụng trong chẩn đoán phân loại và lập phả hệ sinh
vật và số liệu chính xác do các phương pháp SHPT đem lại đã cho phép ứng dụng
những hướng mới và rất có thể sẽ làm thay đổi một phần hệ thống phân loại hiện
có.
Có thể tổng quát vấn đề ở chỗ, phương pháp truyền thống là sự khai thác bảo
tồn và biến đổi kiểu hình (genetic conservation DNA variation), còn các phương pháp
SHPT chủ yếu dựa trên phân tích ADN của hệ gen, đó là sự biến đổi kiểu gen
(genotypic variation). Biến đổi kiểu hình là sự hoạt động của sản phẩm gen, do vậy
chúng chịu sự tương tác trong loài với loài và với vật chủ và môi trường. Sự sai khác
chức năng và hoạt động sống của các cá thể trong cùng một loài có thể dễ nhận biết
hơn. Có nhiều chủng khác nhau về phân bố địa lý nhưng hệ gen của chúng có hệ số
đồng nhất khá cao. Nếu chỉ dựa vào phân tích hệ gen mà đánh giá, có thể khó phân
biệt sự khác nhau của loài.
Rõ ràng tính đa dạng sinh học trước hết là sự biểu hiện sinh học của cá thể trong
hoạt động sống với môi trường. Phải phân tích ở mức độ phân tử chúng ta mới có đủ các
điều kiện để đánh giá những biến đổi di truyền có giá trị giám định và phân loại. Khái
niệm “đồng hồ phân tử” (molecular clock) biểu thị thời gian và mức độ biến đổi cả về
kiểu gen và kiểu hình của loài, tuỳ thuộc vào từng loài mà sự biến đổi đó có thể nhanh
hay chậm. Từ đó, “đồng hồ phân tử” của từng loài là khác nhau và mức độ tiến hoá là
khác nhau.
Đối phó với môi trường cá thể có thể thay đổi nhanh về hình thái và các đặc tính
sinh học. Ngay trong hệ gen của một cá thể, bên cạnh việc bảo tồn nghiêm ngặt nhiều
gen cần thiết, đã có một số gen hay vùng gen dự trữ rất sẵn sàng cho sự biến đổi nhất
định nào đó, để phù hợp với thay đổi môi trường để tồn tại. Sự thay đổi đó có thể rất nhỏ,
nhưng có ảnh hưởng có thể rất lớn, ví dụ, chỉ cần một đột biến điểm (point-mutation) của
một nucleotide, có thể làm thay đổi cấu trúc axit amin của sản phẩm và tạo nên sự thay
đổi lớn về kiểu hình. Hệ gen của nhân hay ty thể cung cấp số liệu về cấu trúc ADN của
cá thể, nên có thể sử dụng đối chiếu trực tiếp, kết quả hoàn toàn phản ánh đúng thực chất