VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ SINH HỌC
¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
NGUYỄN THU HIỀN
NGHIÊN CỨU PHÁT HIỆN CÁC BIẾN THỂ
Ở MỘT SỐ BỆNH NHÂN TỰ KỶ VIỆT NAM
BẰNG PHƯƠNG PHÁP GIẢI TRÌNH TỰ
TOÀN BỘ VÙNG MÃ HÓA (EXOME)
Chuyên ngành: Hóa sinh học
Mã số: 9420116
TÓM TẮT LUẬN ÁN TIẾN SĨ SINH HỌC
HÀ NỘI - 2018
Công trình được hoàn thành tại
2
Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ VN
Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ VN
Người hướng dẫn khoa học:
1. PGS. TS. Nguyễn Huy Hoàng
Viện Nghiên cứu hệ gen
2. GS. TS. Phan Văn Chi
Viện Công nghệ sinh học
Phản biện 1:
Phản biện 2:
Phản biện 3:
khác nhau. Trong những nghiên cứu ở những cặp song sinh, sự đồng
nhất kiểu hình của ASD ở những cặp song sinh cùng trứng chiếm 7090%, trong khi tỉ lệ này ở những cặp song sinh khác trứng chỉ 0-30%.
Yếu tố môi trường cũng có sự tương tác với yếu tố di truyền và gây ra
những thay đổi bất thường trong sự phát triển tế bào thần kinh, phát
triển trí não. Giải trình tự toàn bộ vùng mã hóa (WES) đã được sử dụng
rộng rãi trong các nghiên cứu lâm sàng vài năm gần đây, đặc biệt trong
việc xác định các gen bệnh di truyền theo Mendel. Hàng chục nghìn
biến thể gen có thể được xác định trong mỗi exome trong nhiều bệnh
phức tạp như: tim mạch, thần kinh,... Đối với con người, trí tuệ là một
tính trạng cực kỳ phức tạp do nhiều gen quy định. WES đang được coi
là hướng đi đúng đắn để nghiên cứu di truyền bệnh tự kỷ. Phương pháp
này giúp xác định điều kiện di truyền cụ thể với những trường hợp còn
nghi ngờ về mặt lâm sàng, cho thấy tầm quan trọng của các biến đổi di
truyền trên gen trong hội chứng tự kỷ. Hiện nay, tại Việt Nam việc
nghiên cứu di truyền bệnh tự kỷ còn khá mới, và đặc biệt chưa có
nghiên cứu nào sử dụng kỹ thuật phân tử cao. Xuất phát từ thực tiễn đó,
luận án “Nghiên cứu phát hiện các biến thể ở một số bệnh nhân tự
4
kỷ Việt Nam bằng phương pháp giải trình tự toàn bộ vùng mã hóa
(exome)” được thực hiện sẽ giúp cho các nhà nghiên cứu di truyền học
giải thích được cơ chế gây bệnh và các bác sĩ lâm sàng điều trị bệnh
hiệu quả, đúng hướng để nâng cao chất lượng cuộc sống.
Mục tiêu của đề tài:
1. Giải trình tự và phân tích toàn bộ vùng mã hóa (exome) ở một số
bệnh nhân tự kỷ Việt Nam.
2.
Xác định các biến thể di truyền trên các gen liên quan đến bệnh
tự kỷ ở một số người bệnh tự kỷ Việt Nam.
Mở đầu: 03 trang
Chương 1. Tổng quan tài liệu: 29 trang
5
-
Chương 2. Đối tượng và phương pháp nghiên cứu: 13 trang
Chương 3. Kết quả nghiên cứu: 43 trang
Chương 4. Bàn luận: 22 trang
Kết luận và Kiến nghị: 01 trang
Các công trình công bố của tác giả: 01 trang
Tóm tắt luận án bằng tiếng Anh: 07 trang
Luận án gồm 23 bảng, 37 hình, sử dụng 233 tài liệu tham khảo gồm
tiếng Việt, tiếng Anh và một số trang Web. Phần phụ lục Danh sách 101
gen liên quan đến bệnh tự kỷ của hãng Illumina; Kết quả tạo thư viện
DNA; Chất lượng dữ liệu của fastq của các mẫu; Thông tin hồ sơ DBCP và CARS của bệnh nhân.
6
NỘI DUNG LUẬN ÁN
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. GIỚI THIỆU BỆNH TỰ KỶ
Tự kỷ là một dạng rối loạn trong Rối Loạn Phát Triển Lan Toả
(Rối Loạn Phổ Tự Kỷ), bệnh khởi phát sớm trong 3 năm đầu tiên của
cuộc đời, tác động đến sự phát triển của trẻ trong 3 lĩnh vực chính như:
tương tác xã hội, ngôn ngữ, hành vi. Tự kỷ là một rối loạn mãn tính, ảnh
hành vi đặc trưng cho kiểu hình của bệnh tự kỷ (Craig AM and Kang Y
2007; Südhof TC 2008; Betancur C, Sakurai T et al. 2009).
1.2.3. Các gen định hình chất nhiễm sắc (MECP2)
Gen MECP2 rất cần thiết cho sự phát triển và đảm bảo thực hiện
đúng chức năng của não. Mất MeCP2 sẽ trì hoãn sự hoàn thiện của tế
bào nơron thần kinh và khớp nối thần kinh. Các đột biến mất chức năng
của MECP2 là nguyên nhân của hội chứng Rett (Chahrour M and HY.
2007). Tuy nhiên, đột biến mới của MECP2 đôi khi có thể dẫn đến các
kiểu hình như: chậm phát triển, tâm thần nhẹ và các biến thể Rett bằng
lời nói, phụ thuộc vào sự biến đổi cụ thể (Lam CW, Yeung WL et al.
2000). Đột biến MECP2 cũng được tìm thấy ở các bé gái mắc chứng tự
kỷ không điển hình.
1.2.4. Các gen điều khiển sự phát triển và hình thái - (HOXA1,
PTEN, EIF4E)
Nhiều bệnh nhân hội chứng tự kỷ thường có biểu hiện hình thái
mặt như có các dị tật nhỏ hoặc lớn, đầu nhỏ hoặc to. Những đứa trẻ với
biểu hiện tự kỷ thường có hình thái khuôn mặt nhỏ (Tripi G, Roux S et
al. 2008) và tỷ lệ phát triển đầu/cơ thể không bình thường (Sacco R,
Militerni R et al. 2007; Chawarska K, Campbell D et al. 2011). Khoảng
20% trẻ tự kỷ có đầu to (Sacco R, Militerni R et al. 2007), với sự phát
triển đầu vượt trội trong những năm đầu khi mới sinh ra (Courchesne E,
Pierce K et al. 2007). Ngược lại một nhóm nhỏ các bệnh nhân mắc
chứng tự kỷ nguyên phát có cơ thể nhỏ và đầu nhỏ (Sacco R, Militerni R
et al. 2007). Một số gen quan trọng trong nhóm này như HOXA1, PTEN,
EIF4E đều được tìm thấy ở những bệnh nhân tự kỷ có sự bất thường về
hình thái.
1.2.5. Các gen liên quan tới Ca2+
Một nghiên cứu gần đây cho thấy trong một số trường hợp tự kỷ
có thể là do sự bất thường nội cân bằng Ca2+trong quá trình phát triển
thần kinh (Krey J and R. 2007). Ngoài ra, một số nghiên cứu di truyền
Sử dụng SureSelect target enrichment system for Illumina paired-end
multiplexed sequencing.
Toàn bộ quá trình tạo thư viện DNA gồm 5 bước chính: cắt
DNA thành các đoạn ngắn theo bộ kit; Các đoạn DNA đã cắt được gắn
với các adaptors và indexes cho từng mẫu; Lai các đoạn DNA với các
trình tự exon được biotin hóa và gắn hạt từ đã được phủ streptavidin;
Loại bỏ những phân tử không liên kết, các trình tự exon đã byotin hóa
và thu lại các đoạn chứa exon; Khuếch đại các đoạn exon mẫu.
2.3.2. Phân tích dữ liệu
Thư viện DNA sau đó được giải trình tự trên máy giải trình tự
mới. Dữ liệu trình tự được sắp xếp và so sánh với ngân hàng gen người
(hg19) bằng phần mềm BWA phiên bản 0.7.10. (Li, Durbin, 2009). Bản
sao phân tử được loại bỏ bằng cách sử dụng Picard v1.118. Dữ liệu sau
đó được phân tích bằng Genome Analysis Toolkit v3.4 để tìm tất cả
những vị trí có sự thay đổi alen với tần số thống kê cao, bao gồm SNPs,
đoạn thêm, mất ngắn và CNVs (McKenna, Hanna et al. 2010). Biến thể
n biến thể
ng SNP
ến thể đồng
hĩa
ến thể sai
hĩa
êm bộ mã
a kết thúc
ất bộ ba mã
9
được chú giải bằng phần mềm SnpEff v4.1 và các cơ sở dữ liệu dbSNP
Mẫu T02
105.091
11.539
Mẫu T03
103.809
11.322
Mẫu T06
104.497
11.417
Mẫu T07
104.022
11.276
Mẫu T08
103.954
11.447
Mẫu T09
107.192
11.664
10.546
10.734
10.540
t thúc
ng số biến
ể thêm mất
ột biến lệch
ung đọc
êm bộ ba mã
a
ất bộ ba mã
a
tìm thấy trên
SNP142
10
14.843
15.581
14.898
15.077
14.943
14.793
16.192
284
174
178
185
185
198
97,3
97,2
97,4
97,3
97,3
97,3
97,1
Sau quá trình lọc, những gen/biến thể được giữ lại thỏa mãn các điều
kiện:
• Gen có khả năng gây ra bệnh liên quan thần kinh
• Có chỉ số MQ>40 (mapping quality)
• SIFT_Pred=D, PolyPhen 2 _ Pred =D (Damaging)
• Biến thể không có trong cơ sở dữ liệu dbSNP 142
164.780
164.950
163.250
161.180
163.890
167.470
SIFT_Pred=D
Và PolyPhen 2 _
Pred =D
Không có
trong
dbSNP 142
Thuộc 101
gen ASD
330
342
309
319
305
319
304
14
16
8
19
nằm trên các gen có trong danh sách 101 gen ASD gồm 16 biến thể trên
12 gen: DPP6, GRIN2B, MED12, NEGR1, PDE10A, PTCHD1, PTEN,
SMC1A, ST7, TSC2, CACNA1E, SCN8A.
Từ kết quả giải trình tự toàn bộ vùng mã hóa, các gen được phân
tích sâu hơn bằng các ứng dụng về dự đoán, tương tác của các gen nhạy
cảm với ASD của trường Đại học Princeton (asd.priceton.edu). Các gen
và các mối liên kết chức năng trong các biểu hiện bệnh đặc trưng của
các bệnh nhân tự kỷ như khiếm khuyết trong các lĩnh vực: Hành vi, giao
tiếp, tương tác xã hội được phân tích. Kết quả phân tích sự tương tác của
các gen liên quan đến ba biểu hiện đặc trưng nhất ở bệnh nhân T01 cho
thấy, các gen tham gia là tương đối giống nhau, và ở cả 3 biểu hiện
nghiên cứu, 2 gen chứa biến thể ở bệnh nhân T01 là DPP6 và CASK đều
tham gia (Hình 3.1).
Hình 3.1 Sự tương tác của các gen ở bệnh nhân T01
Trong đó, chỉ số tin cậy của mối tương tác giữa gen DPP6 và
NTRK3 là 0,65, chỉ số tin cậy của mối tương tác giữa gen CASK và
ATP2B2 là 0,6
12
3.1.2.2. Biến thể trên các gen mới ở bệnh nhân T01
Từ kết quả giải trình tự exome của các bệnh nhân qua phân tích
và sàng lọc những biến thể tiềm năng này sẽ được phân tích tiếp bằng 2
công cụ là SIFT (sorting intolerant from tolerant) và PolyPhen
(polymorphism phenotyping). Kết quả bệnh nhân T01 có 14 biến thể
quan tâm không có trong cơ sở dữ liệu dbSNP142 trên các gen:
ATP2B3, BCL11A, CDK13, CSMD2, DNAH9, HIP1R, KNDC1, LRRC7,
MUC5B, MYCBP2, PITPNM3, SMTN và ZDBF2 .
3.1.3. Biến thể di truyền ở bệnh nhân T02
Các gen này gồm có: NTNG1, ZEB2, MBD5, FOXP1, KLHL3, HOXA1,
ST7, DPP6, DLGAP2, GRIN2B, TRPM1, SOX5, UBE3A, RBFOX1,
CACNA1C.
14
Hình 3.3. Sự tương tác của các gen ở bệnh nhân T03
Kết quả phân tích mối tương quan của các gen trong các biểu
hiện bệnh, cho thấy, đối với bệnh nhân T03, chỉ có gen DPP6 tham gia
và mối tương quan với các gen liên quan đến 3 biểu hiện trong nghiên
cứu này (Hình 3.3)
3.1.4.2. Biến thể trên các gen mới ở bệnh nhân T03
Bệnh nhân T03 có 8 biến thể trên 8 gen mới FLNC, ADAMTS9,
NIN, ASB16, MUC16, TMPRSS15, KDELR3, ALPI.
3.1.5. Biến thể di truyền ở bệnh nhân T06
3.1.5.1. Biến thể di truyền trên các gen liên quan đến ASD ở bệnh
nhân T06
Sau các bước chọn lọc, kết quả thu được ở bệnh nhân T06 bao
gồm 17 biến thể trên 15 gen đã biết liên quan đến ASD: ANKRD11,
AUTS2, CASK, DOCK4, DPP6, KATNAL2, KLHL3, NIPBL, RBFOX1,
RELN, SHANK2, SOX5, TCF4, TSC1, TSC2. Kết quả phân tích các gen
ở bệnh nhân T06 cho thấy, bệnh nhân này có 5 gen quan trọng, tham gia
vào mối tương tác với các gen liên quan đến các biểu hiện hành vi, giao
tiếp, tương tác xã hội. Đó là TSC1,TSC2, NIPBL, SHANK2, DPP6 (Hình
3.4). Trong đó gen TSC1, TSC2 nằm trong danh sách gen của hệ thống,
chứng tỏ sự quan trọng của gen này liên quan đến biểu hiện giao tiếp.
15
Bệnh nhân T07 có 11 biến thể mới nằm 10 gen: HECW2, RYR2,
PLCH2, SPEN, ADAMTS9, RBM47, IQCE, MUC5B, MUC16,
UMODL1
3.1.7. Biến thể di truyền ở bệnh nhân T08
3.1.7.1. Biến thể di truyền trên các gen liên quan đến ASD ở bệnh
nhân T08
Kết quả chọn lọc cho thấy, ở bệnh nhân T08 có 15 biến thể, các
biến thể này nằm trên 14 gen liên quan dến ASD: CASK, DLGAP2,
17
DOCK4, FOXP1, GABRB3, RBFOX1, RELN, SCN1A, SHANK2,
SHANK3, SOX5, CACNA1D, CACNA1F, KCNMA1. Sau khi đưa dữ liệu
các gen này vào hệ thống phân tích mối tương quan, kết quả cho thấy sự
quan trọng của 2 gen và CACNA1F khi tham gia vào cả 3 biểu hiện. Gen
SHANK2 có mối tương quan với gen PLCB1, EFNB2 là những gen quan
trọng trong hệ thống, biểu hiện ở hình tròn đại hiện màu xanh. Gen
CACNA1F liên quan đến gen ACRV1 (Hình 3.6), với chỉ số độ tin cậy là
0,63.
Hình 3.6. Sự tương tác của các gen ở bệnh nhân T08
3.1.7.2. Biến thể trên các gen mới ở bệnh nhân T08
Đối với kết quả chọn lọc các biến thể trên những gen mới, bệnh
nhân T08 có 14 biến thể, trên các gen: KIAA1109, OR52E8, NFRKB,
WHSC1L1, FLG, INSRR, IL17RC, MUC5B, BCL9L, ENO2, GGA2,
SMTNL2, MUC16, BTAF1.
3.1.8. Biến thể di truyền ở bệnh nhân T09
3.1.8.1. Biến thể di truyền trên các gen liên quan đến ASD ở bệnh
nhân T09
mang 2 biến thể mới trên mỗi gen RYR2 ( bệnh nhân T07) và RYR3
(bệnh nhân T06). Như đã trình bày ở phần tổng quan tài liệu, các nghiên
cứu trên thế giới cho thấy rằng trong một số trường hợp tự kỷ có thể là
do sự bất thường nội cân bằng Ca 2+ trong quá trình phát triển thần kinh
(Krey and Dolmetsch 2007). Ngoài ra, RYR3 đã được chứng minh có
vai trò trong giải phóng ion Ca 2+ của kênh canxi cũng như đóng vai trò
quan trọng trong việc điều tiết Ca2+ nội bào trong tế bào thần kinh (Fill
and Copello 2002; Lu et al, 2012; Schmunk et al, 2015). Bên cạnh đó,
RYRs còn nằm trên nhiễm sắc thể 15q14-q14 khu vực nhạy cảm với
bệnh tự kỷ (Sorrentino et al, 1993).
Kết quả giải trình tự Sanger biến thể trên gen RYR3 ở bệnh nhân
T06 (Hình 3.8) cho thấy bệnh nhân mang hai biến thể thay thế dạng dị
hợp tử. Bệnh nhân thừa hưởng biến thể p.L111P từ bố và biến thể
p.R3048C từ mẹ. Biến thể đầu tiên (p.L111P) xảy ra trong exon 4, trong
đó T được thay thế bằng C ở vị trí 332 trong cDNA, dẫn đến việc thay
thế Leu (L) bởi Pro (P) tại vị trí 111 trên protein RYR3. Biến thể thứ hai
(p.R3048C) đã được quan sát thấy trên exon 65, trong đó C đã được
thay thế bởi T ở vị trí 9142, dẫn đến sự thay đổi của một amino acid ở vị
trí 3048, nơi Arg (R) được thay thế bởi Cys (C) trên protein RYR3.
Ngoài ra, biến thể p.L111P còn nằm trên vùng domain MIR1 của
protein RYR3. MIR1 nằm tại vị trí amino acid 100 đến 150. Domain
MIR được biết đến là vùng chức năng quan trọng của RYRs. Cả 2 biến
thể đều nằm trên vùng bảo thủ của RYR3 cho thấy mức độ quan trọng
của vị trí độ biến.
20
Hình 3.8. Kết quả giải trình tự bằng phương pháp Sanger
phát hiện biến thể p.Leu111Pro và p.Arg3048Cys trên gen RYR3 ở
hiện 1 cầu nối Hydro giữa Cys801 và Leu803.
3.2.3. Gen MUC16
22
Kết quả WES cho thấy tần suất xuất hiện biến thể trên gen
MUC16 ở các bệnh nhân tự kỷ trong nghiên cứu này là khá nhiều. 6/7
bệnh nhân mang các biến thể trên gen MUC16 (Bảng 3.3).Các biến thể
này ở các bệnh nhân và gia đình được kiểm chứng lại bằng phương pháp
giải trình tự Sanger. Trong nội dung tóm tắt này, chỉ kết quả giải trình tự
bằng phương pháp Sanger ở các bệnh nhân được trình bày. Kết quả giải
trình tự cho thấy, các biến thể đều là những biến thể dị hợp tử mới phát
sinh, không di truyền từ bố mẹ (Hình 3.11).
Bảng 3.3. Tổng hợp các biến thể trên gen MUC16 ở các bệnh nhân
tự kỷ
STT
1
Bệnh
nhân
T02
2
HGVS.c
HGVS.p
c.6670G>T
T07
c.39499G>C
p.Val13167Met
7
T08
c.40707G>C
p.Trp13569Cys
8
T09
c.6670G>T
p.Ala2224Ser
23
Hình 3.11. Kết quả giải trình tự bằng phương pháp Sanger
phát hiện các biến thể trên gen MUC16 ở các bệnh nhân tự kỷ
3.2.4. SNP rs7725785 trên gen HTR4
rs7725785 được phát hiện trong 4/7 bệnh nhân tự kỷ Việt Nam.
Tuy con số này còn nhỏ, chưa có ý nghĩa thống kê, nhưng kết quả này
truyền tín hiệu của tế bào thần kinh. Các biến thể trong các gen liên
quan đến các kênh ion có thể ảnh hưởng đến sự tồn tại, sự khác biệt, di
cư, phát triển tự nhiên, và sự hình thành khớp thần kinh tế bào thần kinh.
Tế bào thần kinh mã hóa thông tin thông qua các tín hiệu có nguồn gốc
từ các kênh ion. Khi một tế bào thần kinh nhận được tín hiệu từ tế bào
thần kinh khác thông qua các khớp thần kinh, tùy thuộc vào các loại
kênh ion dẫn truyền tín hiệu của tế bào thần kinh sẽ trở thành tích cực
hay tiêu cực. Các đột biến trong các gen nhạy cảm với ASD có liên qua
đến các kênh ion canxi (Ca2+), natri (Na+), kali (K+) thường tăng cường
kích thích não bộ. Những biến đổi trong các gen liên quan đến kênh ion
có khả năng ảnh hưởng đến vô số các chức năng não bộ (Naisbitt S,
Kim E et al. 1999; Boeckers TM, Bockmann J et al. 2002). Kênh ion
thậm chí có thể cung cấp một liên kết giữa di truyền và môi trường bởi
vì các yếu tố môi trường như thủy ngân là tín hiệu tăng canxi. Vai trò
rộng lớn của các kênh ion có thể giúp giải thích tại sao các bệnh nhân
ASD thường kèm theo biến chứng thần kinh khác như vấn đề giấc ngủ
và bệnh động kinh.
4.2. CÁC GEN LIÊN QUAN ĐẾN BIỂU HIỆN BỆNH ĐẶC TRƯNG
CỦA ASD
Bộ kit TruSight Autism của hãng Illumina được nghiên cứu và phát
triển để phát hiện các biến thể trên 101 gen đã được chứng minh có liên
quan đến bệnh tự kỷ. Trong khuôn khổ luận án này, danh sách 101 được sử
dụng để sàng lọc các biến thể từ kết quả giải trình toàn bộ vùng mã hóa.
Bảng 4.1. Tổng kết các gen liên quan đến bệnh tự kỷ ở 07 bệnh nhân
TT
Gen
1
2
T07
x
x
x
x
x
T08
T09
x
x
x
x
x
x
x
x
3
2
2
2
1
1
1
1
1
1