TCNCYH phụ bản 32 (6) - 2004
Giới thiệu kỹ thuật giải trình tự gen
và Real - Time PCR
Lê Văn Phủng*
Trờng Đại học Y Hà Nội
1. Kỹ thuật giải trình tự gen
Giải trình tự gen là tìm ra trình tự sắp xếp của
các nucleotides trên đoạn gen đợc quan tâm
nhằm phát hiện sự đột biến gen hoặc để thiết kế
gen mồi (primer) và các vector tách dòng
(cloning) nhằm tạo ra các protein tái tổ hợp có giá
trị cao trong Y học (vaccine, thuốc chữa bệnh,
các sinh phẩm phục vụ chẩn đoán bệnh hoặc
nghiên cứu khoa học).
Kỹ thuật giải trình tự gen đợc công bố năm
1975 bởi Sanger (nguyên lý enzym) và Maxam -
Gilbert năm 1977 (nguyên lý phân giải hoá học).
Hiện nay, các kỹ thuật này đã đợc cải tiến rất
nhiều nhờ những tiến bộ mới về khoa học và công
nghệ (Hoá học, Vật lý, Điện tử và Công nghệ
thông tin), làm cho hiệu suất của việc giải trình tự
gen ngày một cao; ngời ta có thể giải một trình
tự dài hàng nghìn cặp base chỉ trong vòng vài
tiếng đồng hồ, điều mà trớc đây phải làm hàng
tuần.
Có nhiều kỹ thuật giải trình tự gen, sau đây
xin giới thiệu một kỹ thuật hiện nay đang đợc áp
dụng phổ biến thông qua một ví dụ cụ thể, giải
mã gen FliC.
Gen FliC là gen mã hoá cho kháng nguyên
ADN khuôn nói trên. Điều kiện tối u cho phản
ứng PCR này phải dò tìm, nếu máy PCR có
chơng trình Gradient thì việc tìm kiếm các điều
kiện nhiệt độ tối u sẽ thuận lợi hơn nhiều.
Bớc thứ t là tinh sạch sản phẩm của phản
ứng PCR nói trên. Có thể dùng phơng pháp tách
băng ADN đặc hiệu ngay trên thạch điện di (rẻ
tiền) hoặc dùng KIT thơng mại (đắt hơn).
Bớc thứ năm là chạy PCR lần hai. Khác với
PCR lần 1, lần này trong hỗn hợp phản ứng,
ngời ta cho thêm dideoxynucleoside
triphosphate (hai vị trí, trong đó có vị trí 3,
không có nhóm OH - ) có gắn chất màu huúnh
quang. Hiện nay, kỹ thuật đã cho phép gắn các
chất màu huúnh quang khác nhau trên 4 loại
nucleotide này, vì vậy, chỉ cần làm một phản ứng
PCR trong một ống duy nhất chung cho cả 4 loại
nucleotide (A, C, G và T); so với trớc đây phải
làm 4 phản ứng riêng rẽ ở 4 ống.
26
* PGS. TS. Trởng Labo trung tâm, Phó chủ nhiệm Bộ môn Vi sinh vật - Trờng Đại học Y Hà Nội.
TCNCYH phụ bản 32 (6) - 2004
Bớc thứ sáu là làm tinh sạch sản phẩm
(ADN) của phản ứng PCR 2 và làm biến tính
chúng để tạo ra ADN sợi đơn duỗi thẳng.
Bớc thứ bảy là đa ADN đã đợc xử lý vào
máy giải trình tự gen để đọc tự động trình tự các
Hình 1. Gen FliC - b của Salmonella paratyphi B trên GenBank (http: //www. ncbi. nlm. nih. gov)
27
TCNCYH phụ bản 32 (6) - 2004
Các gen FliC của 5 Salmonella khác nhau đã đợc giải trình tự và so sánh với nhau để tìm ra vùng đặc trng
cho mỗi loài, trong đó FliC - a là gen FliC của Salmonella paratyphi A, FliC - b là của Salmonella paratyphi B,
FliC - c là của Salmonella paratyphi C, FliC - d là của Salmonella typhi và FliC - i là của Salmonella
typhimurium; dấu * là biểu diễn các vị trí giống nhau và dấu . là biểu hiện các vị trí khác nhau.
FliC - a 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - b 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - c 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - d 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
FliC - i 1: ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAA 60
************************************************************
FliC - a 61: TCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGC 120
FliC - d 301: AATGGTACTAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
FliC - i 301: AACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTG 360
** *.**.***********************************************.***
28
TCNCYH phô b¶n 32 (6) - 2004 FliC - a 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - b 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - c 361: AACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - d 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
FliC - i 361: AACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAG 420
***********************.************************************
FliC - a 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACCATTGATATCGATCTG 480
FliC - b 421: GACAACACCCTGACCATCCAGGTTGGCGCGAACGACGGTGAAACTATCGATATCGATCTG 480
FliC - c 421: GACAACACTCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480
FliC - d 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATTGATTTA 480
FliC - i 421: GACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTG 480
********.*****************.**.**************.**.*****.***.*.
FliC - a 481: AAACAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAGAAAAAATATGAT 540
FliC - b 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACTTTAAGTGTACAGGATGCCTATACG 540
FliC - c 481: AAGCAGATCAACTCTCAGACCCTGGGCCTAGATACGCTGAATGTGCAGAAAAAATATGAT 540
FliC - d 481: AAAGAAATCAGCTCTAAAACACTGGGACTTGATAAGCTTAATGTCCAAGATGCCTACACC 540
FliC - i 481: AAGCAGATCAACTCTCAGACCCTGGGTCTGGATACGCTGAATGTGCAACAAAAATATAAG 540
** *.****.****.*.**.*****.**.**** *.*.***.**. * **
FliC - a 541: GTGAAGAGCGAAGCGGTCACGCCTTC - GGCTA - - CATTAAGCACTACTGCACTTGATGGT 597
FliC - b 541: CCAAAAGGTACCGCTGTTACCAGAGA - TGTTA - - CCACCTATAAAAATGGTGGTACTACT 597
FliC - a 769: GCAGTCACAATGAC - - T - GCGGCTACCAC - CAAAGAGGCT - ACAAC - TCCTACAGGTATT 822
FliC - b 769: GCAAATAAAGCAACAGT - - - AACTGGGGCTAGT - - - - - - - - - - - - - - - - - - - - - ACAGTT 804
FliC - c 769: ACAGGAGCAGTTACTTTTGCGACTACACC - AACAGTGGTTGACTTA - - CCAACTGATGCA 825
FliC - d 778: ACTGATAAAACTCCGTTGGCAACTGCGGAAGCTACAGCTATTCGGGGAACGGCCACTATA 837
FliC - i 771: G - ACTCTTGCTGGCGGT - GCGACTTCCCCGCTTACAGGTGGACTACCTGCGACAGCAACT 828
* * **
FliC - a 823: ACTGAAGTTACTCAAGTCCAAA - - - AACCTGTGGCTGCTC - - - CAGCTGCTAT - - - - CCA 872
FliC - b 805: ACTGAAAACCAAATTGTAGACGCTGTTACACCGACGCCAGTTGATACAGTCGCAGCAGCT 864
FliC - c 826: AAAGCAGTTTCAAAAGTTCAAC - - - AGAATGATACTGAAATAGCAGCAACAAATGCGAAA 882
FliC - d 838: ACCCACAACCAAATTGCTGAAG - - - TAACAAAAGAGGGTGTTGATACGACCACAGTTGCG 894
FliC - i 829: GAGGATGTGAAAAATGTACAAG - - - TTGCAAATGCTGATTTGACAGAGGCTAA - - - - - - A 879
* *
FliC - a 873: GGCTCAGTTGACTGCTGCCCATGTGACCGGCGCTGATACTG - - - - - - CTGAAATGGTTAA 926
FliC - b 865: ACTGCA - TTGACCAATGCAGGTGTGACAGGTGC - GACAGGTA - - ATACCAGCTTGGTTAA 920
FliC - c 883: GCTGCA - TTAAAAGCTGCAGGAGTTGCAGATGCAGAAGCTGATACAGCTACTTTAGTGAA 941
FliC - d 895: GCTCAA - CTTGCTGCAGCAGGGGTTACTGGCGCCGATAAGGACAATACTAGCCTTGTAAA 953
FliC - i 880: GCCGCA - TTGACAGCAGCAGGTGTTACCGGCACAGCATCTG - - - - - - TTG - - - - - - TTAA 926
*.* ** ** * * * * *.**
FliC - a 927: GATGTCTTATACGGATAAAAACGGTAAGACTATTGATGGCGGTTTCGGTGTTAAAGTTGG 986
FliC - b 921: AATGTCATTTGAAGATAAAAATGGCAAAGTTACTGATGCGGGTTACGCGCTTAAAGTTGG 980
FliC - c 942: AATGTCTTATACAGATAATAATGGCAAAGTTATTGATGGTGGGTTCGCATTTAAGACCTC 1001
FliC - d 954: ACTATCGTTTGAGGATAAAAACGGTAAGGTTATTGATGGTGGCTATGCAGTGAAAATGGG 1013
FliC - i 927: GATGTCTTATACTGATAATAACGGTAAAACTATTGATGGTGGTTTAGCAGTTAAGGTAGG 986
*.**.*.* *****.**.**.** **.***** **.* * *.**
FliC - a 987: GGCTGATATTTATGCTGCAACAAAAAAT - - - AAAGATGGATCGTTCAGCATTAACACCAC 1043
FliC - b 981: AAATGATTATTATGCCGCTGATTACGATGAAAAAACTGGTGAGATAAAAGCTAAAACTGT 1040
FliC - a 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAGGTTGATGCGCTGCGTTCTGACTT 1277
FliC - b 1218: AAACCCGCTGGCTAAAATTGATGCCGCGCTGGCGCAAGTTGATGCGCTGCGTTCTGACTT 1277
FliC - c 1236: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCGCAGGTGGATGCGCTGCGTTCTGACCT 1295
FliC - d 1251: AAACCCACTGCAGAAAATTGATGCTGCCTTGGCACAGGTTGATACACTTCGTTCTGACCT 1310
FliC - i 1218: AAACCCGCTGCAGAAAATTGATGCTGCTTTGGCACAGGTTGACACGTTACGTTCTGACCT 1277
******.*** ***********.**.****.**.**.** * *.*********.*
FliC - a 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1337
FliC - b 1278: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAA 1337
FliC - c 1296: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1355
FliC - d 1311: GGGTGCGGTTCAGAACCGTTTCAACTCCGCTATCACCAACCTGGGCAATACCGTAAATAA 1370
FliC - i 1278: GGGTGCGGTACAGAACCGTTTCAACTCCGCTATTACCAACCTGGGCAACACCGTAAACAA 1337
*********.***********************.**************.********.**
FliC - a 1338: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397
FliC - b 1338: CCTGTCTGAAGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTCTCCAACAT 1397
FliC - c 1356: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1415
FliC - d 1371: CCTGTCTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCAACCGAAGTCTCCAACAT 1430
FliC - i 1338: CCTGACTTCTGCCCGTAGCCGTATCGAAGATTCCGACTACGCGACCGAAGTTTCCAACAT 1397
****.** ********************************.********.********
31
TCNCYH phụ bản 32 (6) - 2004
FliC - a 1398: GTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
FliC - b 1398: GTCCCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
FliC - c 1416: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGG - 1474
FliC - d 1431: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1490
FliC - i 1398: GTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACCTCCGTTCTGGCGCAGGCGAACCAGGT 1457
***.***********.*******************************************.
Hình 2: Sơ đồ biểu diễn giá trị Ct
(ở đây, Ct = 17,5)
32
TCNCYH phụ bản 32 (6) - 2004
Để có thể định lợng đợc, phải lập đờng chuẩn với các giá trị đã biết của các nồng độ ADN khác
nhau (Hình 3): 5
4
2
3
1
DNA sequencing was first introduced in 1975 by Sanger. The sequencing technique was started with the
related information on the interested gene in internet. The following steps consisted of:
- Design specific primers
- Extract and purify DNA templates
- Conduct first PCR (PCR - 1) with the specific primers and template
- Purify the DNA product from PCR - 1
- Conduct second PCR (PCR - 2) with the addition of dideoxynucleosides triphosphate and only one
primer (not pair of the primers)
- Purify the PCR - 2 product and denature the DNA to get single - stranded DNA
- Read sequences with ABI 3100 avant sequencer
- Processing the collected data and publish
Real - Time PCR was a quantitative PCR. The principle of the PCR was based on the threshold value (Ct).
The Ct value was minimum number of the cycles of a PCR at which the double - stranded DNA was first
synthetized. Thus, the smaller Ct value we got, the greater DNA template present at the beginning of the
reaction and vise versa.
The basic differentiation in Real - Time PCR compared to the normal one was known standards (the DNA
template with the defined concentration). The standards were run paralell with the samples. The results of
Real - Time PCR will then show exactly the copy numbers of templates in the original samples.
34