10/19/2012
TRƢỜNG ĐẠI HỌC CNTP TPHCM
KHOA CNSH & KTMT
HỆ LIÊN THÔNG ĐẠI HỌC
Chƣơng 5
Giải mã trình tự toàn bộ
bộ gen
ThS. Nguyễn Thành Luân
Email:
Tại sao cần thiết phải giải mã toàn
bộ bộ gen?
Sự minh chứng cho việc giải mã trình tự gene
Bản hướng dẫn cho ngành sinh học về các cơ thể
sống
Khám phá mỗi gen mã hóa bởi bộ gen của 1 loài động
vật –trong việc mất đoạn trình tự gen, chỉ “đoạn gen
cần quan tâm” được giải mã
Giải mã trình tự Sanger
Hoạt động bằng thực hiện các phản ứng nhẹ
nhàng phá gãy 1 đoạn DNA chuẩn đã tái tạo, xúc
tác bởi enzyme DNA polymerase.
Phản ứng giải mã trình tự
3
10/19/2012
Các bƣớc cơ bản trong giải mã trình tự
Thêm đoạn mồi: mảnh ngắn của DNA đƣợc
kết hợp đến chỉ 1 nơi trên mẫu khuôn DNA
Thêm enzyme cắt DNA polymerase: có
nhiệm vụ tổng hợp 1 sợi DNA mới
Thêm các nhóm bazơ nitric (4 nitrogenous
bases): sẽ kết hợp chặt chẽ trong sợi mới
Thêm 4 nhóm dideoxynucleotide (ddNTPs–
còn đƣợc gọi là các điểm đích sẽ thỉnh
thoảng đƣợc thêm vào trong sợi DNA đã
đƣợc tổng hợp mới nhƣng sẽ kết thúc phản
ứng đó
4
5
10/19/2012
Với việc sử dụng các phần mềm khác nhau, sẽ
cung cấp cho chúng ta1 hình ảnh gel nhƣ trên
Mỗivạch (band) tƣơng ứng cho 1 mảnh của đoạn
DNA khác nhau về 1 đoạn chiều dài của
nucleotide. Màu sắc trong vạch biểu thị cho việc
ddNTPs đƣợc kết hợp trong đoạn DNA
Giải mã trình tự đơn giản chỉ là đọc lại kết quả gel
Giải mã trình tự trên những khu vực gel để đọc kết quả giải mã
6
10/19/2012
Phản ứng giải mã trình tự tiên phát
(primary)
Bacteriophage chỉ có 5000bp
– Mất 4 năm để hoàn thành việc giải mã
Các loài đơn giản nhất (Vi khuẩn) có bộ genome
khoảng 2,000,000 bp
–Mất khoảng1,600 năm cho việc giải mã
8
10/19/2012
Phƣơng pháp tạo phản ứng trong
việc giải mã
Các mục tiêu trong việc giải mã trình tự các phân
mảnh lớn của DNA
PP
Walking
PP
Shotgun
Phản ứng Walking
Walking vs Shotgun
Walking hiệu quả hơn –giải mã trình tự chỉ 1 làn duy
nhất
Walking thường chậm hơn, mất đến 2-3 ngày để thiết
kế và tổng hợp các mồi (primer) mới cho trình tự
Shotgun ít hiệu quả hơn vì là giải mã trình tự ngẫu
nhiên, cần phải giải mã mỗi trình tự ít nhất 10 lần lặp
lại
Nhanh hơn Walking –không cần tổng hợp và thiết kế
mồi (primer) –sử dụng 1 loại giống nhau cho tất cả
các phản ứng
10
10/19/2012
Các khó khăn gặp phải khi giải mã
trình tự genome
10/19/2012
Vận hành phƣơng pháp Shotgun
Quy tắc chung –giải mã ít nhất 10 lần kích cỡ bộ gen
để đảm bảo độ bao phủ hoàn toàn trình tự giải mã
VD: 1 bộ genome 5kbase=5000base, máy giải mã
phải giải mã 5000*10/500 trình tự = 100 đoạn
Để kết hợp lại, phải làm các phép so sánh 2 đoạn
phân mảnh DNA (comparisons) = C(100,2)
C(100,2) = 4,950 phép so sánh
Các phép so sánh
Đối với bộ genome ngƣời, có quá nhiều phép
so sánh cần phải thực hiện, sẽ phải mất rất
nhiều năm để tính toán thời gian hoàn thành.
12
10/19/2012
CÁC HƢỚNG KHẮC PHỤC
trình tự Genome ngƣời
I: Cung cấp 1 bản đồ vật chất của genome
II: Trình diễn (perform) các phản ứng giải mã trình tự
III: Kết hợp các phân mảnh/miếng (piece) trình tự với
nhau
14
10/19/2012
Bản đồ vật chất
Bộ genome người –3.3 gigabase (Gb) (3.3 x 109 bp)
Mỗi NST quá lớn để quan sát và phân tích trình tự
Khởi đầu genome phải được phân đoạn thành các
chiều dài khác nhau:
–Nhóm RE 4-base cắt 1 lần khoảng 256
bases/trình tự
–Nhóm RE 6-base cắt 1 lần khoảng 4096
bases/trình tự
–Nhóm RE 8-base cắt 1 lần khoảng 65
kbases/trình tự
Tuy nhiên, trong thực tế, các phần cắt mảnh DNA
chủ yếu chỉ dùng nhóm RE 4 base.
16
10/19/2012
Sự chia cắt vật chất ở NST thường sử dụng FACS
(máy phân loại các tế bào hoạt động gắn huỳnh
quang)
Vạch đích huỳnh quang gắn vào NST. Số lượng
vạch đánh dấu đích cân xứng với kích cỡ của
NST
Các giọt nhỏ giọt, mỗi loại chứa 1 NST di chuyển
10/19/2012
Triển vọng và hạn chế của ứng dụng tin
sinh học trong giải mã trình tự bộ gen
Hầu hết các trình tự sau khi đƣợc phân mảnh
phải mất thời gian sắp xếp lại theo đúng thứ tự
Ví dụ: xác định đoạn lặp (overlap) số 3 với đoạn
số 18, 18 với 1078….
Tìm kiếm các đoạn lặp
Đòi hỏi một số cách tính toán trình tự của mỗi
đoạn phân mảnh
Sử dụng quá trình cắt hạn chế (Restriction
digest)
Xử lý qua điện di các phân mảnh (gel agarose)
19
10/19/2012
(mate-pair) và mô hình khung giáo (scaffold)
20
10/19/2012
Mô hình “Mate-Pair” và “Scaffold”
Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc các
khoảng cách chính xác giữa các cặp trình tự
Genome được phân mảnh thành các đoạn lặp đã biết
được chiều dài như
–2 kbase
–10 kbase
–50 kbase
–150 kbase
Giải mã trình tự cả 2 đầu của các đoạn phân mảnh
DNA
Mô hình Shotgun thông thƣờng
Ngẫu nhiên phân mảnh và giải mã đoạn DNA 500
bp, và xác định các đoạn lặp
22
10/19/2012
Mô hình giàn khung (Scafffold)
Scaffold thay thế cho việc lập bản đồ vật chất –do quy trình thực hiện
nhanh hơn. Về lý thuyết, chúng ta có thể kết nối thành bộ gen hoàn chỉnh
từ các trình tự giải mã sử dụng mô hình giàn khung
Trình tự bộ genome cuối cùng được kết nối hướng về việc chứa các
đoạn khoảng trống (gaps) đầu tiên bởi các trình tự lặp. Mô hình kết hợp sẽ
giúp cho việc bù đắp các đoạn gaps
Vì thế, mô hình hỗ trợ cá nhân sẽ sử dụng thông tin bản đồ vật chất
được thiết kế trong mô hình gây quỹ cộng đồng để giúp cho việc bù đắp
các đoạn gap.
Các đoạn tiếp giáp có thể gia nhập nhóm DNA bạn bè
nên được gọi là mô hình nhóm bạn bè (Mate-pairs)
hướng theo và đặt các nhóm tiếp giáp liên quan với
các nhóm khác.
Khi ngày càng nhiều cặp bạn bè được so sánh, 1 giàn
khung giáo (scaffold) từ từ được xây dựng.
23
Tài liệu tham khảo
/>
KẾT THÚC CHƢƠNG V
25