Bài giảng tin sinh học chương 5 ths nguyễn thành luân - Pdf 32

10/19/2012

TRƢỜNG ĐẠI HỌC CNTP TPHCM

KHOA CNSH & KTMT
HỆ LIÊN THÔNG ĐẠI HỌC

Chƣơng 5

Giải mã trình tự toàn bộ
bộ gen
ThS. Nguyễn Thành Luân
Email:

Tại sao cần thiết phải giải mã toàn
bộ bộ gen?









Sự minh chứng cho việc giải mã trình tự gene
Bản hướng dẫn cho ngành sinh học về các cơ thể
sống
Khám phá mỗi gen mã hóa bởi bộ gen của 1 loài động
vật –trong việc mất đoạn trình tự gen, chỉ “đoạn gen
cần quan tâm” được giải mã

Giải mã trình tự Sanger


Hoạt động bằng thực hiện các phản ứng nhẹ
nhàng phá gãy 1 đoạn DNA chuẩn đã tái tạo, xúc
tác bởi enzyme DNA polymerase.

Phản ứng giải mã trình tự

3


10/19/2012

Các bƣớc cơ bản trong giải mã trình tự
Thêm đoạn mồi: mảnh ngắn của DNA đƣợc
kết hợp đến chỉ 1 nơi trên mẫu khuôn DNA

Thêm enzyme cắt DNA polymerase: có
nhiệm vụ tổng hợp 1 sợi DNA mới
Thêm các nhóm bazơ nitric (4 nitrogenous
bases): sẽ kết hợp chặt chẽ trong sợi mới
Thêm 4 nhóm dideoxynucleotide (ddNTPs–
còn đƣợc gọi là các điểm đích sẽ thỉnh
thoảng đƣợc thêm vào trong sợi DNA đã
đƣợc tổng hợp mới nhƣng sẽ kết thúc phản
ứng đó

4



5


10/19/2012






Với việc sử dụng các phần mềm khác nhau, sẽ
cung cấp cho chúng ta1 hình ảnh gel nhƣ trên
Mỗivạch (band) tƣơng ứng cho 1 mảnh của đoạn
DNA khác nhau về 1 đoạn chiều dài của
nucleotide. Màu sắc trong vạch biểu thị cho việc
ddNTPs đƣợc kết hợp trong đoạn DNA
Giải mã trình tự đơn giản chỉ là đọc lại kết quả gel

Giải mã trình tự trên những khu vực gel để đọc kết quả giải mã

6


10/19/2012

Phản ứng giải mã trình tự tiên phát
(primary)





Bacteriophage chỉ có 5000bp
– Mất 4 năm để hoàn thành việc giải mã
Các loài đơn giản nhất (Vi khuẩn) có bộ genome
khoảng 2,000,000 bp
–Mất khoảng1,600 năm cho việc giải mã

8


10/19/2012

Phƣơng pháp tạo phản ứng trong
việc giải mã


Các mục tiêu trong việc giải mã trình tự các phân
mảnh lớn của DNA
 PP

Walking

 PP

Shotgun

Phản ứng Walking



Walking vs Shotgun






Walking hiệu quả hơn –giải mã trình tự chỉ 1 làn duy
nhất
Walking thường chậm hơn, mất đến 2-3 ngày để thiết
kế và tổng hợp các mồi (primer) mới cho trình tự
Shotgun ít hiệu quả hơn vì là giải mã trình tự ngẫu
nhiên, cần phải giải mã mỗi trình tự ít nhất 10 lần lặp
lại
Nhanh hơn Walking –không cần tổng hợp và thiết kế
mồi (primer) –sử dụng 1 loại giống nhau cho tất cả
các phản ứng

10


10/19/2012

Các khó khăn gặp phải khi giải mã
trình tự genome






10/19/2012

Vận hành phƣơng pháp Shotgun


Quy tắc chung –giải mã ít nhất 10 lần kích cỡ bộ gen
để đảm bảo độ bao phủ hoàn toàn trình tự giải mã



VD: 1 bộ genome 5kbase=5000base, máy giải mã
phải giải mã 5000*10/500 trình tự = 100 đoạn
Để kết hợp lại, phải làm các phép so sánh 2 đoạn
phân mảnh DNA (comparisons) = C(100,2)
C(100,2) = 4,950 phép so sánh

Các phép so sánh


Đối với bộ genome ngƣời, có quá nhiều phép
so sánh cần phải thực hiện, sẽ phải mất rất
nhiều năm để tính toán thời gian hoàn thành.

12


10/19/2012

CÁC HƢỚNG KHẮC PHỤC


trình tự Genome ngƣời


I: Cung cấp 1 bản đồ vật chất của genome



II: Trình diễn (perform) các phản ứng giải mã trình tự



III: Kết hợp các phân mảnh/miếng (piece) trình tự với
nhau

14


10/19/2012

Bản đồ vật chất







Bộ genome người –3.3 gigabase (Gb) (3.3 x 109 bp)
Mỗi NST quá lớn để quan sát và phân tích trình tự
Khởi đầu genome phải được phân đoạn thành các

chiều dài khác nhau:
–Nhóm RE 4-base cắt 1 lần khoảng 256
bases/trình tự
–Nhóm RE 6-base cắt 1 lần khoảng 4096
bases/trình tự
–Nhóm RE 8-base cắt 1 lần khoảng 65
kbases/trình tự
 Tuy nhiên, trong thực tế, các phần cắt mảnh DNA
chủ yếu chỉ dùng nhóm RE 4 base.

16


10/19/2012









Sự chia cắt vật chất ở NST thường sử dụng FACS
(máy phân loại các tế bào hoạt động gắn huỳnh
quang)
Vạch đích huỳnh quang gắn vào NST. Số lượng
vạch đánh dấu đích cân xứng với kích cỡ của
NST
Các giọt nhỏ giọt, mỗi loại chứa 1 NST di chuyển

10/19/2012

Triển vọng và hạn chế của ứng dụng tin
sinh học trong giải mã trình tự bộ gen

 Hầu hết các trình tự sau khi đƣợc phân mảnh
phải mất thời gian sắp xếp lại theo đúng thứ tự
 Ví dụ: xác định đoạn lặp (overlap) số 3 với đoạn
số 18, 18 với 1078….

Tìm kiếm các đoạn lặp



Đòi hỏi một số cách tính toán trình tự của mỗi
đoạn phân mảnh



Sử dụng quá trình cắt hạn chế (Restriction
digest)



Xử lý qua điện di các phân mảnh (gel agarose)

19


10/19/2012

(mate-pair) và mô hình khung giáo (scaffold)

20


10/19/2012

Mô hình “Mate-Pair” và “Scaffold”





Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc các
khoảng cách chính xác giữa các cặp trình tự
Genome được phân mảnh thành các đoạn lặp đã biết
được chiều dài như
–2 kbase
–10 kbase
–50 kbase
–150 kbase
Giải mã trình tự cả 2 đầu của các đoạn phân mảnh
DNA

Mô hình Shotgun thông thƣờng


Ngẫu nhiên phân mảnh và giải mã đoạn DNA 500
bp, và xác định các đoạn lặp


22


10/19/2012

Mô hình giàn khung (Scafffold)

 Scaffold thay thế cho việc lập bản đồ vật chất –do quy trình thực hiện
nhanh hơn. Về lý thuyết, chúng ta có thể kết nối thành bộ gen hoàn chỉnh
từ các trình tự giải mã sử dụng mô hình giàn khung
 Trình tự bộ genome cuối cùng được kết nối hướng về việc chứa các
đoạn khoảng trống (gaps) đầu tiên bởi các trình tự lặp. Mô hình kết hợp sẽ
giúp cho việc bù đắp các đoạn gaps
 Vì thế, mô hình hỗ trợ cá nhân sẽ sử dụng thông tin bản đồ vật chất
được thiết kế trong mô hình gây quỹ cộng đồng để giúp cho việc bù đắp
các đoạn gap.





Các đoạn tiếp giáp có thể gia nhập nhóm DNA bạn bè
nên được gọi là mô hình nhóm bạn bè (Mate-pairs)
hướng theo và đặt các nhóm tiếp giáp liên quan với
các nhóm khác.
Khi ngày càng nhiều cặp bạn bè được so sánh, 1 giàn
khung giáo (scaffold) từ từ được xây dựng.

23


Tài liệu tham khảo

/>
KẾT THÚC CHƢƠNG V

25



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status