PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
75
o Phần hình ảnh minh họa tổng thể:
Hình 2.22: Phần ảnh minh họa tổng thể kết quả BLAST
Phần này cho ta thông tin tổng quát về sự bắt cặp của trình tự query với các trình
tự khác trong cơ sở dữ liệu. Trình tự query là thanh đỏ có đánh số, các thanh khác là
các trình tự trong cơ sở dữ liệu. Thanh nào càng gần thanh query thì sự tƣơng đồng với
trình tự query càng cao, ngoài ra màu sắc cũng thể hiện độ tƣơng đồng ( màu đỏ có
điểm số cao nhất, tới màu hồng,…). Ở đây ta thấy có rất nhiều trình tự khớp với trình
tự query, có trình tự khớp cả hai primer và cũng có trình tự chỉ khớp với một primer.
Ta chỉ quan tâm đến các trình tự khớp với cả hai primer. Để biết thêm thông tin về các
trình tự này, ta có thể nhấp chuột vào thanh quan tâm hay kéo xuống xem tới phần tiếp
theo.
o Phần tóm tắt một dòng:
Hình 2.23: Phần tóm tắt kết quả BLAST
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
76
Phần này cung cấp thông tin tóm tắt về các trình tự tìm thấy trong cơ sở dữ liệu,
số gi, cơ sở dữ liệu của từng trình tự, số version, số locusID, định nghĩa tóm tắt của
trình tự, điểm số theo số bit và giá trị E-value.
Lƣớt sơ qua phần này ta thấy, gene ACCg8 của Brassica napus xuất hiện ngay
phần đầu tiên đúng nhƣ mong muốn. Ta muốn xem sự bắt cặp của trình tự này với mồi
nhƣ thế nào chỉ cần click chuột trên scorce (bits) tƣơng ứng. Ta đƣợc bảng sau:
Hình 2.24: Phần xem chi tiết về sự gióng trình tự trên trang kết quả BLAST
Bảng này đƣa ra định nghĩa đầy đủ cho trình tự, chiều dài của trình tự, các thông
số điểm và cuối cùng là sự gióng trình tự. Ở đây ta thấy, mồi xuôi bắt cặp với mạch
(Accession number I41419) với điểm khởi đầu là cặp primer sau:
CryIA(b)-V3: 5'-CCTGACCAAGAGCACCAACCTGG-3'
CryIA(b)-V4: 5'-GCTCATGGTGGCGCTGAAGTTGC-3'
(Virginia García-Cañas, Ramón González, Alejandro Cifuentes). Đầu tiên ta cũng
nhập trình tự primer vào khung tìm kiếm:
Hình 2.26: Nhập trình tự Primer vào khung tìm kiếm gene cryIA(b)
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
78
Ta thực hiện tìm kiếm trong cơ sở dữ liệu nr, các thông số khác cũng đƣợc mặc
định giống nhƣ phần trƣớc. Sau khi thực hiện BLAST, kết quả nhƣ sau:
Hình 2.27: Kết quả tìm kiếm với Primer gene cryIA(b)
Trong kết quả xuất ra, ta không thấy trình tự Accession number I41419. Tại sao?
Có nhiều khả năng xảy ra ở đây, có thể primer không đặc hiệu khớp với nhiều trình tự
khác mà có điểm số cao hơn trình tự ta cần tìm, vì thế trình tự cần tìm không đƣợc thể
hiện ra trong kết quả. Trong trƣờng hợp này ta phải áp dụng thêm một vài chọn lựa
khác nhƣ mở rộng thêm phần thể hiện kết quả, giới hạn chỉ xuất kết quả trên vi khuẩn
(vì ta biết gene CryIA(b) nó có nguồn gốc từ vi khuẩn).
Ta đƣợc kết quả sau:
Hình 2.28: Kết quả tìm kiếm sau khi thay đổi thông số
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
79
Kết quả này cũng không cho ra trình tự mong muốn. Vậy lý do là do đâu? Ta biết
primer là một trình tự gắn, việc so trình tự primer với các trình tự trong cơ sở dữ liệu
khổng lồ sẽ cho kết quả dữ liệu khớp rất lớn nếu trình tự primer đó không đặc hiệu, vì
thế đối với các primer không chuyên biệt ta rất khó lấy đƣợc dữ liệu mong muốn. Khi
hợp cho mục đích tìm kiếm của mình.
Ta thực hiện tìm các trình tự tƣơng đồng nhƣ sau:
Nhập trình tự query:
Hình 2.32: Tìm kiếm trình tự bằng số xác định qua trang BLAST
PHẦN C: PHƢƠNG PHÁP TIẾN HÀNH – Tìm kiếm dữ liệu trình tự
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
81
Vì trình tự này có sẵn trong GenBank, ta không cần nhập trình tự vào mà chỉ cần
nhập vào số xác định cho trình tự đó nhƣ Accession number, gi. Ở đây ta nhập vào
Accession number.
Thực hiện và định dạng kết quả xuất ra, lựa chọn Bacteria ở mục select from.
Ở đây ta chỉ quan tâm kết quả trên vi khuẩn. Kết quả xuất ra nhƣ sau:
Hình 2.33: Kết quả BLAST dạng HTML
Nhìn vào kết quả ở dạng hình ảnh và phần tóm tắt, ta thấy chỉ có vài kết quả đầu
là phù hợp với mục đích của ta, là các trình tự có liên quan đến cây trồng biến đổi di
truyền. Ta chọn và lấy các trình tự này về dƣới dạng text file.
Hình 2.34: Kết quả BLAST dạng text
Tóm lại dựa vào trình tự các primer tổng hợp đƣợc từ các bài báo, ta sẽ dùng các
trình tự này tìm kiếm trình tự mong muốn, đồng thời cũng tìm luôn các trình tự liên
quan tới trình tự quan tâm hiện đang có trong cơ sở dữ liệu thế giới làm cho dữ liệu
của ta sẽ phong phú hơn, đáp ứng đƣợc nhiều mục đích khai thác sử dụng.
PHẦN D: KẾT QUẢ VÀ THẢO LUẬN
NGUYỄN KỲ TRUNG – LÊ THÀNH TRUNG
82
D. KẾT QUẢ VÀ THẢO LUẬN
I. Các kết quả thu đƣợc từ quá trình tìm kiếm ấn phẩm khoa học