TÌM KIẾM TRÌNH
TỰ SINH HỌC VÀ ĐĂNG KÝ
TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU
Mục tiêu của bài học
Có khả tìm kiếm được những trình tự sinh học
như DNA, RNA, Protein.
Đăng ký những trình tự đã nghiên cứu được lên
Cơ sở dữ liệu sinh học bằng phần mềm Sequin.
Tìm ki m trình t sinh h cế ự ọ
2
Nguyên tắc trong giải trình tự
Phương pháp Sanger: là phương pháp dựa trên sự tổng
hợp gián đoạn DNA.
Dựa theo phương pháp này chúng ta có thể xác định
được trình tự nucleotide của DNA hay RNA (ATGC…
TTT)
3
Tìm ki m trình t sinh h cế ự ọ
Nhiễm sắc thể, DNA, Gene, Nucleotide
Gi i thi u môn h cớ ệ ọ
4
Gửi trình tự lên Genebank của NCBI
Trình tự đã giải
Gi i thi u môn h cớ ệ ọ
5
Đưa vào cơ sở dữ liệu sinh học:
9
Mã số truy cập của một trình tự là mã số do các nhà quản trị
CSDLSH đặt cho một trình tự, thường có dạng :
8 ký tự : 2 chữ và 6 số ví dụ như AY690640
6 ký tự : 1 chữ và 5 số ví dụ như U20068
TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP
Tìm ki m trình t sinh h cế ự ọ
10
Kết quả tìm trình tự DNA qua mã số truy cập
Gi i thi u môn h cớ ệ ọ
11
Tìm ki m trình t sinh h cế ự ọ
12
Tìm kiếm trình tự qua tên gene
Tìm ki m trình t sinh h cế ự ọ
13
Cách lấy trình tự theo định dang FASTA
Gi i thi u môn h cớ ệ ọ
14
Định dạng FASTA
FASTA là một giải thuật bắt cặp trình tự được David
J. Lipman và William R. Pearson miêu tả lần đầu tiên
vào năm 1985 (Rapid and sensitive protein similarity
searches).
Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene
16
Ví dụ 1: NM_123456Curated mRNA
Tìm ki m trình s sinh h cế ọ
17
NM_123456
V í dụ 2: NC_12345
Gi i thi u môn h cớ ệ ọ
18