Xây dựng CSDL hai gene 16S và 23S rRNA ở vi khuẩn - Ứng dụng CSDL này để phát hiện các vi khuẩn gây bệnh viêm màng não mủ - Pdf 96

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000*** LÊ VĂN TÁM
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)

Luận văn kỹ sƣ
Chuyên ngành: Công nghệ sinh học

Luận văn Kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Giáo viên hƣớng dẫn Sinh viên thực hiện
TS. TRẦN THỊ DUNG LÊ VĂN TÁM
LƢU PHÚC LỢI

Thành phố Hồ Chí Minh
-2006-
MINISTRY OF EDUCATION AND TRAINING
NONG LAM UNIVERSITY, HCMC
DEPARTMENT OF BIOTECHNOLOGY
************


Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Ban Giám hiệu trƣờng Đại học Nông Lâm thành phố Hồ Chí Minh, Ban chủ
nhiệm Bộ môn Công nghệ Sinh học, cùng tất cả quý thầy cô đã truyền đạt kiến
thức cho tôi trong suốt quá trình học tại trƣờng.
TS. Trần Thị Dung và Cử Nhân Lƣu Phúc Lợi đã tận tình hƣớng dẫn, giúp đỡ
tôi trong thời gian làm khóa luận tốt nghiệp.
Xin gởi lời cảm ơn đến tập thể lớp Công Nghệ Sinh Học K28 đã động viên,
giúp đỡ và luôn ở bên cạnh tôi trong những lúc vui buồn.
Cha mẹ kính yêu đã nuôi nấng, dạy dỗ và động viên để con có thể đạt đƣợc
thành quả nhƣ ngày hôm nay.
Thành phố Hồ Chí Minh, ngày…tháng…năm 2006
Sinh viên
LÊ VĂN TÁM

iv
TÓM TẮT KHÓA LUẬN

LÊ VĂN TÁM, Đại học Nông Lâm TP. Hồ Chí Minh. Tháng 8/2006. “XÂY

phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não
mủ.

Đề tài đã đạt đƣợc những kết quả nhƣ sau:
Đã thu thập đƣợc 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S
rRNA từ cơ sở dữ liệu GenBank (NCBI).
Tạo đƣợc CSDL của hai gene 16S và 23S rRNA tích hợp với web.
Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH,
TOOL, LINK, ABOUT. Từ các trang web này, ngƣời sử dụng có thể truy xuất
thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong
CSDL (alignment, BLAST)… Ngoài ra, những trang web chính này còn kết nối
đến những trang phụ khác để cung cấp các tiện ích cho ngƣời dùng.
Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng
não mủ bằng chƣơng trình thiết kế mồi Primrose.
vi
MỤC LỤC

Nội dung Trang
LỜI CẢM ƠN ............................................................................................................. iii
TÓM TẮT KHÓA LUẬN .......................................................................................... iv
MỤC LỤC ................................................................................................................... vi
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ ......................................................................x
DANH SÁCH CÁC HÌNH ......................................................................................... xi
DANH SÁCH CÁC CHỮ VIẾT TẮT .................................................................... xiii
PHẦN 1: MỞ ĐẦU .......................................................................................................1
1.1. ĐẶT VẤN ĐỀ ......................................................................................................... 1
1.2. MỤC ĐÍCH ............................................................................................................. 2

2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh .................................. 13
2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh ................................................. 13
2.4.2.1. Những triệu chứng giai đoạn khởi phát ...................................................... 13
2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ ............................................... 13
2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm .................................. 15
2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam ................... 15
2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ .......................................... 16
2.6. CÁC PHƢƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ ...... 18
2.6.1. Phƣơng pháp chẩn đoán lâm sàng ..................................................................... 18
2.6.2. Phƣơng pháp xét nghiệm vi khuẩn học ............................................................. 18
2.6.3. Phƣơng pháp miễn dịch học ................................................................................ 19
2.6.4. Phƣơng pháp tế bào học ....................................................................................... 19
2.6.5. Phƣơng pháp sinh hoá ........................................................................................... 19
2.6.5.1. Đƣờng trong dịch não tủy .............................................................................. 19
2.6.5.2. Đạm trong dịch não tủy .................................................................................. 19
2.6.5.3. Phƣơng pháp khảo sát nồng độ lactate ....................................................... 20
2.6.6. Phƣơng pháp chụp cắt lớp – CT (computer tomography) ........................... 20
2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR ........................................... 20
2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN
GÂY BỆNH VIÊM MÀNG NÃO MỦ ....................................................................... 20
2.7.1. Nguyên tắc của kỹ thuật PCR ............................................................................. 20
2.7.2. Quy trình của phản ứng PCR .............................................................................. 21
2.7.3. Seminested PCR/ Multiplex PCR ....................................................................... 22

viii
2.7.3.1. Seminested PCR ............................................................................................... 22
2.7.3.2. Multiplex PCR .................................................................................................. 22
2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm
màng não mủ. ..................................................................................................................... 22
2.8. GENE 16S rRNA VÀ 23S rRNA .......................................................................... 24

gene 16S và 23S rRNA ................................................................................................. 52
4.2. CSDL gene 16S và 23S rRNA .............................................................................. 52
4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA ............................ 52
4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) ..... 54
4.3.2. Trang tìm kiếm (Search Page) ............................................................................ 55
4.3.3. Trang công cụ (Tool Page) ................................................................................... 58
4.3.4. Trang Meningitidis ................................................................................................ 60
4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ ......... 60
PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ ........................................................................63
PHẦN 6: TÀI LIỆU THAM KHẢO .........................................................................64
PHỤ LỤC

x
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ Trang
Bảng 2.1. Tóm tắt tác nhân gây bệnh theo lứa tuổi ...................................................... 12
Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ ................................ 14
Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ ......................... 28
Bảng 3.1. Các đối tƣợng phụ dựa trên đối tƣợng chính sinh vật .................................. 38
Bảng 3.2. Các đối tƣợng phụ dựa trên đối tƣợng chính trình tự .................................. 39
Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA ................... 33
Sơ đồ các đối tƣợng chính trong CSDL hai gene 16S và 23S rRNA ............................ 38
Sơ đồ chi tiết các bảng quan hệ .................................................................................... 40
Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA .......... 53 xi
DANH SÁCH CÁC HÌNH


xii
Hình 3.17. Danh sách các mồi thiết kế đƣợc cho trình tự gene 23S rRNA ở
Streptococcus pneumoniae ........................................................................................... 48
Hình 3.18. Vị trí bắt cặp của mồi xuôi trên trình tự đích 23S rRNA ............................ 49
Hình 3.19. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 23S rRNA ......................... 49
Hình 3.20. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 23S
rRNA ............................................................................................................................. 50
Hình 3.21. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene
23S rRNA ...................................................................................................................... 50
Hình 3.22. Tính nhiệt độ nóng chảy của mồi xuôi 16S ................................................ 51
Hình 4.1. Trang Home Page ......................................................................................... 54
Hình 4.2. Trang tìm kiếm theo mã số truy cập (accession number)............................. 55
Hình 4.3. Trang kết quả tìm kiếm bằng mã số truy cập ............................................... 56
Hình 4.4. Trang tìm kiếm theo tên loài (species name) ............................................... 57
Hình 4.5. Trang kết quả tìm kiếm theo tên loài (species name) ................................... 57
Hình 4.6. Trang công cụ sắp gióng cột (Alignment) .................................................... 58
Hình 4.7. Trang kết quả sắp gióng cột hai trình tự ....................................................... 59
Hình 4.8. Trang công cụ BLAST ................................................................................. 59
Hình 4.9. Trang Meningitidis ....................................................................................... 60
Hình 4.10. Sự bắt cặp của cặp mồi 16S rRNA trên trình tự đích và trình tự ngoài vùng
đích ............................................................................................................................... 61
Hình 4.11. Sự bắt cặp của cặp mồi 23S rRNA trên trình tự đích và trình tự ngoài vùng
đích ............................................................................................................................... 61


1
PHẦN 1: MỞ ĐẦU
1.1. ĐẶT VẤN ĐỀ
Sự phát triển của ngành công nghệ thông tin trong những thập kỷ qua đã góp
phần cải thiện chất lƣợng cuộc sống con ngƣời. Máy tính đã có mặt trong hầu hết các
ngành khoa học, hỗ trợ con ngƣời giải quyết những công việc khó khăn và nhiều thời
gian.
Công nghệ sinh học đƣợc xem là ngành khoa học mũi nhọn của thế kỷ XXI. Với
sự ra đời của kỹ thuật giải trình tự, nhiều bộ gene của sinh vật đã đƣợc giải mã, tạo ra
một lƣợng dữ liệu sinh học khổng lồ. Điều này đòi hỏi có sự lƣu trữ, quản lí và khai
thác các dữ liệu một cách hiệu quả. Với khả năng xử lí và truy xuất lƣợng thông tin lớn
và nhanh chóng, máy tính đã trở thành công cụ hữu ích trong nghiên cứu sinh học. Sự
kết hợp giữa ngành sinh học và tin học đã cho ra đời một công cụ mới đó là Tin – Sinh
học (Bioinformatics). Tin – Sinh học giúp giải quyết hàng loạt những nghiên cứu trong
sinh học mà đòi hỏi thời gian dài hay khó có thể thực hiện bằng tay đƣợc.
Cho đến nay, Tin – Sinh học đạt đƣợc nhiều thành tựu to lớn. Nhiều CSDL sinh
học đã đƣợc thiết lập nhƣ NCBI, EMBL, DDBJ…Các CSDL này chứa lƣợng lớn
thông tin phục vụ đắc lực cho các nhà nghiên cứu sinh học.
Gene 16S và 23S rRNA là 2 gene có chức năng cần thiết cho sự sống của vi
khuẩn, vừa có vùng bảo tồn và vừa có vùng biến động ở các cấp độ khác nhau, giúp

– Thông qua các trang web, ngƣời dùng có thể truy cập CSDL để tìm kiếm các
thông tin về hai gene nhƣ tên của vi khuẩn, tên của trình tự, chiều dài trình tự, tác giả
giải trình tự…
– Tích hợp các công cụ phân tích trình tự vào trang web nhƣ BLAST,
Alignment…
– Thiết kế mồi đặc hiệu phân biệt đƣợc các vi khuẩn trong nhóm vi khuẩn viêm
màng não mủ thông qua chƣơng trình thiết kế mồi Primrose 2.17. 3
PHẦN 2: TỔNG QUAN TÀI LIỆU

2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU
2.1.1. Định nghĩa
Cơ sở dữ liệu (CSDL) là một tập hợp dữ liệu đƣợc tổ chức theo một cấu trúc
chặt chẽ nhằm phục vụ cho nhiều mục tiêu khác nhau một cách có chọn lọc. Tập hợp
dữ liệu sẽ đƣợc lƣu trữ trên các thiết bị lƣu trữ thông tin thứ cấp nhƣ băng từ, đĩa từ…
để thỏa mãn nhu cầu khai thác thông tin đồng thời của nhiều ngƣời sử dụng hay nhiều
chƣơng trình ứng dụng với nhiều mục đích khác nhau.
2.1.2. Hệ quản trị CSDL (Database Management System – DBMS)
Là một hệ thống phần mềm cho phép các nhà phân tích và thiết kế CSDL
cũng nhƣ ngƣời khai thác CSDL đƣợc thuận lợi trong quá trình thiết kế, thao tác, truy
xuất và quản lý dữ liệu.
Hiện nay, một số hệ quản trị CSDL mạnh đang đƣợc đƣa ra thị trƣờng nhƣ

module (tập các hàm) giúp kết nối, truy xuất CSDL với trang web, tạo ra trang web
động.
Nhƣợc điểm: chỉ có thể dùng để viết các chƣơng trình, script nhỏ.
2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng
Module CGI (Common Gateway Interface): Module này gồm các hàm giúp
viết kịch bản Perl theo giao thức CGI. Các script này giúp lấy thông tin từ trình duyệt
khách gởi đến máy chủ, đƣa vào chƣơng trình xử lý và trả thông tin kết quả đến máy
khách.
Module DBI (Database Interface): là tập các hàm, biến và những qui ƣớc
cần thiết cho việc tƣơng tác với một CSDL nhất định thông qua Perl script, hoàn toàn
độc lập với hệ quản trị CSDL (Tim Bunce). Những tƣơng tác có thể nhập, nâng cấp,
xử lý, rút trích…dữ liệu vào hay ra khỏi CSDL.
Module DBD (Database Driver): là một module phụ thuộc loại hệ quản trị
CSDL và liên kết với module DBI để truy cập vào một loại hệ quản trị CSDL nhất
định. Nhƣ vậy tƣơng ứng với một hệ quản trị CSDL có một loại DBD. Ví dụ nhƣ hệ
quản trị MySQL có Database Driver là DBD::MySQL. 5

S
C
R
I
P
T
D
B
I

S
w
i
t
c
h
DBD
DBD
DBD
RDBMS
RDBMS
RDBMS 6

NLM
NCBI
NIH 7
2.3.1.2. Một số cơ sở dữ liệu trong NCBI
Nucleotide (GenBank): là CSDL về trình tự nucleotide.
Protein: là CSDL về trình tự amino acid.
Genome: trình tự toàn bộ genome của một số sinh vật.
Structure: hay còn có tên gọi là MMDB (Molecular Modeling Database)
chứa cấu trúc ba chiều của những đại phân tử bao gồm cả protein lẫn những chuỗi
nucleotide.
Ngoài ra, NCBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc
tạo thành từ sự kết hợp của hai hay nhiều CSDL trên, hay do liên kết đến các CSDL
khác.
2.3.1.3. Một số công cụ trong NCBI
– Công cụ khai thác dữ liệu
Tìm kiếm thông tin sinh học dựa trên từ khóa có dạng văn bản:
Entrez: chứa các phƣơng thức tìm kiếm nhƣ tìm kiếm dựa trên accession
number hay dựa theo tên sinh vật, tên gene, tên protein…
Tìm kiếm trình tự tƣơng đồng: có phần mềm điển hình nhƣ:
BLAST (Basic Local Alignment Search Tool). Thông tin hƣớng dẫn về
BLAST có ở trang BLAST Homepage.
Stand-alone BLAST: là phần mềm có thể tải về từ NCBI. Phần mềm này
thực hiện việc tìm kiếm các trình tự tƣơng đồng trên CSDL trình tự cục bộ.
Phân loại sinh vật:
Taxonomy Browser: công cụ thực hiện việc tìm kiếm trên CSDL Taxonomy.
Taxonomy BLAST: nhóm lại những kết quả có tỉ lệ tƣơng đồng khi thực hiện
BLAST, tùy thuộc vào sự phân loại của chúng trong CSDL Taxonomy.
TaxTable: tóm tắt kết quả sau khi thực hiện BLAST với CSDL Taxonomy và

đại phân tử sinh học nhƣ protein, DNA, RNA…
ArrayExpress: tích trữ nguồn dữ liệu về sự biểu hiện của gene dựa trên kỹ
thuật Microarray.
TrEMBL (Translate EMBL): là cơ sở dữ liệu về protein. Do lƣợng trình tự
này ngày càng nhiều và để quản lý tốt hơn, TrEMBL đã kết hợp với Swiss-Prot (CSDL
về trình tự protein của Thụy Sỹ), PIR (CSDL về protein của trƣờng đại học Y
Georgetown, Hoa Kỳ) tạo thành CSDL UniProt.
Ngoài ra, EBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc tạo
thành từ sự kết hợp của hai hay nhiều CSDL trên hay do liên kết đến CSDL khác

9 Cơ sở dữ liệu về
protein của Thụy
Sỹ đặt tại Geneva
Cơ sở dữ liệu về protein
của trƣờng đại học Y
Georgetown (Mỹ)
2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học
FASTA: Do Smith và Waterman tạo ra năm 1981, là chƣơng trình tìm kiếm
10
Một số CSDL trong ExPASy:
SWISS-PROT: là CSDL protein, đƣợc thành lập năm 1986. Nhƣng kể từ
năm 1987, SWISS-PROT liên kết với EBI.
SWISS-2DPAGE (2-dimensional polyacrylamide gel electrophoresis
database): chứa dữ liệu điện di hai chiều từ protein của ngƣời, chuột, E. coli…
PROSITE: tích trữ về các họ protein có cùng chức năng.
ENZYME (enzyme nomenclature): cung cấp thông tin về danh pháp của
enzyme.
SWISS-3DIMAGE: lƣu trữ hình ảnh chất lƣợng cao của các đại phân tử sinh
học đã biết cấu trúc không gian ba chiều.
2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan)
DDBJ là CSDL về trình tự DNA của Nhật Bản, chính thức đi vào hoạt động
năm 1986, đặt tại viện di truyền quốc gia (NIG). Đến năm 2001, trung tâm thông tin về
sinh học ở NIG đƣợc tổ chức lại với cái tên là CIB (Center Information Biology) kết
hợp với DDBJ, viết tắt CIB/DDBJ.
PDBj là CSDL của Nhật Bản, tích trữ dữ liệu về cấu trúc, chức năng protein.
DDBJ của Nhật Bản, EMBL của Châu Âu, NCBI của Hoa Kỳ là ba CSDL về trình
tự nucleotide lớn, mang tính chất toàn cầu và ba cơ sở dữ liệu này có sự hợp tác, trao
đổi qua lại dữ liệu. Từ đó càng làm cho dữ liệu về trình tự nucleotide trở nên phong
phú hơn. Các tổ chức này đều xây dựng công cụ tìm kiếm trong CSDL của họ. Với
NCBI là Entrez, EBI là SRS và CIB là getentry. Nhƣ vậy để có thể khai thác hiệu quả
các CSDL này thì việc đầu tiên cần thực hiện là nắm vững các hoạt động của công cụ
tìm kiếm “search engines” này.


Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB •Submissions
•Updates

Entrez
NCBI
N
N
I
I
H
Hgetentry
N


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status