1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
************
KHÓA LUẬN TỐT NGHIỆP K
K
H
H
A
A
I
IT
T
H
H
Á
Á
C
C
x
p
p
r
r
e
e
s
s
s
s
e
e
d
dS
S
e
e
q
q
u
u
e
e
n
n
c
H
Á
Á
T
TH
H
I
I
Ệ
Ệ
N
NM
M
I
I
C
C
R
R
O
O
S
S
A
ỤC
C
H
H
O
OC
C
Ô
Ô
N
N
G
GT
T
Á
Á
C
CP
S
S
Á
Á
N
N
H
HĐ
Đ
Ặ
Ặ
C
CĐ
Đ
I
I
Ể
Ể
M
M
O
N
N
G
GM
M
Ậ
Ậ
T
T Ngành học: CÔNG NGHỆ SINH HỌC
Niên khóa: 2002-2006
Sinh viên thực hiện: TRẦN NGỌC VIỆT Thành phố Hồ Chí Minh
Tháng 8/2006
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
************
ỮL
L
I
I
Ệ
Ệ
U
UE
E
S
S
T
T(
(
E
E
x
x
p
p
r
T
T
a
a
g
g
s
s
)
)N
N
H
H
Ằ
Ằ
M
MP
P
H
H
Á
Á
T
E
L
L
L
L
I
I
T
T
E
EP
P
H
H
Ụ
Ụ
C
CV
V
Ụ
ỤC
Â
N
NT
T
Í
Í
C
C
H
HV
V
À
ÀS
S
O
OS
S
Á
IT
T
R
R
U
U
Y
Y
Ề
Ề
N
NC
C
Ủ
Ủ
A
AO
O
N
N
G
Cảm ơn công lao nuôi dƣỡng, dạy dỗ của cha mẹ
Xin chân thành cảm tạ
Ban Giám hiệu Trƣờng Đại học Nông Lâm Thành Phố Hồ Chí Minh
Ban chủ nhiệm Bộ Môn Công nghệ Sinh Học cùng tất cả quý thầy cô đã
truyền đạt kiến thức cho tôi trong suốt quá trình học tại trƣờng.
Chân thành cảm ơn
TS. Bùi Minh Trí đã tận tình hƣớng dẫn, giúp đỡ tôi trong suốt thời gian thực
hiện đề tài tốt nghiệp.
Xin cảm ơn CN. Lƣu Phúc Lợi đã giúp đỡ, hỗ trợ tài liệu chuyên môn.
Cảm ơn các anh chị tại phòng Sinh Hóa đã tạo điều kiện tốt cho tôi khi tiến hành thực
hiện công việc tại Trung Tâm.
Xin cảm ơn bạn bè thân yêu của lớp DH02SH đã chia sẻ cùng tôi những vui buồn
trong thời gian học cũng nhƣ hết lòng hỗ trợ, giúp đỡ tôi trong thời gian thực hiện đề
tài.
Tp. Hồ Chí Minh tháng 08 năm 2006
Sinh viên thực hiện Trần Ngọc Việt
iv
TÓM TẮT
TRẦN NGỌC VIỆT, Đại Học Nông Lâm Thành phố Hồ Chí Minh. Tháng 8/2006.
MỤC LỤC
CHƢƠNG TRANG
Trang tựa
Lời cảm tạ ……………………………………………………………………………..iii
Tóm tắt …………………………………...………….………………………………..iv
Mục lục …………………………………………………………………………..…….v
Danh sách các chữ viết tắt............................................................................................viii
Danh sách các bảng .......................................................................................................ix
Danh sách các hình .........................................................................................................x
1. MỞ ĐẦU ....................................................................................................................1
1.1. Đặt vấn đề...........................................................................................................1
1.2. Mục đích và yêu cầu nghiên cứu........................................................................2
1.2.1. Mục đích nghiên cứu .................................................................................2
1.2.2. Yêu cầu nghiên cứu ...................................................................................2
1.3. Giới hạn .............................................................................................................2
2. TỔNG QUAN TÀI LIỆU ...........................................................................................3
2.1. Giới thiệu chung về ong mật .............................................................................3
2.1.1. Cấu tạo cơ thể của ong mật........................................................................3
2.1.1.1. Hình thái cơ thể ................................................................................3
2.1.1.2. Các cơ quan bên trong ......................................................................6
2.1.2. Tổ chức của đàn ong ..................................................................................6
2.1.3. Yêu cầu dinh dƣỡng của ong .....................................................................7
2.1.4. Các sản phẩm của ong ...............................................................................7
2.1.4.1. Mật ong .............................................................................................7
2.1.4.2. Phấn hoa .................................................................................................7
2.1.4.3. Sữa ong chúa ..........................................................................................7
2.1.4.4. Sáp ong ..................................................................................................8
2.2. Nguồn gốc EST (Expressed Sequence Tags) ....................................................8
3. PHƢƠNG TIỆN VÀ PHƢƠNG PHÁP NGHIÊN CỨU .........................................29
3.1. Thời gian và địa điểm tiến hành nghiên cứu ...................................................29
3.1.1. Thời gian nghiên cứu ...............................................................................29
3.1.2. Địa điểm nghiên cứu ...............................................................................29
3.2. Vật liệu và công cụ nghiên cứu .......................................................................29
3.2.1. Vật liệu nghiên cứu .................................................................................29
vii
3.2.2. Công cụ nghiên cứu .................................................................................29
3.3. Phƣơng pháp tiến hành nghiên cứu .................................................................30
3.3.1. Quy trình nghiên cứu tổng quát ...............................................................30
3.3.2. Phƣơng pháp nghiên cứu .........................................................................31
3.3.2.1. Sơ đồ các bƣớc tiến hành nghiên cứu .............................................31
3.3.2.2. Các bƣớc tiến hành nghiên cứu chi tiết ..........................................32
4. KẾT QUẢ VÀ THẢO LUẬN ..................................................................................42
4.1. Kết quả tìm kiếm và tải trình tự EST về máy tính cá nhân .............................42
4.1.1. Kết quả tìm kiếm EST .............................................................................42
4.1.2. Kết quả tải trình tự EST về máy tính cá nhân .........................................43
4.2. Kết quả tìm và phân loại microsatellite ...........................................................44
4.2.1. Kết quả tìm microsatellite qua xử lý của EST_TRIMMER ....................44
4.2.2 Kết quả xử lý qua MISA ..........................................................................45
4.3. Kết quả thiết kế primer ....................................................................................49
4.3.1. Kết quả thiết kế primer qua 6 Script Perl ................................................49
4.3.2. Kết quả so sánh và chọn lọc primer đƣợc thiết kế ...................................56
5. KẾT LUẬN VÀ ĐỀ NGHỊ ......................................................................................59
5.1. Kết luận ...........................................................................................................59
5.1.1. Sơ đồ phƣơng pháp thực hiện ..................................................................59
5.1.2. Kết quả đạt đƣợc .....................................................................................60
5.2. Đề nghị ............................................................................................................60
6. TÀI LIỆU THAM KHẢO ........................................................................................61
Bảng 2.1. Tên gọi một số marker DNA ..................................................................13
Bảng 4.1. Kết quả xử lý qua MISA ........................................................................47
Bảng 4.2. Thành phần của các dạng microsatellite .................................................47
Bảng 4.3. Tỷ lệ phần trăm các dạng microsatellite .................................................48
Bảng 4.4. Phần trăm các loại microsatellite chiếm tỷ lệ cao ..................................48
Bảng 4.5. Kết quả primer của dạng dinucleotide SSR ............................................54
Bảng 4.6. Kết quả primer của dạng trinucleotide SSR ...........................................55
Bảng 4.7. Kết quả primer của dạng tetranucleotide SSR .......................................56
Bảng 4.8. Kết quả primer sau cùng của dạng dinucleotide SSR ............................57
Bảng 4.9. Kết Quả primer sau cùng của dạng tri/tetra-nucleotide SSR ..................57
Bảng 4.10. Trình bày loại SSR và mã số truy cập của EST ...................................58
x
DANH SÁCH CÁC HÌNH
HÌNH TRANG
Hình 2.1. Hình thái các loài ong cho mật .......................................................................3
Hình 2.2. Thể hiện ba phần chính của ong .....................................................................4
Hình 2.3. Hình thái phần đầu của con ong .....................................................................4
Hình 2.4. Hình thái phần ngực của con ong ...................................................................5
Hình 2.5. Hình thái phần bụng của con ong ...................................................................5
Hình 2.6. Sơ đồ nguồn gốc của EST ..............................................................................9
Hình 2.7. Cách thức tạo nên EST .................................................................................10
Hình 2.8. Cơ chế bắt chéo lỗi trong giảm phân ............................................................11
Hình 2.9. Cơ chế trƣợt lỗi trong quá trình sao mã ........................................................12
Hình 3.1. Trình bày qui trình nghiên cứu tổng quát .....................................................30
Hình 3.2. Các bƣớc tiến hành nghiên cứu chính ..........................................................31
Hình 3.3. Giao diện trên trang NCBI với từ khóa honeybee ........................................32
Hình 3.4. Cú pháp thực thi của EST_TRIMMER ........................................................35
Hình 3.5. Cú pháp thực thi của MISA ..........................................................................36
nhiều loài khác nhau. Mỗi loài có điều kiện môi trƣờng phát triển khác nhau và hiệu
quả sản xuất cũng khác nhau. Sản phẩm đƣợc làm ra bởi ong mật nhƣ phấn hoa, mật
ong, sáp ong, sữa ong chúa, keo ong, nọc ong là các loại thực phẩm dƣợc liệu độc đáo
có giá trị kinh tế cao. Ngoài ra, ong mật còn có tác động hữu ích đến nhiều loài động
vật và đặc biệt là tác động rất cần thiết trên thực vật đó là thụ phấn hoa.
Sự đa dạng và giá trị di truyền học của ong mật cần phải có phƣơng pháp để
định danh chính xác từng loài và dƣới loài (thứ). Điều này rất cần thiết, nó có tác động
quyết định đến hiệu quả kinh tế trong nghề nuôi ong nói riêng và ý nghĩa về bảo vệ đa
dang sinh học nói chung. Công việc này sẽ phục vụ đắc lực trong việc tuyển chọn
đƣợc loài ong phù hợp nhất cho nghề nuôi ong ở từng vùng địa lý riêng (nhƣ nguồn
mật hoa, thời tiết…), đảm bảo bảo vệ “thuần khiết” đặc điểm di truyền ban đầu của
mỗi loài ong.
Hiện nay, marker microsatellite là một chọn lựa tốt trong việc phân tích sự đa
dạng di truyền, lập bản đồ di truyền, nhận biết giữa các loài và các cá thể trong một
loài. Dựa trên nguồn dữ liệu EST (Expressed Sequence Tags) chúng ta có thể tìm ra
đƣơc những vị trí microsatellite có ở trên các EST một cách nhanh chóng nhờ vào lĩnh
vực nghiên cứu gọi là tin sinh học (bioinformatics).
Việc ứng dụng bioinformatic sẽ làm cho công việc nghiên cứu trở nên dễ dàng
và chính xác hơn rất nhiều. Bioinformatic là một lĩnh vực khoa học sử dụng các công
nghệ của các ngành toán học ứng dụng, tin học, thống kê và khoa học máy tính để giải
quyết các vấn đề sinh học.
Trên cơ sở đó tôi tiến hành thực hiện đề tài:
“Khai thác dữ liệu EST (Expressed Sequence Tags) nhằm phát hiện
microsatellite phục vụ cho công tác so sánh và phân tích đặc điểm di truyền của
ong mật”
2
Đề tài đƣợc thực hiện dƣới sự hƣớng dẫn của TS. Bùi Minh Trí. Đối tƣợng
nghiên cứu là các loài ong cho mật.
Phần 2
TỔNG QUAN TÀI LIỆU
2.1. Giới thiệu chung về ong mật
Trong thế giới động vật, ong mật thuộc ngành chân đốt (Athropoda), lớp côn
trùng (Insecta), bộ cánh màng (Hymenoptera), họ ong mật (Apisdae), giống ong mật
(Apis). Ong mật xuất hiện cách đây khoảng 40 triệu năm đƣợc tìm thấy trong mẫu hóa
thạch vào thời kỳ Eocene (Mark L. Winston, 1987).
Trên thế giới có 7 loài ong cho mật, ở Việt Nam có 4 loài chính:
1. Apis mellifera: Ong Ý
2. Apis cerena: Ong ruồi
3. Apis dorsata: Ong khoái hay ong gác kèo
4. Apis florae: Ong muỗi
Trong đó hai loài Apis mellifera và Apis cerena có giá trị kinh tế cao, đang
đƣợc nuôi rộng rãi. Hai loài còn lại chỉ đƣợc khai thác tự nhiên.
2.1.1. Cấu tạo cơ thể của ong mật
2.1.1.1. Hình thái cơ thể Hình 2.1. Hình thái các loài ong cho mật
Ong có bộ vỏ bao ngoài đƣợc cấu tạo bởi chất chitin có vai trò nhƣ
khung xƣơng ngoài nâng đỡ các cơ quan bên trong và chống lại các nhân tố bất
lợi bên ngoài. Cơ thể ong gồm ba phần khớp động với nhau: đầu, ngực và bụng.
Trong quá trình phát triển cơ thể ong phải trải qua những lần lột xác.
4 Hình 2.2. Thể hiện 3 phần chính của ong
Hình 2.5. Hình thái phần bụng của con ong
Bụng ong có 6 đốt và nối với phần ngực qua đốt chuyển tiếp. Mỗi đốt gồm hai
nửa: nửa lƣng và nửa bụng, các đốt bụng nối với nhau bằng màng kitin mỏng và đàn
hồi (nhờ màng này ong có thể thay đổi thể tích bụng), hai bên mỗi đốt bụng có lỗ thở.
Ở phần bụng của 4 đốt bụng cuối cùng có cơ quan tiết sáp, cuối bụng có ngòi
đốt (ong đực không có ngòi đốt, ong chúa trƣởng thành thì ngòi đốt có tác dụng nhƣ
một máng đẻ trứng và là một vũ khi đánh nhau với các con ong chúa khác).
Giữa đốt bụng thứ 5 và thứ 6 của ong có tuyến Naxonop tiết ra mùi đặc trƣng
cho đàn ong (ở ong chúa tuyến này phát triển mạnh và tiết ra mùi đặc trƣng gọi là chất
chúa để điều khiển hoạt động bìng thƣờng của đàn ong).
6
2.1.1.2. Các cơ quan bên trong
Cơ quan tiêu hóa
Ong mật thuộc vào các côn trùng ding dƣỡng chuyên tính, cơ quan tiêu
hóa còn là nơi dự trữ tạm thời mật khi thu và chuyển về tổ.
Cơ quan hô hấp
Gồm hai lỗ thở, hệ thống khí quản phân nhiều nhánh, các túi khí và hệ
thống mao quản trao đổi khí với các tế bào, mô trong cơ thể.
Cơ quan tuần hoàn
Hệ thống tuần hoàn của ong là hệ thống mở, tim gồm 5 ngăn, hai bên
sƣờn của mỗi ngăn có các cửa để máu lƣu thông.
Cơ quan thần kinh
Cơ quan thần kinh của ong mật phát triển cao, bảo đảm mối liên hệ của
đàn ong với môi trƣờng xung quanh, điều khiển mọi hoạt động thống nhất trong
cơ thể ong. Cơ quan thần kinh của ong chia làm ba phần: thần kinh trung ƣơng,
thần kinh ngoại biên, thần kinh thực vật.
định rõ tỉ lệ về số lƣợng và chất lƣợng để đạt đƣợc mức dinh dƣỡng cao nhất.
2.1.4. Các sản phẩm của ong mật
2.1.4.1. Mật ong
Thành phần mật ong có trên 65% dạng đƣờng khử gồm glucose và
fructose, còn saccharose ít, chỉ có khoảng 5%. Ngoài ra trong quá trình luyện
mật hoa, con ong còn tiết ra một số acid hữu cơ có tác dụng làm cho đƣờng
trong mật ong không bị lên men.
2.1.4.2. Phấn hoa
Phấn hoa là sản phẩm giàu dinh dƣỡng đƣợc ong thu từ nhị hoa của các
loài hoa khác nhau để làm thức ăn cho chúng. Phấn hoa chứa 30 – 35% protein,
trong đó 10% là acid amin tự do, các enzyme, vitamin… (phấn hoa chứa 21
acid amin cần thiết cho cơ thể, trong đó có 10 acid amin không thay thế).
Dùng phấn hoa có tác dụng tốt cho cơ thể, tăng cƣờng sức khỏe vì phấn
hoa có nhiều chất dinh dƣỡng dễ hấp thụ…
2.1.4.3. Sữa ong chúa
Sữa ong chúa (tên gọi có nguồn gốc lịch sử) là nguồn dinh dƣỡng cao
cấp, là sản phẩm đặc biệt. Nó là nguồn thức ăn duy nhất để nuôi ong chúa và ấu
8
trùng của ong chúa do ong thợ non tiết ra. Sữa ong chúa có thành phần dinh
dƣỡng nhƣ sau: protein (18%), lipid (6,46%), các vitamin, chất khô (39,95%),
tro (0,83%).
Sữa ong chúa kích thích quá trình trao đổi lipid và protein giúp cơ thể
khỏe mạnh. Sữa ong chúa giàu hormon, vitamin E có tác dụng kích thích sinh lý,
tái tạo tế bào, chống sự già cỗi của các hệ thống tế bào. Sữa ong chúa dùng để
chữa các bệnh đƣờng tiêu hóa, gan, thận, nâng cao sức đề kháng với các bệnh
truyền nhiễm.
Sử dụng mRNA để tạo cDNA
cDNA là gì?
cDNA là một dạng của DNA đƣợc tạo ra trong các phòng thí nghiệm, sử
dụng một loại enzyme gọi là reverse transcriptase. Tạo cDNA đi ngƣợc với tiến
trình bình thƣờng của sự sao mã trong tế bào. Bởi vì, ngƣời sản xuất sử dụng
mRNA làm khuôn (template) chứ không phải DNA. Không giống nhƣ DNA
của bộ gen, cDNA chỉ chứa exon hay gen biểu hiện.
mRNA là một chìa khóa để tìm thấy những gen biểu hiện trong bộ gen.
Tuy nhiên, mRNA không bền vững ở bên ngoài tế bào. Do đó, các nhà khoa
học đã sử dụng một loại enzyme đặc biệt để biến đổi nó thành dạng DNA
(cDNA) bổ sung (complementary DNA). cDNA có cấu tạo bền vững hơn rất
nhiều so với mRNA. Vì đƣợc tạo ra từ mRNA, các intron đã đƣợc bị loại bỏ
nên cDNA chỉ đại diện cho những trình tự DNA biểu hiện.
Từ cDNA đến EST
Một cDNA đại diện cho một gen biểu hiện đƣợc phân lập, sau đó các
nhà khoa học có thể giải trình tự từ hai đầu của phân tử này thƣờng khoảng 100
đến vài trăm nucleotide (khoảng 500 nucleotide) để tạo ra hai loại EST. Đó có
thể là 5‟EST và 3‟EST.
10 Hình 2.7. Cách thức tạo nên EST
2.3. Microsatellite là gì?
Microsatellite là trình tự đơn lặp lại (Simple Sequence Repeats - SSR) từ 1 – 10
nucleotide. Chúng xuất hiện khắp trong các loài sinh vật bậc cao, mặc dù tần số xuất
hiện của SSR có sự biến đổi giữa các loài. SSR rất phong phú, nằm rải rác khắp nơi
trong bộ gen và cho thấy mức độ đa hình cao hơn so với các marker di truyền khác.
Những đặc điểm này, kết hợp lại làm cho SSR đƣợc xác định một cách dễ dàng, chúng
đƣợc sử dụng làm marker phân tử. Khả năng tự thừa kế của SSR trong những tính
Cơ chế đột biến hình thành microsatellite vẫn chƣa đƣợc hiểu biết một cách đầy
đủ. Tuy nhiên, di truyền học và các nghiên cứu khác cho rằng cơ chế xuất hiện và hình
thành microsatellite là do 2 quá trình sau:
Quá trình bắt chéo lỗi trong quá trình giảm phân ( unequal crossing- over
during meiosis)
.
Hình 2.8. Cơ chế bắt chéo lỗi trong giảm phân 12
Quá trình trƣợt lỗi trong sao mã (replication slippage)
Đây đƣợc coi là nguyên nhân chủ yếu và nó xảy ra trên mạch chậm (lagging
strand). Quá trình này liên quan đến quá trình trƣợt lỗi của enzyme polymerase trên
phân tử DNA mới tổng hợp. Sự trƣợt lỗi này tạo ra một chỗ phình nhất thời có thể bị
loại bỏ trong quá trình sửa lỗi hoặc là có thể kéo dài thêm ở mạch đối diện tạo thành
một đoạn lặp lại dài hơn.
Hình 2.9 . Cơ chế trƣợt lỗi trong quá trình sao mã
2.3.3. Ứng dụng của microsatellite
SSR đƣợc sử dụng để lập bản đồ di truyền. Chúng dễ dàng sử dụng và chứa
đựng thông tin cao có thể thay thế tốt cho RFLP trong kỹ thuật lập bản đồ di truyền ở
RAPD Random amplified polymorphic DNA
AP-PCR Arbitrary primer-PCR
DAF DNA amplification fingerprinting
AFLP Amplified fragment length polymorphism
ALP Amplicon length polymorphism
SSR Simple sequence repeat (microsatellite)
SSCP Single strand conformation polymorphism
RFLP Restriction fragment length polymorphism
14
STS Sequence-tagged sites
Chọn giống nhờ chỉ thị phân tử là một chiến lƣợc đƣợc thế giới ủng hộ từ năm
1995, là phƣơng pháp tác động mạnh đến hiệu quả chọn giống với các marker có kết
quả kỹ thuật cao trên cơ sở PCR để đánh giá kiểu gen của tính trạng mục tiêu. Sau khi
đánh giá kiểu gen chúng ta so sánh với đánh giá kiểu hình để tìm ra mức độ chính xác
của phƣơng pháp (Bùi Chí Bửu, 2002).
2.3.5. Vì sao chọn marker SSR?
Hiện nay marker SSR là một công cụ mạnh (powerful tool) đƣợc ứng dụng rộng
rải trong việc lập bản đồ bộ gen của các loài; phân tích đặc điểm di truyền của các loài,
dƣới loài và các cá thể trong một loài phục vụ có hiệu quả cho công tác chọn giống
trong chăn nuôi và trồng trọt; tìm hiểu về nguồn gốc và phân lập các gen gây bệnh (các
gen có liên quan đến bệnh Alzheimer, ung thƣ ruột kết và nhiều bệnh khác) từ đó
nghiên cứu ra phƣơng pháp điều trị.
Marker SSR có các ƣu điểm nổi bật sau
Di truyền đa allen và đồng trội
Có tính chỉ thị cao (non- abundant)
Có ở tận hai đầu của bộ gen (tính chỉ thị rộng)
Marker RAPD thì dễ dàng phát triển nhƣng giới hạn trong nhiều mục đích ứng
dụng (Haymer 1994). Microsatillite (Simple Sequence Repeats, SSRs) có độ đa hình