1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Thị Thảo
NGHIÊN CỨU SÀNG LỌC GENE MÃ HÓA ENZYME THAM GIA THỦY PHÂN
CELLULOSE TỪ KHU HỆ VI SINH VẬT TRONG RUỘT MỐI BẰNG KỸ THUẬT
METAGENOMICS
Chuyên ngành: Di truyền học
Mã số: 62420121
TÓM TẮT DỰ THẢO LUẬN ÁN TIẾN SĨ SINH HỌC
Hà Nội - 2014
2
liệu sinh học nhƣ cồn sinh học từ nguồn phế phẩm lignocellulose dồi dào thay thế cho
nguồn nhiên liệu hóa thạch đang trên đà cạn kiệt. Trong vòng 25 năm qua, sản lƣợng cồn
sinh học đã tăng trƣởng và đạt mức nhảy vọt kể từ năm 2000. Cồn sinh học có thể đƣợc
dùng nhƣ nguồn nhiên liệu độc lập cho các loại xe có động cơ chuyên biệt hoặc làm phụ gia
nhiên liệu cho loại xe có động cơ truyền thống với tỉ lệ lên đến 30%. Ở nƣớc ta, ƣớc tính hàng
năm, nguồn nguyên liệu lignocellulose từ phế phẩm nông nghiệp nhƣ rơm, rạ, lá mía và bã
cây mía bỏ phí lên đến 50 triệu tấn. Các biện pháp xử lý nguồn phế phẩm này chủ yếu là
đốt đã gây ra những ảnh hƣởng tiêu cực đến môi trƣờng sống và sức khoẻ con ngƣời. Việc
tận dụng đƣợc nguồn nguyên vật liệu lignocellulose phế phẩm này vào sản xuất cồn sinh
học sẽ đem đến nhiều lợi ích to lớn cho môi trƣờng cũng nhƣ cho nền kinh tế của nƣớc ta.
Việc sử dụng cellulase thay thế các hoá chất truyền thống nhƣ acid, kiềm và nhiệt
độ cao vào trong quá trình sản xuất của các ngành công nghiệp đã giải quyết đƣợc nhiều
vấn đề nhƣ hạn chế ô nhiễm môi trƣờng và bảo vệ đƣợc sức khoẻ ngƣời lao động cũng nhƣ
tăng hiệu quả sản xuất. Tuy nhiên, vấn đề đặt ra là cần thiết phải có đƣợc nguồn cellulase
hoạt động ở điều kiện pH và nhiệt độ thích hợp cho các quá trình sản xuất đó. Hơn nữa,
việc sản xuất cồn sinh học đang gặp một số khó khăn trong việc giảm chi phí sản xuất đặc
biệt là nguồn cellulase để phân cắt cellulose thành glucose hiệu quả. Do đó, vấn đề quan
trọng nhất là tìm ra đƣợc nguồn cellulase mới phù hợp với điều kiện sản xuất của các
ngành công nghiệp liên quan, phát triển các phức hợp cellulase hiệu quả và ổn định để
khắc phục khó khăn trong quá trình sản xuất.
Metagenomics là kỹ thuật cho phép thu nhận trực tiếp DNA đa hệ gene của toàn bộ
các vi sinh vật trong môi trƣờng sống nhất định. Chính vì lợi thế là thu nhận và phân tích
đƣợc tất cả hệ gene của vi sinh vật phong phú và đa dạng, đặc biết là 99% vi sinh vật
không nuôi cấy đƣợc mà Metagenomics trở thành công cụ giúp các nhà nghiên cứu khai
thác nguồn gene mới hiệu quả nhất. Thực tế đã chứng minh, sau 20 năm phát triển, đặc biệt
là khoảng 5 năm gần đây, khi kỹ thuật giải mã gene thế hệ mới đƣợc áp dụng,
Metagenomics đã đƣợc sử dụng rất hiệu quả để tìm hiểu sự đa dạng vi sinh vật cũng nhƣ
4
khai thác các gene mới từ nhiều môi trƣờng sống khác nhau nhƣ nƣớc, đất, các đƣờng tiêu
hóa, phế thải, …
tƣợng.
5
2. Xây dựng phƣơng pháp để tách chiết và tinh sạch DNA đa hệ gene.
3. Giải trình tự và xử lý trình tự DNA đa hệ gene.
4. Dự đoán gene theo hai khía cạnh là đa dạng vi sinh vật và đa dạng gene từ bộ
dữ liệu trình tự DNA đa hệ gene.
5. Chọn một trình tự gene để thiết mồi, phân lập, tách dòng và biểu hiện.
6. Xác định đặc điểm của sản phẩm biểu hiện gene phân lập đƣợc.
1. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học
1. Đã định loại đƣợc một loài mối bậc thấp Coptotermes gestroi thu thập ở sáu địa
điểm tại Hà Nội và Hƣng Yên bằng phƣơng pháp phân tử.
2. Đã đánh giá đƣợc sự đa dạng vi sinh vật và đa đạng gene cellulase của vi khuẩn
sống trong ruột mối C. gestroi.
Ý nghĩa thực tiễn
3. Đã phân lập, tách dòng và biểu hiện đƣợc một gene mã hoá endoglucanase. Đây
là enzyme đƣợc ứng dụng rộng rãi trong nhiều ngành công nghiệp.
4. Đóng góp mới của đề tài
1. Đây là nghiên cứu đầu tiên về sự đa dạng vi sinh vật ruột mối bậc thấp C.
gestroi cũng nhƣ đa dạng gen cellulase của chúng.
2. Trình tự của gen đã phân lập, tách dòng và biểu hiện đƣợc có độ sai khác so với
trình tự gene tƣơng ứng của các cơ sở dữ liệu.
5. Bố cục của luận án
Luận án gồm 151 trang bao gồm: phần mở đầu 3 trang; chƣơng 1: tổng quan tài liệu 37
trang; chƣơng 2: đối tƣợng và phƣơng pháp nghiên cứu 22 trang; chƣơng 3: kết quả và
thảo luận 58 trang; kết luận và kiến nghị 2 trang. Các công trình khoa học của tác giả 1
trang. Tài liệu tham khảo 19 trang. Trong luận án có 19 bảng và 62 hình.
Chƣơng 1. TỔNG QUAN TÀI LIỆU
1.1. GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE
Nêu đại cƣơng về đặc điểm cấu trúc chung của ba thành phần chính cấu tạo nên
2.2.1. Các phƣơng pháp vi sinh
2.2.2. Các phƣơng pháp sinh học phân tử
2.2.2.1. Tách chiết DNA tổng số của mối
2.2.2.2. Phƣơng pháp thu nhận vi sinh vật ruột mối và tách chiết DNA đa hệ gene của chúng
2.2.2.3. Tinh sạch DNA đa hệ gene bằng phƣơng pháp máng đơn (troughing)
2.2.2.4. Giải trình tự DNA đa hệ gene hiệu năng cao bằng máy giải trình tự thế hệ mới
HiSeq2000 của Illumina
7
2.2.2.5. Phƣơng pháp biến nạp bằng sốc nhiệt DNA plasmid vào vi khuẩn E. coli
2.2.2.6. Phƣơng pháp tách chiết DNA plasmid từ tế bào vi khuẩn E. coli
2.2.2.7. Phƣơng pháp cắt và ghép nối gene
2.2.2.8. Phƣơng pháp tinh sạch DNA từ gel agarose bằng QIAquick Gel Extraction kit
2.2.2.9. Kỹ thuật PCR
2.2.2.10. Thiết kế vector biểu hiện pET22b(+) mang gene egc
2.2.2.11. Điện di DNA trên gel agarose
2.2.2.12. Phƣơng pháp biểu hiện gene
2.2.2.13. Điện di biến tính protein trên gel polyacrylamide-SDS
2.2.2.14. Điện di protein trên gel polyacrylamide không SDS
2.2.3. Các phƣơng pháp hóa sinh protein
2.2.3.1. Phƣơng pháp tinh sạch protein bằng sắc kí ái lực his-tag
2.2.3.2. Định lƣợng protein bằng phƣơng pháp Bradford
2.2.3.3. Định lƣợng đƣờng khử bằng phƣơng pháp DNS
2.2.3.4. Phƣơng pháp xác định hoạt tính endoglucanase
2.2.3.5. Phƣơng pháp xác định hoạt tính β-glucosidase và β-xylosidase
2.2.3.6. Xác định ảnh hƣởng của nhiệt độ, pH, các ion kim loại và một số hóa chất lên hoạt
tính endoglucanase
2.2.3.7. Xác định độ bền của enzyme
2.2.4. Các phƣơng pháp tin sinh học và xử lý số liệu bằng phần mềm sinh học
2.2.4.1. Phân tích trình tự DNA đa hệ gene vi sinh vật ruột mối
dụng trực tiếp làm khuôn để khuếch đại đoạn gene ARN ribosome16S (rARN 16S) ti thể.
3.1.2.2. PCR khuếch đại đoạn DNA của gene ARN ribosome 16S ti thể mối
Hình 3.1. Điện di đồ hỗn hợp sản phẩm PCR khuếch đại các đoạn gene mã hóa rARN 16S ti
thể mối bằng hai cặp mồi LR-J-13007, LR-N-13398 và FST-F, FST-R từ khuôn DNA tổng số của
mối Coptotermes trên gel agarose 1,7%. ĐC M: Thang chuẩn 100 bp (Fermentas); các ĐC TH, VT,
BXT, VL, VQ và TL tương ứng là sản phẩm PCR từ khuôn là DNA hệ gene mối thu thập ở Thái
Hà, Võng Thị, Bùi Xương Trạch, Văn Lâm, Văn Quán và Tản Lĩnh.
Hai cặp mồi gồm cặp thứ nhất là LR-J-13007, LR-N-13398 và cặp thứ hai là FST-
F, FST-R đƣợc sử dụng để khuếch đại hai đoạn DNA của gene mã hóa RNA ribosome ti
thể mối. Kết quả là ở 54
o
C, cặp mồi thứ nhất đã khuếch đại hiệu quả đoạn DNA duy nhất
đậm nét, kích thƣớc lớn hơn 400 bp và bé hơn 500 bp từ DNA tổng số của cả sáu mẫu mối.
bp TH VT BXT VL M VQ TL
400
100
Sản phẩm PCR của cặp mồi thứ nhất
Sản phẩm PCR của cặp mồi thứ hai
1000
500
9
Tuy nhiên, chỉ ở 57
o
C, cặp mồi thứ hai mới khuếch đại đƣợc một băng DNA duy nhất kích
thƣớc lớn hơn 100 bp từ hai mẫu khuôn DNA tổng số thu thập ở Văn Quán và Tản Lĩnh,
còn bốn mẫu DNA còn lại không có đoạn DNA nào đƣợc khuếch đại (Hình 3.1). Tất cả
các đoạn DNA khuếch đại đƣợc đều đƣợc đọc và phân tích trình tự nucleotide.
Hình 3.2. Cây phát sinh loài giữa loài mối nghiên cứu và 21 loài khác được xây dựng dựa
trên các trình tự có mức độ giống cao nhất với đoạn DNA kích thước 430 bp được khuếch lại bằng
cặp mồi LR-J-13007 và LR-N-13398.
Bảng 3.1. Tỷ lệ giống nhau và khác nhau về trình tự nucleotide giữa các vùng 430 bp gene
rARN ti thể mối Coptotermes thu thập từ 6 địa điểm. Tỷ lệ giống nhau (%)
BXT
VQ
VL
TL
TH
VT
BXT
99,1
100
99,5
99,5
100
VQ
4
99,1
98,5
99,5
99,1
VL
0
CVongThiVN
CHungYenVN
CBuiXuongTrachVN
CgestEF092285SG
CgestDQ004478SG
CgestDQ004480SG
CgestDQ915942SG
CThaiHaVN
CVanQuanVN
CgestDQ004481MY
CgestDQ004487AU
CgestEF156760US
CgestAY558905AG
CgestAY558906TC
CcarvAY558909MY
CkalsAY683211MY
ClactAY558912AU
CformAB626146JP
CformU17778US
CformAB626145JP
CformAY558911CN
CformDQ007344US
CformGU075666CN
CinteAY558904TG
CcrasAY558901BZ
CvastAY558898US
97
65
31
54
Loài
Mã số gene
Địa điểm
Mức độ giống nhau (%)
BXT
VL
TL
TH
VQ
VT
C. formosanus
AB626145
Nhật Bản
93
93
93
94
93
93
C. formosanus
AY558911
Trung Quốc
94
94
93
94
94
94
C. formosanus
U17778
98
98
98
98
98
98
C. gestroi CgS3
DQ004478
Singapore
99
99
99
99
99
99
C. gestroi CgF2
EF156760
Hoa Kỳ
98
98
98
98
98
98
C. kalshoveni
AY683211
Malaysia
95
95
94
Để có đủ lƣợng DNA cần thiết cho việc nghiên cứu, chúng tôi đã tách chiết DNA đa
hệ gene vi sinh vật từ khoảng 1.000.000 ruột mối thợ Coptotermes gestroi của sáu mẫu
mối thu thập ở sáu địa điểm và thu đƣợc gần 11 µg DNA đa hệ gene sạch có nồng độ 114
ng/µl và OD
260/280
đạt 1,83. Trong đó, 8,5 µg DNA đa hệ gene đƣợc đọc trình tự.
M 1 kb
10
DNA đa hệ gen
Hình 3.3. Điện di đồ DNA đa hệ gene của hệ vi
sinh vật ruột mối Coptotermes gestroi trên gel agarose
0,8%. ĐC M: Thang chuẩn 1 kb (Fermentas); ĐC 1:
DNA đa hệ gene được tinh chế bằng phương pháp
Máng đơn.
12
3.3. ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GENE VI SINH VẬT RUỘT MỐI Coptotermes
3.3.1. Tập hợp trình tự và xác định gene
Trình tự DNA đa hệ gene vi sinh vật ruột mối C. gestroi đƣợc đọc bằng máy giải trình tự
HiSeq 2000 của Illumina. Dữ liệu gồm các read tốt có tổng kích thƣớc là 5,4 Gb. Những read
tốt này đƣợc sử dụng để tập hợp thành các contig có kích thƣớc dài hơn bằng phần mềm
SOAPdenovo. Với k = 41, phần mềm đã lắp ráp tất cả các read thành các contig tối ƣu nhất
gồm số lƣợng contig nhiều nhất 79.262 contig có tổng chiều dài dài nhất khoảng 90,1 Mb,
kích thƣớc contig dài nhất là 183.853 bp và kích thƣớc contig ngắn nhất là 500 bp. Từ
79.262 contig, phần mềm MetaGeneAnnotator đã dự đoán đƣợc 125.431 ORF.
3.3.2. Đa dạng vi sinh vật ruột mối C. gestroi
Trên cơ sở bộ dữ liệu trình tự DNA đa hệ gene, mức độ đa dạng vi sinh vật ruột
mối C. gestroi đƣợc đánh giá dựa theo hai cách:
Thứ nhất, các read chất lƣợng cao đƣợc so sánh với các trình tự của CSDL. Trong số
đó, 34,07% các read giống với gene vi khuẩn, 0,032% giống với gene của nấm, 3,79% giống
với gene vi sinh vật đƣờng ruột ngƣời và 0,189% giống với trình tự của RDP. Tổng số read
80
Vi khuẩn cổ
4
10
15
21
47
61
533
0,42
Eukaryota
20
14
25
33
43
24
731
0,58
Vi rút
-
-
1
11
13
7
249
0,2
Không dự
đoán được
Tỷ lệ có mặt (%)
Firmicutes
4
8
40
126
429
22,48
Proteobacteria
6
41
84
260
490
17,84
Spirochaetes
1
1
3
8
34
17,4
Bacteroidetes
4
5
13
67
159
11,6
Synergistetes
Xét bậc phân loại chi, Treponema là chi thuộc bộ Spirochaetales chiếm ƣu thế nhất
(chiếm đến 91,2% bộ, 15% tổng số vi khuẩn xác định đƣợc). Chi chiếm ƣu thế thứ hai là
Lactococcus (thuộc bộ Lactobacillales) chiếm 7,8%, tiếp đến là Pseudomonas (thuộc bộ
Pseudomonades) chiếm 4,6% tổng số vi khuẩn có mặt trong mẫu ruột mối thu thập đƣợc.
22.48
17.84
17.4
11.6
4.27
1.14
0.48
0
5
10
15
20
25
Tỷ lệ (%)
Ngành vi khuẩn
14
Ngoài ra còn có năm chi cũng chiếm ƣu thế là Pseudomonas (5823 ORF), Enterobacter
(3412 ORF), Dysgonomonas (2984 ORF), Clostridium (2968 ORF) và Bacteroides (2414
ORF). Những trình tự của tám chi ƣu thế nhất này chiếm đến 51,36% so với tổng tất cả các
chi dự đoán đƣợc. Trong đó, Clostridium và Bacteroides là hai chi có rất nhiều loài phổ
biến có khả năng phân hủy cellulose. Trong dữ liệu cũng chỉ ra nhiều loài thuộc hai bộ có
khả năng phân huỷ cellulose nhƣ C. acetobutylicum (32 ORF), C. cellulolyticum (40 ORF),
C. cellulovorans (46 ORF), C. papyrosolvens (53 ORF), B.cellulosilyticus (156 ORF). Hình 3.5. Mười hai bộ vi khuẩn chiếm ưu thế nhất trong ruột mối Coptotermes gestroi. ORF
5000
10000
15000
20000
25000
Số lượng ORF
Bộ vi khuẩn
15
3.4.2. Gene mã hóa enzyme phân hủy cellulose
Toàn bộ 316 ORF đƣợc chú thích (dựa vào CSDL KEGG) thuộc 11 họ GH khác
nhau liên quan trực tiếp đến sự thủy phân cellulose thể hiện tám chức năng 6-phospho-β-
glucosidase, licheninase, glucan endo-1,3-β-D-glucosidase, endoglucanase, cellulose 1,4-
β-cellobiosidase, glucan 1,3- β-glucosidase và cellobiose phosphorylase (Bảng 3.5).
Bảng 3.5. Các ORF mã hóa cellulase của vi sinh vật sống trong ruột C. gestroi.
STT
Mã EC
Enzyme
ORF hoàn
thiện
ORF thiếu
đầu 5’
ORF thiếu
đầu 3’
ORRF thiếu
cả 2 đầu
Tổng số
1
3.2.1.86
6-phospho-β-
3
4
5
3.2.1.4
endoglucanase
5
8
6
12
31
6
3.2.1.58
glucan 1,3-β-
glucosidase
2
1
3
7
3.2.1.39
glucan endo-1,3-β-D-
glucosidase
1 1
8
3.2.1.73
licheninase
3D và chức năng endoglucanase của trình tự amino acid của ORF GL0130684. Với những
đặc điểm đã phân tích cho thấy ORF GL0130684 đƣợc dự đoán đúng chức năng
endoglucanase với tỷ lệ cao, do đó ORF GL0130684 đƣợc lựa chọn để phân lập, tách dòng
và biểu hiện. Chúng tôi kí hiệu ORF GL0130684 là gen egc.
Hình 3.6. Phân tích cây phát sinh loài giữa EGC và các endogucanase dựa trên sự tương
đồng về trịnh tự amino acid. 0,05 là chỉ số thể hiện sự khác nhau giữa 2 nhóm là 5 nucleotide/100
amino acid; các con số trên các nhánh là chỉ số Bootstrap. Tên các loài trên cây gồm: tên loài và
mã số gene.
3.5. TÁCH DÒNG GENE egc
3.5.1. Trình tự ORF GL0130684
Gene egc chúng tôi lựa chọn có chiều dài 1107 bp. Phân tích đặc điểm của trình tự
amino acid bằng chƣơng trình Expasy trực tuyến cho thấy, trình tự amino acid của gene egc
chứa một đoạn tín hiệu tiết dài 22 amino acid (từ amino acid đầu tiên cho đến amino acid thứ
22), tƣơng ứng với độ dài trình tự nucleotide là 66 bp (từ đầu gene cho đến bp thứ 66).
3.5.2. Khuếch đại gene egc
Để khuếch đại đƣợc gene egc từ khuôn DNA đa hệ gene vi sinh vật sống trong ruột
mối với xác suất cao nhất, hai mồi xuôi GL0130684f
1
, GL0130684f
2
và một mồi ngƣợc
GL0130684r đã đƣợc sử dụng. Trong đó, mồi xuôi GL0130684f
1
khuếch đại gene egc từ
đầu gen (cả trình tự mã hoá tín hiệu tiết) và mồi xuôi GL0130684f
2
khuếch đại gene egc từ
vị trí ngay sau trình tự mã hoá tín hiệu tiết (không mang trình tự mã hoá tín hiệu tiết).
Escherichia-coli-endoglucanase-(WP001592871)
lƣợng ít (băng DNA không rõ ràng), do đó, để thuận tiện cho việc tách dòng, sản phẩm
khuếch đại có đoạn DNA mong muốn đƣợc sử dụng làm khuôn để khuếch đại đoạn DNA
đó lên với số lƣợng lớn hơn. Kết quả đúng nhƣ dƣ đoán, lƣợng DNA mong muốn đƣợc
khuếch đại lên với số lƣợng lớn hơn (Hình 3.10). Đoạn DNA đƣợc thu hồi bằng bộ kit tinh
chế DNA QIAQuick gel extraction để ghép nối vào vector tách dòng.
Hình 3.7. Điện di đồ sản phẩm khuếch đại gene egc trên gel agarose 0,8%. ĐC (-): đối
chứng âm; ĐC 1: sản phẩm PCR lần thứ nhất từ khuôn DNA đa hệ gene vi sinh vật trong ruột mối;
ĐC 2: sản phẩm PCR lần thứ hai từ khuôn là sản phẩm PCR lần thứ nhất; ĐC M; thang chuẩn
DNA 1 kb (Fermentas).
3.5.3. Ghép nối sản phẩm khuếch đại gene egc vào vector tách dòng pJET1.2 blunt
Trong nghiên cứu này, vector pJET1.2/blunt đƣợc sử dụng để tách dòng gene egc.
Tỷ lệ sản phẩm PCR và vector pJET1 trong phản ứng ghép nối gene là 3:1. Hỗn hợp
phản ứng đƣợc ủ ở nhiệt độ thích hợp. Sản phẩm của phản ứng ghép nối sẽ đƣợc biến
nạp vào tế bào E. coli DH10b bằng phƣơng pháp sốc nhiệt để chọn dòng mang plasmid
mong muốn.
3.5.4. Biến nạp sản phẩm ghép nối vào tế bào E. coli DH10b
Plasmid tái tổ hợp pJET-egc đƣợc biến nạp vào tế bào vi khuẩn E. coli DH10b
bằng phƣơng pháp sốc nhiệt.
Các dòng tế bào biến nạp đƣợc nuôi cấy trên môi trƣờng LBA ở 37
o
C và lắc qua
đêm để tế bào sinh trƣởng và tổng hợp số lƣợng lớn. Những khuẩn lạc mọc trên đĩa môi
trƣờng LBA chính là các dòng tế bào E. coli DH10b mang plasmid tái tổ hợp pJET-egc.
Bốn dòng khuẩn lạc của sản phẩm biến nạp đƣợc lựa chọn tách chiết DNA plasmid đều chứa
kb 1 M (-) M (-) 2
10
1,0
Sản phẩm PCR
1,5
, do đó, trình tự tín hiệu tiết cần phải loại bỏ khỏi gene wegc. Để
loại bỏ trình tự tín hiệu tiết này khỏi gene wegc, chúng tôi sử dụng cặp mồi GL0130684f
2
M HindIII XbaI XhoI SalI BglII EcoRV kb
2,5
4,5
1
Sản phẩm
cắt
Sản phẩm
cắt
pJETwegc
4,2 Kb
Bla (Ap
R
)
P
lacUV5
Eco47
R
Rep(pMB1)
wegc
SalI
511
EcoRV
858
2
và GL0130684r đã khuếch đại hiệu quả gene egc không mang tín hiệu
tiết có kích thƣớc bé hơn wegc từ khuôn pJET-wegc (Hình 3.9). Gene egc này sẽ đƣợc tinh
chế bằng bộ kit QIAQuick gel và ghép nối vào vector biểu hiện pET22b(+).
3.5.8. Thiết kế vector biểu hiện gene egc
3.5.8.1. Ghép nối gene egc vào vector biểu hiện
Trong nghiên cứu này, vector pET22b(+) đƣợc sử dụng để biểu hiện gene egc.
pET22b(+) là vector phù hợp cho biểu hiện protein tái tổ hợp trong vật chủ E. coli. Cả
gene egc và vector pET22b(+) đều đƣợc xử lý bằng cặp enzyme hạn chế XhoI và NcoI.
Sản phẩm cắt là gene egc kích thƣớc 1041 bp và pET22b(+) dạng thẳng kích thƣớc 5431
bp đều có hai đầu dính tƣơng ứng giống nhau. Đặc điểm này giúp cho quá trình ghép nối
chúng với nhau hiệu quả cao. Sản phẩm ghép nối pET22-egc sẽ đƣợc biến nạp vào tế bào
E.coli DH10B bằng sốc nhiệt để chọn dòng mong muốn.
3.5.8.2. Cắt kiểm tra plasmid tái tổ hợp pET22-egc
Plasmid tái tổ hợp pET22-egc chỉ có một trình tự cắt duy nhất của XhoI và của
NcoI ở hai đầu của gene egc. Khi sử dụng cặp enzyme này để cắt kiểm tra pET22-egc sẽ
tạo ra hai đoạn DNA, đoạn thứ nhất chính là gene egc kích thƣớc 1041 bp và đoạn thứ
hai chính là vector pET22b(+) kích thƣớc 5431 bp. Kết quả cắt kiểm tra bốn dòng
plasmid đều tạo ra hai đoạn DNA có kích đúng bằng kích thƣớc của gene egc và
pET22b(+) (Hình 3.10). Nhƣ vậy, gene egc đã đƣợc ghép nối vào vector biểu hiện
Kb 1 2 M
10
egc
wegc
1,5
1,0
trong tế bào mang pET22-egc; ĐC KT: protein ở dạng tan biểu hiện trong tế bào mang pET22-egc;
ĐC M: thang chuẩn protein unstained (Thermo scientific).
Kết quả cho thấy gene egc đã đƣợc tổng hợp thành protein EGC có kích thƣớc bé
hơn 40 kda (Hình 3.11) tƣơng đƣơng với kích thƣớc tính toán lý thuyết ở cả ba dòng tế
bào, đồng thời, ở dòng đối chứng âm không có băng protein này. Nhƣ vậy, gene egc trong
vector pET22b(+) đã đƣợc biểu hiện thành protein EGC trong tế bào E. coli BL21(DE3).
M (-) 1 2 3 kda
116
14,4
45
EGC
35
M TS T KT kda
116
14,4
45
EGC
35
kb 1 2 3 M 4
10
egc
pET22b(+
)
6,0
5,0
1,0
10
Hình 3.10. sản phẩm cắt các dòng
pET22-egc bằng cặp enzyme hạn chế XhoI và
C đến OD
600
đạt 0,6-0,8 thì cảm ứng IPTG đến nồng độ cuối
cùng là 0,5 mM trong bốn tiếng ở bốn nhiệt độ là 20
o
C, 25
o
C, 30
o
C và 37
o
C. Ở 20
o
C và
25
o
C, protein đích đƣợc tạo thành có cả dạng tan và dạng không tan, trong đó lƣợng
protein dạng tan ở 20
o
C khá nhiều và nhiều hơn ở 25
o
C (Hình 3.12). Ở nhiệt độ 30
o
C và
37
o
C, protein tạo thành đều ở dạng không tan. Nhƣ vậy, 20
o
C là nhiệt độ đƣợc lựa chọn để
biểu hiện gene egc thành protein dùng cho các thí nghiệm tiếp theo.
C
116
45
35
22
Hình 3.13. Điện di đồ protein EGC biểu hiện ở 20
o
C trong tế bào E. coli BL21(DE3) cảm ứng
10 nồng độ IPTG khác nhau trên gel polyacrylamide 12,6% có SDS. A: protein tổng số. B: protein
dạng tan. Các ĐC từ 0,0 – 2 tương ứng là protein biểu hiện khi tế bào được cảm ứng nồng độ
IPTG từ 0,0-2 mM; ĐC M: thang chuẩn protein unstain (Thermo scientific).
3.6.4. Điện di protein trên gel polyacrylamide và kiểm tra hoạt tính endoglucanase
của EGC A. Nhuộm comassie B. Ép gel và kiểm tra hoạt tính
Hình 3.14. Điện di đồ protein EGC biểu hiện ở 20
o
C trong tế bào E. coli BL21(DE3) trên gel
polyacrylamide 9% không có SDS. (A). Gel nhuộm bằng thuốc nhuộm comassie. (B). Gel được ép
trên môi trường cơ chất 0,1% CMC và kiểm tra hoạt tính. ĐC (-): đối chứng âm; ĐC EGC: protein
tổng số, biểu hiện ở 20
o
C trong tế bào mang pET22-egc; ĐC M: thang chuẩn protein pageruler
prestained (Fermentas).
Để kiểm tra hoạt tính của endoglucanase của protein EGC, chúng tôi đã tiến hành
điện di protein EGC trên gel polyacrylamide không biến tính và ép gel mang protein trên Hình 3.15. Điện di đồ kiểm tra sản phẩm tinh chế enzyme EGC bằng cột sắc kí ái lực His-
tag trên gel polyacrylamide 12,6% có SDS. ĐC 1: protein tổng số biểu hiện từ tế bào mang gene
egc; ĐC 2: protein đi qua cột khi đưa mẫu lên giá thể; ĐC 3: protein bị đẩy ra khỏi giá thể bằng
đệm rửa; các ĐC F
1-8
: 8 phân đoạn thu protein EGC bám trên giá thể cột sắc kí ái lực His-tag; ĐC
M: thang chuẩn protein unstained (Thermo Scientific).
Kết quả này thể hiện ở Hình 3.16 cho thấy protein thu đƣợc ở 8 phân đoạn đều có
kích thƣớc bằng nhau và đúng bằng kích thƣớc của protein EGC. Trong đó, protein đƣợc
tập trung chủ yếu ở phân đoạn 5 và 6, đặc biệt là phân đoạn 5. .
3.6.6. Hoạ tính riêng của EGC
Bằng phƣơng pháp định lƣợng protein Bradford, khối lƣợng protein EGC/ml đƣợc
xác định. Qua đó, hoạt tính riêng của EGC ở mỗi mg protein cũng đƣợc xác định. Ở điều
kiện 37
o
C và pH 7 hoạt tính của EGC là 1,055 U/mg.
3.6.7. Ảnh hƣởng của nhiệt độ đến hoạt tính endoglucanase của EGC Hình 3.16. Ảnh hưởng của nhiệt độ đến hoạt tính của endoglucanase của EGC.
72.90
82.78
100.00
90.46
69.33
57.31
35
24
Dải nhiệt độ từ 30 đến 55
o
C đƣợc lựa chọn. Hoạt tính endoglucanase tăng dần từ 30
đến 40
o
C, nhƣng giảm dần khi nhiệt độ tăng từ 40 đến 45
o
C và giảm mạnh ở nhiệt độ 55
o
C
(Hình 3.16). Nhƣ vậy, nhiệt độ thích hợp nhất cho hoạt động của EGC là 40
o
C.
3.6.8. Ảnh hƣởng của pH đến hoạt tính của EGC
Trong nghiên cứu này, chúng tối đã lựa chọn dải pH gồm 12 giá trị khác nhau từ
2,5 đến 8,0 để tìm điều kiện pH tối ƣu cho EGC hoạt động. Kết quả cho thấy enzyme có
hoạt tính cao nhất ở pH 5,5 đến 6,0. Ở pH từ 2,5 đến 4,5, hoạt tính của EGC rất thấp và
không ổn định. Ở pH từ 6,5 đến 8,0, mặc dù hoạt tính của EGC cao hơn và ổn định hơn so
với khoảng pH 2,5 đến 4,5 nhƣng hoạt tính giảm dần theo sự tăng dần của pH (Hình 3.17). Hình 3.17. Ảnh hưởng của pH đến hoạt tính của EGC ở 40
o
C.
3.6.9. Ảnh hƣởng của một số ion kim loại và hoá chất lên hoạt tính của EGC
Chín ion kim loại (K
+
, Mn
ức chế hoạt tính của EGC, đặc biệt Mn
2+
và Fe
3+
làm hoạt tính giảm xuống còn 21%
và 40%, còn Cu
2+
và Ni
2+
ảnh hƣởng không đáng kể đến hoạt tính của EGC, hoạt tính EGC
vẫn đạt 94 và 95%. Tuy nhiên, ion K
+
, Zn
2+
và Co
2+
lại làm tăng hoạt tính EGC, đặc biệt,
Co
2+
làm tăng hoạt tính lên đến 257%.
34.5
42.0
39.4
34.9
35.4
68.0
100.0
97.0
80.6
40
56
64
65
84
94
95
96
100
100
107
109
109
111
257
0
50
100
150
200
250
300
Hoat tính EGC (%)
Nhân tố
y = 7.072x + 0.438
R² = 0.990
0.0
0.5
1.0
1.5