VIỆN CÔNG NGHỆ SINH HỌC BÁO CÁO TỔNG KẾT ĐỀ TÀI
XÂY DỰNG NGÂN HÀNG DỮ LIỆU HỆ PROTEIN
HUYẾT THANH NGƯỜI VIỆT NAM ĐỂ ĐỐI PHÓ CHẨN ĐOÁN
BỆNH ĐÁI THÁO ĐƯỜNG TYPE 2 VÀ UNG THƯ CNĐT: PHAN VĂN CHI
8315
gian vừa qua của các cán bộ Viện Công nghệ sinh họ
c, Viện Khoa học và Công nghệ Việt
Nam trong nghiên cứu hệ protein huyết thanh người Việt Nam bằng các kĩ thuật proteomics
có thể được coi là tiền đề cho các nghiên cứu tiếp theo về mối quan hệ giữa các marker
protein liên kết với một số bệnh lý trong chẩn đoán lâm sàng. Đó cũng chính là mục đích
của các nghiên cứu về hệ protein người nói chung và hệ protein huyết thanh người nói riêng,
là tìm hiểu bức tranh tổng thể của các protein được biể
u hiện, có thêm hiểu biết về các biến
đổi của hệ protein trong các trạng thái bệnh lý và khả năng khai thác, sử dụng những thay
đổi này như các công cụ chẩn đoán hoặc điều trị các bệnh cho con người. Trên cơ sở những
trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự án “Phòng thí
nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Vi
ện KH&CN Việt
Nam và những kết quả nghiên cứu bước đầu về xác lập các phương pháp phân tích
protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời gian qua,
chúng tôi đã được phê duyệt đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh
người Việt Nam để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai
đoạn 2008-2010 với mục đích nghiên cứu có hệ thống hệ protein huyết thanh người Việ
t
Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2, leukemia, tìm những protein
có biến đổi đặc trưng cho các trạng thái bệnh có thể phát triển thành các chỉ thị chẩn đoán
bệnh. 2
Mục tiêu của đề tài
9 Phân tích, xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam bình
thường và một số trạng thái bệnh lý (đái tháo đường type 2, leukemia, ) bằng các
kỹ thuật proteomics và bioinformatics;
Tại sao phải nghiên cứu hệ protein (proteome)?
Thách thức chính hiện nay đối với những nhà sinh vật học là sử dụng sự phong phú về
thông tin di truyền sẵn có từ chương trình xác định trình tự gen không phải chỉ để giải mã
trình tự các acid amin của những protein được mã hóa mà còn là xác định những chức năng
của chúng. Có rất nhiều nhân tố có ảnh hưởng đến gen, sự biểu hiện của protein và cả trực
tiếp đến protein. Vì thông tin giữa gen và protein là hai chiều, kiểu hình (phenotype) của t
ế
bào bị ảnh hưởng bởi những tương tác giữa các quá trình chuyển hoá được điều chỉnh một
cách thống nhất bên trong tế bào. Protein là đầu ra về chức năng của tế bào và do đó có thể
cho biết những thông tin thích đáng nhất, đặc biệt khi giải thích về sự biểu hiện của chúng
có tính đến động học trong ngữ cảnh của các quá trình hóa sinh đặc biệt. Sự biểu hiện hoặ
c
chức năng của protein được điều hoà ở tại nhiều thời điểm, từ phiên mã đến dịch mã và sau
dịch mã. Các quá trình này, nói chung đều không thể dự đoán được từ kết quả phân tích
trình tự gen. Sau dịch mã, đa phần các phân tử protein lại bị biến đổi hoá học bởi các tương
tác protein-protein hay các phản ứng với các nhóm carbohydrate, phosphate Chính những
biến đổi này (post-translational modifications, PTMs) đóng vai trò chủ yếu trong kích hoạt
chức n
ăng của nhiều protein chứ không phải được mã hoá trực tiếp từ gen. Kết quả là từ một
gen ban đầu ta có thể tìm thấy sự đa dạng về biểu hiện, cấu trúc và chức năng của rất nhiều
loại protein khác nhau. Ở các cơ thể khác nhau, mức độ đa dạng này cũng khác nhau.
Những nghiên cứu sơ bộ cho thấy, từ một gen có thể phát sinh từ một tới hai protein trong
vi khuẩ
n, ba trong nấm men, và tới hơn sáu ở người (Wilkins MR et al, 1996; Banks RE et
al, 2000; Tyers M and Mann M, 2003). Trên cơ sở số gen đã phát hiện và các khả năng biến
đổi sau dịch mã, người ta cũng đã ước tính trong cơ thể người có tới một triệu protein cần
được nghiên cứu (Banks RE et al, 2000; Jensen ON, 2004). Từ sự phân tích trên ta có thể
thấy, mặc dù proteome là bổ trợ của genome, đây vẫn là hai khái niệm khác nhau cả về
không gian và thời gian. Khi trình tự của gen không thể cho biế
t các thông tin về các biến
et al,
2005).
Lượng thông tin phong phú do các nghiên cứu về proteome đem lại hoàn toàn bổ trợ cho
những thông tin di truyền từ những nghiên cứu về genome. Proteomics sẽ là cơ sở cho sự
phát triển của genomics chức năng. Sự phối hợp giữa genomics, proteomics và
bioinformatics sẽ đóng vai trò chủ đạo trong những nghiên cứu về sinh-y học, là nền tảng
cho sự phát triển các sản phẩm chẩn đoán và chữa bệnh trong tương lai. Chỉ ngoại trừ
một
số bệnh di truyền, mà gen đóng vai trò quan trọng trong chẩn đoán, phần lớn các bệnh mãn
tính như ung thư, tim mạch, đái tháo đường đều liên quan đến mức độ biểu hiện, hoạt
động và tương tác giữa các protein (Kristine AP et al, 2009). Như vậy, dấu ấn sinh học
(biomarker) hay còn được gọi là “chữ ký” (signature) trong các trường hợp này chính là
những chỉ thị protein, những phân tử không chỉ mang bí ẩn về các quá trình bệnh lý, mà còn
có thể mang tính đặ
c thù, liên quan tới nhiều yếu tố, bao gồm cả vấn đề chủng tộc và sinh
thái. Việc truy tìm các chữ ký sinh học này sẽ giúp đạt được những kết quả có tầm ứng dụng
hữu hiệu và lớn lao trong y học. Nghiên cứu biomarkers sẽ giúp tạo được những mô hình
phân tử về bệnh lý có khả năng khảo sát được bằng những thí nghiệm cụ thể, qua đó có thể
xác định được vai trò của gen và s
ản phẩm của nó cho chẩn đoán và trị liệu. Theo xu hướng
phát triển của các bộ môn Genomics, Proteomics và Bioinformatics, hiện đã có một mạng
lưới liên kết các phòng thí nghiệm nhằm tiến đến tạo dựng một kho dữ liệu (consortium) các
biomarker cho các bệnh lý và các đề tài sinh học khác
( />).
Trên cơ sở đánh giá tình hình nghiên cứu, phân tích những công trình nghiên cứu có liên
quan có thể thấy, proteomics thật sự đã làm thay đổi rất nhiều trong sinh học và các ngành
liên quan. Nhờ có các khái niệm mớ
i về proteomics, sự sống của các phiên bản genome tĩnh
lặng đã thật sự trở thành những proteome năng động. Việc nghiên cứu proteome-tập hợp các
protein được biểu hiện bổ trợ của hệ gen và cũng là của một mô hay một kiểu tế bào, sẽ giúp
Sự hấp dẫn của huyết thanh đối với việc chẩn đoán bệnh được quyết định bởi hai đặc
trưng: (i) mẫu có thể lấy dễ dàng và an toàn, (ii) mẫu không chỉ phản ánh toàn diện
phenotype người, mà còn cho biết trạng thái của cơ thể ở tại một thời điểm đặc biệt nào. Có
thể phân các protein trong huyết thanh thành các nhóm: (1) Các protein được tiết ra từ các
mô. Đó là các protein phần lớn đượ
c tiết ra từ gan, ruột và có khối lượng phân tử lớn hơn 45
kDa, lớn hơn kích thước các phân tử có thể lọc qua thận. Chính vì vậy, chúng có thể kéo dài
thời gian lưu hành trong huyết thanh; (2) Các globulin miễn dịch. Đó là các kháng thể hoạt
động chủ yếu trong huyết tương, đại diện cho một lớp protein phức tạp nhất. Đã có những
ước tính cho rằng phải có tới hàng triệu trình tự của các kháng thể khác nhau lưu hành trong
h
ệ tuần hoàn của một người trưởng thành (Anderson NL, & Anderson NG, 2002); (3) Liên
kết thụ cảm “khoảng cách xa”. Trong nhóm protein này gồm các peptide ”cổ điển” và
những protein hormone (ví dụ như insulin, erythropoietin ; (4) Liên kết thụ cảm “địa phư-
ơng”. Loại này bao gồm các cytokine và những tác nhân điều hòa ở khoảng cách ngắn. Đây
thường là các peptide có trọng lượng phân tử nhỏ, dễ dàng bị lọc qua thận. Bởi vậy, chúng
chỉ lưu hành trong thời gian ngắ
n ở huyết tương và có vẻ như được thiết kế để làm trung
gian cho tương tác giữa các tế bào, sau đó được hoà loãng vào trong huyết tương; (5) Các
“hành khách” tạm thời. Đó là những protein không phải hormone, tạm thời lưu thông trong
huyết tương trên đường chuyển động tới vị trí hoạt động của chúng. Ví dụ, các protein từ
lysosome được tiết ra và sau đó qua một hệ thụ cảm (receptor) được tập hợp trong những
th
ể tiêu bào; (6) Các sản phẩm phát sinh từ các mô. Đó là những protein hoạt động bình
6
thường ở các tế bào/mô, nhưng có thể được giải phóng vào huyết tương sau khi các tế bào bị
chết hoặc bị tổn thương. Các protein này bao gồm nhiều loại marker quan trọng như
troponin, creatine kinase, hoặc myoglobin (đang được sử dụng trong chẩn đoán bệnh nhồi
máu cơ tim); (7) Các protein tiết ra do bị lỗi. Những protein này được giải phóng từ những
độ thấp (ví dụ, cytokine) cũng có thể bị loại mất theo. Những
công bố gần đây đã cho thấy, số lượng các protein phân tích được bằng phương pháp khối
phổ cũng phụ thuộc rất nhiều vào các kỹ thuật xử lý và tách chiết ban đầu đối với các mẫu
huyết thanh (Anderson NL & Anderson NG, 2002; Adkins JN et al, 2002; Celis JE et al,
2004; Tirumalai RS et al, 2003; Diamandis EP, 2007). Cũng vì các lý do kể trên, việc chọn
và kết hợp sử dụng hợp lý các ph
ương pháp, đặc biệt là các phương pháp có độ nhạy và
chính xác cao như sắc ký lỏng đa chiều (MDLC) và điện di trên gel kết hợp với các hệ khối
phổ liên tiếp (MALDI và ESI-MS/MS) có độ nhạy và phân giải cao, có thể tự động phân
tách, nhận diện và xác định tổng thể, bao gồm cả những protein/peptide ở nồng độ thấp
(fmol) dựa trên các Ngân hàng dữ liệu Gen và Protein NCBInr và MSDB là hết sức quan
trọng trong phân tích và tìm kiếm các marker chẩn đoán trong huyết thanh. M
ột điểm đáng
chú ý là khi nghiên cứu hệ protein huyết thanh bằng hệ LC-MS/MS cho thấy khả năng phân
tích và nhận diện khá toàn diện không chỉ về thành phần, mà còn những biến đổi có thể về
cấu trúc và tương tác của nhiều loại protein. Cũng chính vì vậy, những nghiên cứu với các
cách tiếp cận tương tự có thể giúp tìm kiếm những protein marker đích thực cho việc giải
7
thích các cơ chế bệnh sinh, chẩn đoán và đánh giá tác động của thuốc. Sử dụng cách tiếp
cận và các phương pháp như mô tả trên sẽ cho phép thấy được bức tranh về tương tác
của cả tập hợp các chỉ thị protein có nguồn gốc từ các các mô khác nhau, có liên quan
đến quá trình phát sinh và phát triển của bệnh lý, đề xuất phương pháp chẩn đoán đúng,
loại trừ những sai sót do chỉ dựa trên những chỉ
thị đơn lẻ (Diamandis EP, 2004; Hortin
GL et al, 2006; Horin GL, 2007). Đây cũng là một trong những nội dung và mục đích
nghiên cứu chính của Dự án Proteome Huyết tương Người (Human Plasma Proteome
Project) hiện được coi là một trong những dự án quan trọng nhất của Tổ chức Nghiên cứu
Proteome Người (Human Proteome Organization, HUPO, ; và Asia
and Oceania Human Proteome Organization, AOHUPO, ) với sự
quan trọng với sự phát triển của bệnh ĐTĐ type 2 ở các tộc người châu Âu và Á (Abate N
et al, 2005). Mohan và cộng sự khi nghiên cứu trên nhóm người Ấn Độ và Châu Âu cũng đã
tìm thấy sự liên quan của đa hình alen A Thr394Thr (G-A) ở gen PCG-1 với ĐTĐ type 2
(Vimaleswaran KS et al
, 2005). Ngoài ra, khi nghiên cứu mức độ biểu hiện của các gen ở
các bệnh nhân ĐTĐ type 2, Rao cùng cộng sự đã chỉ ra gen PBCs biểu hiện tăng trong máu
của các bệnh nhân này, đồng thời ông cũng cho thấy mức độ biểu hiện gen lipoprotein
8
lipase (LPL) và Apolipoprotein C – III (APOC III) có sự khác nhau ở những người bị ĐTĐ
type 2 và hội chứng tăng lipid (Rao PV et al, 2005). Những nghiên cứu này mở ra triển
vọng cho các nhà khoa học trong việc kiểm tra cơ chế gây bệnh và khả năng chỉ thị của các
gen này trong việc chẩn đoán bệnh ĐTĐ type 2.
Với sự phát triển của các kỹ thuật proteomic, những biểu hiện của ĐTĐ type 2 cũng được
nghiên cứu ở mức độ protein (Hongfang L et al, 2010). Ngay từ năm 1996, Rema cùng cộng
sự cho thấy mức độ biểu hiện của haptoglobulin huyết thanh tăng lên ở các bệnh nhân ĐTĐ
type 2 so với mẫu đối chứng (Rema M, Mohan V, Snehalatha C, 1996). Năm 2004, Zhang
và cộng sự bằng cách sử dụng 2DE kết hợp khối phổ đã chỉ ra mức độ biểu hiện của các
protein như haptoglobulin, complement component 3, complement component 4, alpha2-HS
glycoprotein, Alpha-1B-glycoprotein, Alpha-1-antichymotrypsin, Apolipoprotein-AI,
Apolipoprotein B100, Factor H, Pro-platelet basic protein, Serine (hoặc cysteine) proteinase
Inhibitor clade A, Serine (hoặc cysteine) proteinase Inhibitor clade C, Vitronectin precursor,
Fibronectin, C1 inhibitor, Alpha-2 macroglobulin có sự
thay đổi ở bệnh nhân ĐTĐ type 2
(Zhang R et al, 2004). Khi nghiên cứu hệ protein của nước tiểu bằng cách sử dụng các
phương pháp proteomic, Jain và cs đã tìm thấy sự biểu hiện đặc biệt của 4 protein, chỉ thị
của ĐTĐ type 2: zinc alpha-2 glycoprotein, alpha-1 acid glycoprotein, alpha-1
microglobulin và IgG (Jain S et al, 2005) và năm 2009, Jiang H cùng cộng sự đã chứng
minh rằng protein E-cadherin trong nước tiểu cũng được coi là chỉ thị cho ĐTĐT2 (Jiang H
et al, 2009). Nghiên cứu gần đây nhấ
không mắc bệnh thận là Transthyretin giảm 4.3 lần, apolipoprotein (apo) A-I
(3.2 lần),
1
-
microglobulin/bikunin precursor (AMBP) (1.61 lần),
và plasma retinol-binding protein (1.52
lần). So sánh với các mẫu đối chứng thì mức độ giảm của các protein này càng rõ rệt hơn:
AMBP giảm 5.06 lần, retinol-binding
protein (2.56 lần) và apoA-I (2.53 lần) (Rao PV et al,
2007).
Xinghai Li cùng cộng sự cũng đã chỉ ra rằng Atk có chức năng như một phần của con
đường tín hiệu insulin ức chế trực tiếp PGC-1γ (peroxisome proliferator activated receptor-
coactivator) trong các tế bào gan. Con đường này có thể điều khiển sự tiết lipid ở ĐTĐ type
2 như ức chế PGC-1γ gây ra Akt dẫn đến hạn chế sự oxi hóa axit béo ở gan. Đẩy mạnh tác
động của PGC-1γ trong các tế bào gan kháng insulin có thể chống lại s
ự không cân bằng
lipid quan sát thấy ở ĐTĐ type 2 (Xinghai Li, 2007). Bên cạnh đó, khi nghiên cứu các tế
bào thần kinh Huang CJ cùng cộng sự đã khẳng định rằng protein Calcium-activated
calpain-2 có liên quan đến sự phá hủy tế bào beta của bệnh nhân ĐTĐ2 (Huang CJ et al,
2010). Như vậy, việc sử dụng các kỹ thuật proteomic trong nghiên cứu hệ protein nói chung
9
của các bệnh nhân ĐTĐ type 2 mở ra cơ hội mới trong việc tìm kiếm các biomarker phục vụ
chẩn đoán sớm bệnh.
Ở Việt Nam, do tỷ lệ ngày một gia tăng cũng như các nguyên nhân và biến tính phức tạp
của bệnh ĐTĐ type 2, nhiều nghiên cứu về dịch tễ, các phương pháp điều trị và dự phòng đã
sắc thể, các kiểu gen đặc biệt, các đột biến liên quan mật thiết với b
ệnh ung thư bạch cầu.
Kết quả của những thay đổi trên được phát hiện thấy cả ở mức độ biểu hiện mRNA, mức độ
biểu hiện protein nhờ các phương pháp chính như RT-PCR, DNA microarray, các kỹ
thuật/cách tiếp cận nghiên cứu proteomics như điện di 2 chiều, điện di 2 chiều nhuộm huỳnh
quang (2D-DIGE), khối phổ (MALDI/SELDI-MS/MS), sắc ký lỏng khối phổ (LC-MS/MS).
Các gen mã hóa cho CREB (cAMP response element binding protein), PRAME
(preferentially expressed antigen in melanoma), FLT3 (Fetal Liver Tyrosine Kinase 3),
p14
ARF
và p16
INK4a
, MTHFR là một vài trong số rất nhiều gen đã được phát hiện có mức độ
biểu hiện mRNA bất thường liên quan tới bệnh bạch cầu. Mặt khác, chúng cũng được xem
như đích đến của các loại thuốc dùng điều trị bệnh. Mã hóa cho protein bám nhân tố đáp
ứng cAMP, CREB điều khiển các gen chịu trách nhiệm cho các quá trình tăng số
lượng/trưởng, biệt hóa và sự sống sót của tế bào (Sakamoto KM, Frank DA, 2009). CREB
10
được phát hiện biểu hiện thừa cả ở mức độ phiên mã mRNA và protein trong tủy xương ở
hầu hết những bệnh nhân bị ung thư bạch cầu cấp tính và được xem là có vai trò rõ ràng như
một chỉ thị theo dõi diễn biến bệnh ung thư bạch huyết (AML) (Cheng JC et al, 2007).
PRAME (preferentially expressed antigen in melanoma) một loại kháng nguyên được nhận
thấy có sự biểu hiện hiện quá mức (overexpression) ở 52.9% bệnh nhi tuổi bị mắ
c bệnh ung
thư bạch cầu/máu ác tính (Spanaki AC et al, 2007; Nicolas T et al, 2008). Tysosine kinase 3
kiểu FMS/một tysosine kinase xuyên màng (FLT3) được biểu hiện ở hầu hết các trẻ bị
leukemia ác tính và được xem như một đích tiêu biểu trong điều trị bệnh leukemia ác tính
(Kappelmayer JM, Udvardy et al, 2007; Stubbs MC and Amstrong SA, 2007). MTHFR
(Methylenetetrahydrofolate reductase) là một enzyme liên quan trong sự trao đổi chất folate
chiều và khối phổ (MALDI TOF TOF) (Zada AAP et al, 2006). Kết quả cho thấy, trong số
224 protein được nhận diện nhờ khối phổ có tới 47 protein bị thay đổi mức độ biể
u hiện do
ảnh hưởng của protein lai PML-RARα. Một trong số 47 protein đó là oncoprotein 18
(OP18). Bằng phương pháp điện di hai chiều, các tác giả đã nhận thấy một isoform của
OP18 đã biểu hiện tăng lên trong khi isoform còn lại biểu hiện giảm xuống dưới tác động
của protein lai PML-RARα. Bên cạnh đó, mức độ biểu hiện cao hơn của protein OP18 trong
các tế bào biểu hiện PML-RARα được phát hiện là có liên quan tới mức
độ biểu hiện
mRNA cao hơn ở các tế bào từ những bệnh nhân ung thư bạch cầu huyết (APL). Nhóm
nghiên cứu cũng chứng minh sự giảm mức phosphoryl hóa tại gốc amino acid Ser63 của
11
protein OP18 dưới ảnh hưởng của protein lai PML-RARα ảnh hưởng tới chu kỳ tế bào ở các
tế bào của người ung thư bạch cầu APL: làm kết thúc quá trình phân bào của các tế bào
blast (loại tế bào non không biệt hóa hoặc rất ít biệt hóa).
Ở một nghiên cứu khác trên các tế bào ung thư bạch cầu cấp tính AML và ALL có sự
chuyển đoạn nhiễm sắc thể t(4;11), Yocom và cs. đã nhận thấy sự biểu hiệ
n tăng lên của 11
protein khi so sánh với dòng tế bào đối chứng CD34
+
và sự biểu hiện quá mức của các
protein PGK1 (Phosphoglycerate kinase 1), HSP90 (heat shock protein 90 alpha) và nm23
(nucleoside diphosphate kinase) cũng đã được nhận diện (Yocum AK et al, 2006). Đã có
661 protein được nhận diện nhờ phương pháp đánh dấu đồng vị các amino acid (L-leucine -
98% của
13
C
6,
98% của
Bên cạnh việc nghiên cứu sự biểu hiện toàn bộ các protein trong các tế bào ung thư bạch
cầu dưới ảnh hưởng của sự
biểu hiện quá mức một protein nào đó hoặc bởi sự xuất hiện một
protein lai mới, nhiều nghiên cứu đã tập trung khai thác mức độ biểu hiện của các protein
trong huyết thanh/huyết tương (plasma/serum) của những người mắc bệnh ung thư bạch
cầu. Protein FLT3 và sự phosphoryl hóa của nó trong các mẫu plasma thu thập từ 85 bệnh
nhân mắc bệnh ung thư bạch cầu AML và 5 bệnh nhân mang bệnh ALL đã được
đánh giá.
Không có sự khác biệt đáng kể nào về mức độ của các protein FLT3 có mặt trong huyết
thanh những người bị bệnh bạch cầu khác nhau (AML và ALL). Tuy nhiên các bệnh nhân
AML có tỉ lệ FLT3 phosphoryl hóa/FLT3 cao hơn mội cách có ý nghĩa với độ tin cậy lên tới
98%. Protein FLT3 phosphoryl hóa được phát hiện thấy cao hơn một cách đáng kể trong
plasma của những người bệnh mang các đột biến của FLT3 với mức độ tin cậy là 99.98%.
Nhìn chung không có mối liên quan giữa sự
sống của bệnh nhân và mức độ protein FLT3
hoặc dạng phosphoryl hóa của nó trong huyết thanh. Tuy nhiên, trong số các bệnh nhân
không có các đột biến của FLT3, những bệnh nhân nào có mức độ phosphoryl hóa của
FLT3 cao hơn thì có thời gian thuyên giảm bệnh ngắn hơn đáng kể (với độ tin cậy 96%)
(Ravandi F et al, 2007).
12
Trong một nghiên cứu khác, 38 mẫu huyết thanh của các bệnh nhân mắc bệnh ung thư bạch
cầu ác tính (34 ALL và 4 AML) đã được thu thập để theo dõi đánh giá mức độ biểu hiện của
protein thymidine kinase (TK) trong thời gian mới chẩn đoán và trong quá trình điều trị
bệnh. Protein TK tham gia trong quá trình tổng hợp acid nucleic và do vậy nó được xem
như một chỉ thị tăng trưởng ung thư quan trọng. Kết quả thu được cho thấy, mức độ TK
trong serum tại thời điểm chẩn đoán khá cao (78-5826U/I, giá trị trung bình 403 U/I, mức
bình thường nhỏ hơn 8 U/I), và trong quá trình điều trị, bệnh thuyên giảm thì mức độ TK
trong huyết thanh trở nên thấp hơn nhiều (5-80 U/I, giá trị trung bình 31 U/l). Nghiên cứu
cũng công bố mức độ TK huyết thanh tăng lên ở các trường hợp tái phát bệnh ung thư bạch
Thí nghiệm Trọng điểm Công nghệ Gen tại Viện Công nghệ Sinh học thuộc Viện Khoa học
và Công nghệ Việt Nam; (ii) Phòng Thí nghiệm Trọng điểm về Protein và Enzyme thuộ
c
Trường Đại học Quốc gia Hà Nội; (iii) Trung tâm Nghiên cứu Ứng dụng Y-Dược học, Học
Viện Quân Y, Bộ Quốc phòng; (iv) các Phòng Thí nghiệm về Hoá sinh và Sinh học phân tử
có liên quan khác tại các Trường Đại học, Viện Nghiên cứu, Bệnh viện Trung ương thuộc
Bộ Y tế, Bộ Giáo dục và Đào tạo, Bộ Quốc phòng… Các nghiên cứu chủ yếu dựa trên các
kỹ thuật tinh chế hoặc phân tách các protein bằng điện di mộ
t hoặc hai chiều (1-DE/2-DE)
13
sau đó xác định các protein/enzyme bằng các kỹ thuật hoá sinh hoặc miễn dịch, thông qua
các đặc tính sinh học (hoạt tính, đặc tính kháng nguyên/kháng thể ) và gần đây là MALDI-
TOF MS và MS/MS. Tại Viện Công nghệ Sinh học thuộc Viện KHCNVN, ngoài các kỹ
thuật phân tách protein truyền thống như sắc ký, điện di một (1-DE), hai chiều (2-DE) (bao
gồm cả điện di đẳng điện điều chế, preparative electrofocusing), một hệ thống proteomic
workflow mới bao gồm hệ
sắc kí lỏng nano đa chiều (nanoLC Packing, Dionex, Netherland)
kết nối trực tuyến với hệ thống khối phổ QSTAR
®
XL MS/MS sử dụng nguồn ion hóa
NanoSpray™ (MDS SCIEX/Applied Biosystems) đã được thiết lập cho phép tự động phân
tích và nhận dạng không chỉ những protein riêng lẻ, mà còn cả các hệ protein (proteome)
phức tạp. Với hệ thống được thiết lập như trên có thể tiến hành: (i) nhận dạng và xác định
nhanh, chính xác các protein/peptide qua phổ TOF MS hoặc TOF MS/MS; (ii) nghiên cứu
hệ protein (proteome) phức tạp từ virus, vi khuẩn đến các mẫu tế bào động/thực vật, người
(huyết thanh, dịch não t
ủy ) nhằm tìm kiếm, xác định các protein marker có khả năng liên
quan đến các dạng ung thư, bệnh tim mạch, chuyển hóa, thần kinh và lây nhiễm phục vụ cho
các công tác kiểm định, chẩn đoán và theo dõi diễn biến của bệnh lý (Phan Văn Chi và cs,
Việt Nam-Thụy điển, 2006-2007); (iii) Nghiên cứu hệ protein huyết thanh người bằng các
kỹ thuật proteomics, chủ nhiệm Phan Văn Chi (Đề tài NCCB 2006-2008). Để có thể có
14
những ứng dụng thật sự của các kỹ thuật proteomics, đặc biệt trong chẩn đoán sớm cần thiết
phải có những nghiên cứu sâu rộng hơn trên nền hệ protein tổng thể không chỉ của người
bình thường, mà còn của người bệnh, nhằm tìm ra sự khác biệt về mức độ biểu hiện, mối
liên quan giữa sự biến đổi về cấu trúc về chứ
c năng, không chỉ một vài protein riêng biệt,
mà trong mối tương tác chung, từ đó xác định các protein markers cũng như các kỹ thuật áp
dụng chúng.
Trên cơ sở những trang thiết bị khá đồng bộ và hiện đại về proteomics được đầu tư theo Dự
án “Phòng thí nghiệm Trọng điểm Công nghệ Gen” tại Viện Công nghệ Sinh học, Viện
KH&CN Việt Nam và những kết quả nghiên cứu bước đầu về xác lập các phươ
ng pháp
phân tích protein/proteome, tìm kiếm các chỉ thị protein trong huyết thanh người trong thời
gian qua, đề tài “Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người Việt Nam
để phối hợp chẩn đoán bệnh đái tháo đường type 2 và leukemia” giai đoạn 2008-2010
đã được phê duyệt. Mục đích của đề tài là nghiên cứu một cách có hệ thống hệ protein huyết
thanh người Việt Nam ở trạng thái bình thường và các trạng thái bệnh ĐTĐT2 và leukemia,
tìm kiếm nh
ững protein có biến đổi đặc trưng cho các trạng thái bệnh có khả năng phát triển
thành các chỉ thị chẩn đoán.
Aurum serum protein mini KIT (Bio-Rad, USA). Loại Kit này gồm có cột MicroSpin
là hỗn hợp của Affi-Gel Blue và Affi-Gel protein A. Hai thành phần này được gắn lên
chất giá resin cho phép loại đồng thời HSA và IgG trong huyết thanh. 60 µl huyết thanh
được pha loãng trong 180 µl đệm gắn của Kit Aurum. Dung dịch được đưa lên cột
MicroSpin sau khi đã cố định chất giá, hỗn hợp protein huyết thanh không bám cột được
thu l
ại bằng ly tâm và thu hồi HSA và IgG bám trên cột bằng đệm thôi Laemmli. Sau đó
kiểm tra trên SDS-PAGE 12.6%.
2.2. Thu nhận các protein bền nhiệt từ protein huyết thanh
Các protein bền nhiệt từ hệ protein huyết thanh được thu nhận theo phương pháp của
Goufman và cộng sự, 2006.
Một thể tích (1V) huyết thanh tổng số được trộn đều với 1V đệm ETP (20 mM EDTA
pH 8.1, 0.2 M Tris-HCl pH 8.9, 7% (w/v) PEG 6000). Hỗn hợp được ủ 10 phút ở 98
o
C,
10 phút tiếp theo ở nhiệt độ phòng, sau đó được ly tâm tách pha ở điều kiện 12000
vòng/phút trong 15 phút. Phần dịch nổi chứa các protein huyết thanh bền nhiệt được thu
nhận và sử dụng cho các thí nghiệm tiếp theo.
Kết tủa protein bằng acetone lạnh
Protein bền nhiệt thu nhận được theo phương pháp trình bày ở phần trên được hòa tan
trong đệm ETP có nồng độ Tris khá cao (~ 200mM), điều này có thể làm ảnh hưởng đến
việc nghiên cứu hệ
protein này. Để loại bỏ Tris, chúng tôi sử dụng phương pháp kết tủa
protein trong đệm chứa Tris bằng dung môi acetone lạnh (-20
o
C) với nồng độ 80%.
Hỗn hợp protein và acetone được tủa qua đêm ở -20
0
C, sau đó ly tâm lạnh (4
0
dung dịch thôi ra được cô đặc, loại đường và muối bằng phương pháp tủa với acetone
lạnh theo tỷ
lệ protein:acetone là 1:4 về thể tích và được giữ ở -25
0
C.
3. Xác định hàm lượng protein: Hàm lượng protein của mỗi mẫu được xác định theo
phương pháp Bradford với thuốc nhuộm protein của hãng Bio-Rad (Bio-Rad
Laboratories, Hercules, USA) sử dụng albumin huyết thanh bò (BSA – Bovine Serum
Albumin) làm protein chuẩn.
4. Điện di hai chiều 2-DE: các protein được phân tách theo điểm đẳng điện và trọng lượng
phân tử được tiến hành bằng việc sử dụng các strip IPG trong buồng điện di PROTEAN
IEF. SDS-PAGE và các hóa chất, thuốc nhuộm được mua từ hãng Bio-Rad
(Bio-Rad
Laboratories, Hercules, USA) hoặc Amersham Bioscience (Amersham Bioscience Ltd,
USA).
Phân tách protein theo điểm đẳng điện pI – điện di chiều một
Protein được hòa trong 125 µl đệm (chứa 8M ure, 2% CHAPS, 50 mM DTT, 0,2% (w/v)
Bio-Lyte 3/10 ampholyte và 0.001% Bromophenol Blue). Hỗn hợp mẫu được để thấm
vào thanh gel dài 7cm, hoặc 11cm, chứa dải pH từ 4 đến 7 (do hãng Bio-Rad, Mỹ cung
cấp) trong thời gian từ 12 giờ đến 16 giờ. Sau đó, các protein trên thanh gel được phân
tách theo điểm đẳng điện trên hệ PROTEAN IEF (Bio-Rad) theo chương trình được
trình bày trong Bảng 1.
17
Bảng 1. Chương trình chạy điện di chiều thư nhất trên hệ PROTEAN IEF (Bio-Rad)
Loại thanh gel
Hiệu điện thế đầu
(V)
Hiệu điện thế cuối
(V)
Sắc kí lỏng nano đa chiều(MDNanoLC): Dung dịch sau khi thủy phân được hoà vào
0.1% acid formic và phân tích trên hệ NanoLC để phân tách theo chiều thứ nhất trên cột
sắc kí (LC Parking, Dionex) bằng các chất trao đổi cation mạnh (SCX). Sắc kí chiều thứ
hai được thực hiện trên cột ngược pha C18 (GraceVydac, Hesperia, CA) với pha động
chứa 0.1% acid formic trong nước (A) và 0.1% acid formic trong 85% acetonitrile (B).
Các peptide được thôi ra với gradient tuyến tính từ 5% đến 100% dung dịch B với tốc độ
dòng là 0.2 µl/phút.
Đối với hỗn hợp peptide tạo ra do thủy phân các đ
iểm protein trên gel 2DE hệ nanoLC 1
chiều (qua cột ngược pha RP C18) được sử dụng vì hỗn hợp peptide đơn giản, do đó quá
trình chạy chỉ gồm một phân đoạn (không có các phân đoạn muối) trong 90 phút. Các
thông số của hệ thống sắc ký lỏng 1D nanoLC được tổng kết trong Bảng 2.
Đối với hỗn hợp peptide phức tạp tạo ra do thủy phân protein trong dung dịch cho phân
tích tổng thể, chúng tôi tiến hành chạy qua 2 chiều (qua cột trao đổ
i ion SCX và cột
18
ngược pha RP C18) với 16 phân đoạn, 90 phút/mỗi phân đoạn. Các thông số của hệ
thống sắc ký lỏng 2D nanoLC được tổng kết trong Bảng 3.
Bảng 2. Các thông số của hệ thống 1D NanoLC
Sắc ký lỏng nano
UltiMate™ / FAMOS/ Switchos™
(LC Packings/Dionex)
Cột ngược pha
300µl x 5 mm C18 PepMap100, LC Parking, Nertherland)
Cột C18
75µl ID. x 15 cm, Grace Vydac, Hesperia, CA, USA
Tốc độ dòng 200 nl/phút
Tốc độ dòng Switchos
750mM, 1M, H
2
O
Các loại đệm (pha linh
động)
A: 0,1% FA
B: 85% ACN trong 0,1% FA
19
Thời gian mỗi phân
đoạn
90 phút. Phút thứ 10 bắt đầu tạo gradient với nồng độ đệm B tăng từ
0-100% trong 70 phút.
7. Phân tích khối phổ: Máy khối phổ QSTAR
®
XL được vận hành ở chế độ IDA
(Information Dependent Acquisition) để thực hiện việc chuyển từ quét phổ TOF MS
đơn đối với các ion nằm trong dải khối (TOF mass) từ 400 đến 1200 sang khối phổ liên
tiếp trên 3 ion phân tử có mật độ cao nhất và lớn hơn 15 được xác định tự động nhờ
phần mềm BioAnalyst QS v1.4 (AppliedBiosystems). Sai số về khối (mass tolerance)
được đặt ở mức 100 ppm, thời gian không thực hiện lại MS/MS đối vớ
i một mảnh là 90
giây và làm MS/MS đối với ion nằm trong khoảng (±) 3 đơn vị cửa sổ khối (amu
window) của mỗi ion. Hiệu điện thế được đặt để ion hóa mẫu trong dung dịch đi ra từ
đầu Fused Silica PicoTip là 2200V.
Hệ thống sắc ký sử dụng trong phương pháp sắc ký lỏng hai chiều kết hợp khối phổ là
hệ thống nanoLC (Dionex, Netherland) gồm 3 thiết bị trung tâm là thiết bị đưa mẫu t
ự
động Famos, điều khiển hệ thống van Swichos và hệ thống bơm tạo gradient UltiMate.
®
XL. Ngay khi đi ra khỏi cột các
peptide được đưa trực tiếp vào nguồn ion hóa ESI nhờ đầu đưa mẫu Fused Sillica Tip
gắn ở cuối cột. Trong nguồn ESI dịch peptide cùng dung môi được phun thành các giọt
nhỏ tích điện (charge doplet), với sự hỗ trợ của màn khí nitrogen các ion peptide tách
khỏi thành phần dung môi và đi vào bộ phận phân tích khối của máy khối phổ
QSTAR
®
XL. Máy sẽ thu tín hiệu khi hệ thống sắc ký bắt đầu đẩy mẫu vào cột SCX.
Phần mềm BioAnalyst QS v1.4 ghi phổ ion tổng (TIC) theo thời gian, quét phổ TOF MS
đồng thời nhận biết ba ion phân tử tích điện +2, +3 hoặc +4 có mật độ cao nhất (lớn hơn
15) và tự động chuyển sang chế độ phân mảnh đồng thời ghi phổ MS/MS của ba ion này,
sau đó lại chuyển về trạng thái quét phổ TOF MS.
Quá trình này sẽ được lặp
đi lặp lại cho đến khi chương trình sắc ký kết thúc và bằng
phương pháp này qua mỗi lần phân tích chúng ta có thể nhận dạng được hàng trăm đến
hàng ngàn peptide khác nhau. Các peptide hấp phụ trên cột SCX sẽ được thôi ra bằng 16
phân đoạn muối CH
3
COONH
4
, mỗi một phân đoạn lại tiếp tục được loại muối trên cột
RP và phân tách trên cột C18 và đi vào phân tích khối phổ như các bước thực hiện ở
trên. Do vậy chúng ta sẽ thu được phổ TOF MS và MS/MS của tất cả các peptide trong
hỗn hợp.Hình 18 là phổ khối LC-MS/MS thu được ở phân đoạn muối 0mM và hình B là
kết quả quét phổ TOF MS tại phút 36.77. Tại thời điểm này phần mềm BioAnalyst QS
v1.4 nhận biế
t và xác định được ba ion đa điện tính (tích điện +2, +3 hoặc +4) có mật độ
cao nhất có m/z là 515.9, 400.2 và 773.3amu. Ngay sau đó phần mềm này sẽ điều khiểu
hệ thống QSTAR
ng hệ quản trị ngân
hàng dữ liệu Microsoft Access và các phầm mềm chuyên dụng có liên quan. Các protein
được tìm kiếm theo các thông tin (vị trí, chức năng, khả năng liên quan đến bệnh, các
biến đổi sau dịch mã) từ cơ sở dữ liệu UniProt ( />) và sử dụng các
công cụ tin sinh chuyên dụng (ID Mapping, />; NetNGlyc
1.0 Server, />) cũng như các phần mềm xử lý,
phân tích số liệu thống kê (Microsoft Excel).
22 PHẦN III. KẾT QUẢ NGHIÊN CỨU
Theo Thuyết minh/Hợp đồng thì đề tài cần thực hiện 3 nội dung chính sau:
(1)
23 Hình 2. Sơ đồ quy trình thí nghiệm thực hiện đề tài
1.1. Lựa chọn đối tượng nghiên cứu
Phần tuyển chọn và thu thập đối tượng nghiên cứu bao gồm: (1) Mẫu máu/huyết thanh
người bình thường (100 mẫu); (2) Mẫu máu/huyết thanh người bệnh ĐTĐT2 (100 mẫu) và
(3) Mẫu máu/huyết thanh người bệnh leukemia (100 mẫu). Sau đây là những kết quả thu
thập các mẫu nghiên cứu.
1.1.1. Thu thập các mẫu máu người bình thường
Để có thể tìm hiểu những biến đổi về các peptide/ protein trong huyết thanh người bệnh
ĐTĐT2 và leukemia thì các mẫu người bình thường là một phần không thể thiếu. Chúng
được xem như các mẫu đối chứng để đối chiếu với những mẫu bệnh. Các số liệu nhận được
là cơ sở để xây dựng dữ liệu về hệ protein huyết thanh người Việt Nam bình thường, góp
phần nghiên cứu nhữ
ng thông số của người Việt Nam bình thường và nguồn để tra cứu các
24
biến đổi về protein huyết thanh trong các trạng thái bệnh lí. Mẫu người bình thường cần
(không lẫn hồng cầu) được tách ra và cho vào các eppendorf vô trùng, chia nhỏ để đủ dùng
cho các thí nghiệm và bảo quản ở -80°C cho đến khi sử dụng và đưa xét nghiệm các chỉ tiêu
sinh hóa máu.
Kết quả lấy mẫu
Danh sách 100 mẫu ngườ
i bình thường được để trong Phụ lục 2. 30 mẫu được lựa chọn
(Bảng 4) để tiến hành phân tích (gồm 16 nữ và 14 nam) hệ protein huyết thanh.
Bảng 4. Danh sách mẫu thường được lựa chọn nghiên cứu (n=30)
STT Ký hiệu
mẫu
Tên người cung cấp mẫu tình
nguyện
Giới tính
1 BT01 Trần Thị Minh N Nữ
2 BT05 Nguyễn Tiến D Nam