Tài liệu Luận văn Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não mủ (bacterial meningitis): BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
LÊ VĂN TÁM
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Thành phố Hồ Chí Minh
-2006-
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn Kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Giáo viên hƣớng dẫn Sinh viên thực hiện
TS. TRẦN THỊ DUNG LÊ VĂN TÁM
LƢU PHÚC LỢI
Thành phố Hồ Chí Minh
-2006-
MINISTRY OF EDUCATION AND TRAINING
NONG LAM UNIVERSITY, HCMC
DEPARTM...
83 trang |
Chia sẻ: hunglv | Lượt xem: 1113 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Xây dựng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn – ứng dụng cơ sở dữ liệu hai gene 16s và 23s ribosom rna ở vi khuẩn để phát hiện các tác nhân gây bệnh viêm màng não mủ (bacterial meningitis), để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
LÊ VĂN TÁM
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Thành phố Hồ Chí Minh
-2006-
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
BỘ MÔN CÔNG NGHỆ SINH HỌC
***000***
XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S
RIBOSOM RNA Ở VI KHUẨN – ỨNG DỤNG CƠ SỞ DỮ LIỆU
HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN ĐỂ
PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM
MÀNG NÃO MỦ (Bacterial Meningitis)
Luận văn Kỹ sƣ
Chuyên ngành: Công nghệ sinh học
Giáo viên hƣớng dẫn Sinh viên thực hiện
TS. TRẦN THỊ DUNG LÊ VĂN TÁM
LƢU PHÚC LỢI
Thành phố Hồ Chí Minh
-2006-
MINISTRY OF EDUCATION AND TRAINING
NONG LAM UNIVERSITY, HCMC
DEPARTMENT OF BIOTECHNOLOGY
************
CONSTRUCT DATABASE OF 16S AND 23S RIBOSAMAL RNA
GENE IN BACTERIA – APPLICATION THE DATABASE
FOR DETECTION BACTERIAL MENINGITIS
Graduation thesis
Major: Biotechnology
Professor Student
Ph.D. TRAN THI DUNG LE VAN TAM
LUU PHUC LOI
Ho Chi Minh City
-2006-
iii
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến:
Ban Giám hiệu trƣờng Đại học Nông Lâm thành phố Hồ Chí Minh, Ban chủ
nhiệm Bộ môn Công nghệ Sinh học, cùng tất cả quý thầy cô đã truyền đạt kiến
thức cho tôi trong suốt quá trình học tại trƣờng.
TS. Trần Thị Dung và Cử Nhân Lƣu Phúc Lợi đã tận tình hƣớng dẫn, giúp đỡ
tôi trong thời gian làm khóa luận tốt nghiệp.
Xin gởi lời cảm ơn đến tập thể lớp Công Nghệ Sinh Học K28 đã động viên,
giúp đỡ và luôn ở bên cạnh tôi trong những lúc vui buồn.
Cha mẹ kính yêu đã nuôi nấng, dạy dỗ và động viên để con có thể đạt đƣợc
thành quả nhƣ ngày hôm nay.
Thành phố Hồ Chí Minh, ngày…tháng…năm 2006
Sinh viên
LÊ VĂN TÁM
iv
TÓM TẮT KHÓA LUẬN
LÊ VĂN TÁM, Đại học Nông Lâm TP. Hồ Chí Minh. Tháng 8/2006. “XÂY
DỰNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI KHUẨN
– ỨNG DỤNG CƠ SỞ DỮ LIỆU HAI GENE 16S VÀ 23S RIBOSOM RNA Ở VI
KHUẨN ĐỂ PHÁT HIỆN CÁC TÁC NHÂN GÂY BỆNH VIÊM MÀNG NÃO
MỦ (Bacterial Meningitidis)”
Hội đồng hƣớng dẫn:
– TS. Trần Thị Dung
– Cử nhân Lƣu Phúc Lợi
Khóa luận đƣợc thực hiện tại bộ môn Công Nghệ Sinh Học - Trƣờng Đại Học
Nông Lâm TP. Hồ Chí Minh, từ tháng 1/2006 đến 8/2006.
Với sự phát triển của kỹ thuật sinh học phân tử, một số lƣợng lớn các gene 16S
và 23S rRNA đã đƣợc giải trình tự. Những trình tự gene này đƣợc lƣu trữ trong CSDL
sinh học lớn nhƣ NCBI, EMBL, DDBj…Vì các CSDL này quá lớn và chứa rất nhiều
thông tin khác nhau, không tập trung cho một đối tƣợng cụ thể nên khó có thể thực
hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do
vậy, mục tiêu của đề tài là tiến hành xây dựng cơ sở dữ liệu hai gene 16S và 23S rRNA
ở vi khuẩn và ứng dụng CSDL này để phát hiện các loài vi khuẩn gây bệnh viêm màng
não mủ.
Để đạt đƣợc mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung nhƣ
sau:
Dùng Perl script để thu nhận các mẫu tin của hai gene từ trang CSDL GenBank
(CSDL nucleotide của NCBI). Tiếp tục sử dụng Perl script tách các mẫu tin thu
nhận đƣợc thành từng phần riêng biệt nhƣ accession number (mã số truy cập),
gi, definition, sequence (trình tự của gene)…
Thiết kế CSDL dựa vào mô hình dữ liệu quan hệ. Dùng Perl script để chuyển tự
động các thông tin tách đƣợc ở bƣớc trên vào CSDL.
Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl để thiết kế trang
web CSDL về hai gene 16S và 23S rRNA ở các loài vi khuẩn.
v
Sử dụng trình tự của hai gene 16S và 23S rRNA trong CSDL để thiết kế mồi cho
phản ứng PCR phát hiện và phân biệt các tác nhân gây bệnh viêm màng não
mủ.
Đề tài đã đạt đƣợc những kết quả nhƣ sau:
Đã thu thập đƣợc 2825 mẫu tin về gene 16S rRNA và 305 mẫu tin về gene 23S
rRNA từ cơ sở dữ liệu GenBank (NCBI).
Tạo đƣợc CSDL của hai gene 16S và 23S rRNA tích hợp với web.
Trang web CSDL của hai gene và gồm có 5 trang chính: HOME, SEARCH,
TOOL, LINK, ABOUT. Từ các trang web này, ngƣời sử dụng có thể truy xuất
thông tin, tìm kiếm trình tự, so sánh một trình tự quan tâm với các trình tự trong
CSDL (alignment, BLAST)… Ngoài ra, những trang web chính này còn kết nối
đến những trang phụ khác để cung cấp các tiện ích cho ngƣời dùng.
Thiết kế mồi cho phản ứng PCR phát hiện các tác nhân gây bệnh viêm màng
não mủ bằng chƣơng trình thiết kế mồi Primrose.
vi
MỤC LỤC
Nội dung Trang
LỜI CẢM ƠN ............................................................................................................. iii
TÓM TẮT KHÓA LUẬN .......................................................................................... iv
MỤC LỤC ................................................................................................................... vi
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ ......................................................................x
DANH SÁCH CÁC HÌNH ......................................................................................... xi
DANH SÁCH CÁC CHỮ VIẾT TẮT .................................................................... xiii
PHẦN 1: MỞ ĐẦU .......................................................................................................1
1.1. ĐẶT VẤN ĐỀ ......................................................................................................... 1
1.2. MỤC ĐÍCH ............................................................................................................. 2
1.3. YÊU CẦU ................................................................................................................ 2
PHẦN 2: TỔNG QUAN TÀI LIỆU ............................................................................3
2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU .......................................................................... 3
2.1.1. Định nghĩa .................................................................................................................. 3
2.1.2. Hệ quản trị CSDL (Database Management System – DBMS) ....................... 3
2.1.3. Các mô hình dữ liệu ................................................................................................. 3
2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB ................... 3
2.2.1. Perl ............................................................................................................................... 3
2.2.1.1. Tóm tắt lịch sử phát triển ................................................................................. 3
2.2.1.2. Ứng dụng .............................................................................................................. 4
2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng............................................ 4
2.2.2. Giới thiệu về mạng Internet ................................................................................... 5
2.2.3. Tích hợp CSDL với web dùng CGI ...................................................................... 5
2.3. CƠ SỞ DỮ LIỆU SINH HỌC ............................................................................... 6
2.3.1. NCBI (National Center for Bioinformatic Information) ................................. 6
2.3.1.1. Vài nét về NCBI .................................................................................................. 6
2.3.1.2. Một số cơ sở dữ liệu trong NCBI .................................................................... 7
2.3.1.3. Một số công cụ trong NCBI ............................................................................. 7
2.3.2. EBI (European Bioinformatics Institute) ........................................................... 8
vii
2.3.2.1. Vài nét về EBI ..................................................................................................... 8
2.3.2.2. Một số cơ sở dữ liệu trong EBI ....................................................................... 8
2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học ..................................... 9
2.3.3. SIB (Swiss Institute of Bioinformatics) ............................................................... 9
2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan) ......... 10
2.4. BỆNH VIÊM MÀNG NÃO MỦ .......................................................................... 12
2.4.1. Sơ lƣợc về bệnh viêm màng não mủ................................................................... 12
2.4.1.1. Định nghĩa ......................................................................................................... 12
2.4.1.2. Bệnh theo lứa tuổi ............................................................................................ 12
2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh .................................. 13
2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh ................................................. 13
2.4.2.1. Những triệu chứng giai đoạn khởi phát ...................................................... 13
2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ ............................................... 13
2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm .................................. 15
2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam ................... 15
2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ .......................................... 16
2.6. CÁC PHƢƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ ...... 18
2.6.1. Phƣơng pháp chẩn đoán lâm sàng ..................................................................... 18
2.6.2. Phƣơng pháp xét nghiệm vi khuẩn học ............................................................. 18
2.6.3. Phƣơng pháp miễn dịch học ................................................................................ 19
2.6.4. Phƣơng pháp tế bào học ....................................................................................... 19
2.6.5. Phƣơng pháp sinh hoá ........................................................................................... 19
2.6.5.1. Đƣờng trong dịch não tủy .............................................................................. 19
2.6.5.2. Đạm trong dịch não tủy .................................................................................. 19
2.6.5.3. Phƣơng pháp khảo sát nồng độ lactate ....................................................... 20
2.6.6. Phƣơng pháp chụp cắt lớp – CT (computer tomography) ........................... 20
2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR ........................................... 20
2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC NHÂN
GÂY BỆNH VIÊM MÀNG NÃO MỦ ....................................................................... 20
2.7.1. Nguyên tắc của kỹ thuật PCR ............................................................................. 20
2.7.2. Quy trình của phản ứng PCR .............................................................................. 21
2.7.3. Seminested PCR/ Multiplex PCR ....................................................................... 22
viii
2.7.3.1. Seminested PCR ............................................................................................... 22
2.7.3.2. Multiplex PCR .................................................................................................. 22
2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm
màng não mủ. ..................................................................................................................... 22
2.8. GENE 16S rRNA VÀ 23S rRNA .......................................................................... 24
2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome .................................................. 24
2.8.2. Gene 16S rRNA thƣớc đo tiến hóa ...................................................................... 25
2.8.3. Gene 23S rRNA ....................................................................................................... 28
2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH ............... 28
PHẦN 3: PHƢƠNG PHÁP VÀ CÁC CHƢƠNG TRÌNH SỬ DỤNG ..................29
3.1. CÁC CHƢƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐƢỢC SỬ DỤNG 29
3.1.1. Hệ điều hành............................................................................................................ 29
3.1.2. Các chƣơng trình phân tích trình tự ................................................................. 29
3.1.2.1. Chƣơng trình so sánh trình tự ClustalW.................................................... 29
3.1.2.2. Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST ................... 30
3.1.3. Hệ quản trị CSDL quan hệ MySQL .................................................................. 30
3.1.4. Apache web server ................................................................................................. 31
3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng ..................................................... 31
3.1.6. Chƣơng trình thiết kế mồi Primrose 2.17 ......................................................... 32
3.2. PHƢƠNG PHÁP .................................................................................................. 33
3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai gene
16S và 23S rRNA ............................................................................................................... 33
3.2.3. Thiết kế CSDL gene 16S và 23S rRNA .............................................................. 38
3.2.3.1. Phân tích dữ liệu .............................................................................................. 38
3.2.3.2. Thiết kế CSDL dạng bảng .............................................................................. 39
3.2.3.3. Lƣu trữ các thông tin vào CSDL .................................................................. 41
3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web ...................... 42
3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não ............. 42
3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA ................................................ 43
3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA .................................................... 47
3.3.3. Nhiệt độ nóng chảy của mồi ................................................................................. 51
PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN ...................................................................52
ix
4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai
gene 16S và 23S rRNA ................................................................................................. 52
4.2. CSDL gene 16S và 23S rRNA .............................................................................. 52
4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA ............................ 52
4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page) ..... 54
4.3.2. Trang tìm kiếm (Search Page) ............................................................................ 55
4.3.3. Trang công cụ (Tool Page) ................................................................................... 58
4.3.4. Trang Meningitidis ................................................................................................ 60
4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng màng não mủ ......... 60
PHẦN 5: KẾT LUẬN VÀ ĐỀ NGHỊ ........................................................................63
PHẦN 6: TÀI LIỆU THAM KHẢO .........................................................................64
PHỤ LỤC
x
DANH SÁCH CÁC BẢNG VÀ SƠ ĐỒ
Trang
Bảng 2.1. Tóm tắt tác nhân gây bệnh theo lứa tuổi ...................................................... 12
Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ ................................ 14
Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ ......................... 28
Bảng 3.1. Các đối tƣợng phụ dựa trên đối tƣợng chính sinh vật .................................. 38
Bảng 3.2. Các đối tƣợng phụ dựa trên đối tƣợng chính trình tự .................................. 39
Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA ................... 33
Sơ đồ các đối tƣợng chính trong CSDL hai gene 16S và 23S rRNA ............................ 38
Sơ đồ chi tiết các bảng quan hệ .................................................................................... 40
Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA .......... 53
xi
DANH SÁCH CÁC HÌNH
Trang
Hình 2.1. Tƣơng tác giữa Perl script-DBI-DBD và RBDMS ........................................ 5
Hình 2.2. Tƣơng quan giữa NCBI, NLM (National Library of Medicine) và NIH ....... 6
Hình 2.3. Một số cơ sở dữ liệu trong EBI ..................................................................... 9
Hình 2.4. Ba cơ sở dữ liệu nucleotide (GenBank – EMBL – DDB) và công cụ tìm
kiếm tƣơng ứng ............................................................................................................. 11
Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB ................................... 11
Hình 2.6. Quy trình phản ứng PCR .............................................................................. 21
Hình 2.7. Thành phần cấu tạo của ribosome ở prokaryote ........................................... 25
Hinh 2.8. Vị trí và kích thƣớc của 16S và 23S rRNA trong bộ gene vi khuẩn ............. 27
Hình 3.1. Tìm kiếm bằng từ khóa trong trang Home Page của NCBI ......................... 34
Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa cho gene 16S rRNA .......................... 34
Hình 3.3. Kết quả tìm kiếm thể hiện ở dạng text ......................................................... 35
Hình 3.4. File text chứa mã số truy cập ........................................................................ 35
Hình 3.5. Tất cả mẫu tin của gene 16S rRNA ............................................................... 36
Hình 3.6. Một mẫu tin của gene 16S rRNA có mã số truy cập AB016268 .................. 37
Hình 3.7. Thiết kế CSDL ở mức vật lý ........................................................................ 41
Hình 3.8. Tiến trình lấy thông tin từ CSDL hai gene ở vi khuẩn ................................. 42
Hình 3.9. Tạo CSDL trình tự gene 16S rRNA ở các vi khuẩn viêm màng não mủ ...... 43
Hình 3.10. Chọn trình tự đích trong thiết kế mồi phát hiện Streptococcus pneumoniae
dựa trên gene 16S rRNA. .............................................................................................. 43
Hình 3.11. Xác định các thông số cho mồi và số lƣợng mồi đƣợc tạo ra trên trình tự
đích 16S rRNA .............................................................................................................. 44
Hinh 3.12. Danh sách các mồi thiết kế đƣợc trên 16S rRNA ....................................... 44
Hình 3.13. Vị trí bắt cặp của mồi xuôi trên trình tự đích 16S rRNA ............................ 45
Hình 3.14. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 16S rRNA ......................... 46
Hinh 3.15. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 16S
rRNA ............................................................................................................................. 46
Hình 3.16. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene
16S rRNA ...................................................................................................................... 47
xii
Hình 3.17. Danh sách các mồi thiết kế đƣợc cho trình tự gene 23S rRNA ở
Streptococcus pneumoniae ........................................................................................... 48
Hình 3.18. Vị trí bắt cặp của mồi xuôi trên trình tự đích 23S rRNA ............................ 49
Hình 3.19. Vị trí bắt cặp của mồi ngƣợc trên trình tự đích 23S rRNA ......................... 49
Hình 3.20. Kiểm tra lại sự bắt cặp của mồi ngƣợc và mồi xuôi trên trình tự đích 23S
rRNA ............................................................................................................................. 50
Hình 3.21. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngƣợc trên trình tự đích gene
23S rRNA ...................................................................................................................... 50
Hình 3.22. Tính nhiệt độ nóng chảy của mồi xuôi 16S ................................................ 51
Hình 4.1. Trang Home Page ......................................................................................... 54
Hình 4.2. Trang tìm kiếm theo mã số truy cập (accession number)............................. 55
Hình 4.3. Trang kết quả tìm kiếm bằng mã số truy cập ............................................... 56
Hình 4.4. Trang tìm kiếm theo tên loài (species name) ............................................... 57
Hình 4.5. Trang kết quả tìm kiếm theo tên loài (species name) ................................... 57
Hình 4.6. Trang công cụ sắp gióng cột (Alignment) .................................................... 58
Hình 4.7. Trang kết quả sắp gióng cột hai trình tự ....................................................... 59
Hình 4.8. Trang công cụ BLAST ................................................................................. 59
Hình 4.9. Trang Meningitidis ....................................................................................... 60
Hình 4.10. Sự bắt cặp của cặp mồi 16S rRNA trên trình tự đích và trình tự ngoài vùng
đích ............................................................................................................................... 61
Hình 4.11. Sự bắt cặp của cặp mồi 23S rRNA trên trình tự đích và trình tự ngoài vùng
đích ............................................................................................................................... 61
xiii
DANH SÁCH CÁC CHỮ VIẾT TẮT
CSDL Cơ Sở Dữ Liệu
Perl Practical Extraction and Report Language
CGI Common Gateway Interface
DBI Database Interface
DBD Database Driver
WWW World Wide Web
HTML Hypertext Markup Language
HTTP Hypertext Transfer Protocol
NCBI Center for Bioinformatic Information
BLAST Basic Local Alignment Search Tool
EBI European Bioinformatics Institute
EMBL European Molecular Biology Laboratory
SIB Swiss Institute of Bioiformatics
DDBJ DNA Data Bank Japan
PDBj Protein Database Japan
PCR Polymerase Chain Reaction
rRNA ribosomal RNA
1
PHẦN 1: MỞ ĐẦU
1.1. ĐẶT VẤN ĐỀ
Sự phát triển của ngành công nghệ thông tin trong những thập kỷ qua đã góp
phần cải thiện chất lƣợng cuộc sống con ngƣời. Máy tính đã có mặt trong hầu hết các
ngành khoa học, hỗ trợ con ngƣời giải quyết những công việc khó khăn và nhiều thời
gian.
Công nghệ sinh học đƣợc xem là ngành khoa học mũi nhọn của thế kỷ XXI. Với
sự ra đời của kỹ thuật giải trình tự, nhiều bộ gene của sinh vật đã đƣợc giải mã, tạo ra
một lƣợng dữ liệu sinh học khổng lồ. Điều này đòi hỏi có sự lƣu trữ, quản lí và khai
thác các dữ liệu một cách hiệu quả. Với khả năng xử lí và truy xuất lƣợng thông tin lớn
và nhanh chóng, máy tính đã trở thành công cụ hữu ích trong nghiên cứu sinh học. Sự
kết hợp giữa ngành sinh học và tin học đã cho ra đời một công cụ mới đó là Tin – Sinh
học (Bioinformatics). Tin – Sinh học giúp giải quyết hàng loạt những nghiên cứu trong
sinh học mà đòi hỏi thời gian dài hay khó có thể thực hiện bằng tay đƣợc.
Cho đến nay, Tin – Sinh học đạt đƣợc nhiều thành tựu to lớn. Nhiều CSDL sinh
học đã đƣợc thiết lập nhƣ NCBI, EMBL, DDBJ…Các CSDL này chứa lƣợng lớn
thông tin phục vụ đắc lực cho các nhà nghiên cứu sinh học.
Gene 16S và 23S rRNA là 2 gene có chức năng cần thiết cho sự sống của vi
khuẩn, vừa có vùng bảo tồn và vừa có vùng biến động ở các cấp độ khác nhau, giúp
cho việc định danh hay xác định mối quan hệ họ hàng giữa hai hay nhiều loài vi
khuẩn. Các gene này đã đƣợc giải trình tự và lƣu trữ trong các CSDL sinh học trực
tuyến. Tuy nhiên, việc tìm kiếm các thông tin trình tự của hai gene trong các CSDL
lớn thƣờng tốn nhiều thời gian do thông tin không tập trung cho một đối tƣợng cụ thể.
Hiện nay, rất nhiều bệnh nguy hiểm do vi khuẩn gây ra trong đó có bệnh viêm
màng não mủ. Bệnh xảy ra thƣờng xuyên và để lại di chứng nặng nề nếu không điều
trị kịp thời. Việc chẩn đoán bệnh bằng các phƣơng pháp truyền thống thƣờng hạn chế
về mặt thời gian. Phƣơng pháp PCR hiện nay đƣợc sử dụng rộng rãi do tính đơn giản,
nhanh và chính xác. Gene 16S và 23S rRNA là hai gene thích hợp cho việc thiết kế mồi
đặc hiệu để phát hiện các vi khuẩn gây bệnh viêm màng não.
Với các lý do trên cùng với sự đồng ý hƣớng dẫn của TS Trần Thị Dung và Cử
nhân Lƣu Phúc Lợi, chúng tôi thực hiện đề tài “Xây dựng CSDL hai gene 16S và 23S
rRNA ở vi khuẩn - Ứng dụng CSDL này để phát hiện các vi khuẩn gây bệnh viêm
màng não mủ”.
2
1.2. MỤC ĐÍCH
– Thu thập trình tự và thông tin liên quan về hai gene 16S và 23S rRNA ở vi
khuẩn, tổ chức thành một CSDL riêng biệt.
– Ứng dụng trình tự hai gene trong CSDL để thiết kế mồi cho phản ứng PCR phát
hiện các vi khuẩn gây bệnh viêm màng não mủ. Từ đó chứng minh khả năng sử dụng
của gene 23S rRNA có nhiều ƣu điểm hơn so với gene 16S rRNA.
– Tìm hiểu khả năng ứng dụng trong phát hiện tác nhân gây bệnh của phần mềm
Primrose 2.17 (trƣớc đó phần mềm này ra đời với mục đích phân loại phả hệ bằng
gene 16S rRNA).
1.3. YÊU CẦU
– CSDL phải chứa một lƣợng lớn trình tự của hai gene 16S và 23S rRNA ở các
loài vi khuẩn khác nhau trong đó có vi khuẩn gây bệnh viêm màng não mủ.
– CSDL phải đƣợc tích hợp với web, tạo giao diện thân thiện với ngƣời sử dụng.
– Thông qua các trang web, ngƣời dùng có thể truy cập CSDL để tìm kiếm các
thông tin về hai gene nhƣ tên của vi khuẩn, tên của trình tự, chiều dài trình tự, tác giả
giải trình tự…
– Tích hợp các công cụ phân tích trình tự vào trang web nhƣ BLAST,
Alignment…
– Thiết kế mồi đặc hiệu phân biệt đƣợc các vi khuẩn trong nhóm vi khuẩn viêm
màng não mủ thông qua chƣơng trình thiết kế mồi Primrose 2.17.
3
PHẦN 2: TỔNG QUAN TÀI LIỆU
2.1. SƠ LƢỢC VỀ CƠ SỞ DỮ LIỆU
2.1.1. Định nghĩa
Cơ sở dữ liệu (CSDL) là một tập hợp dữ liệu đƣợc tổ chức theo một cấu trúc
chặt chẽ nhằm phục vụ cho nhiều mục tiêu khác nhau một cách có chọn lọc. Tập hợp
dữ liệu sẽ đƣợc lƣu trữ trên các thiết bị lƣu trữ thông tin thứ cấp nhƣ băng từ, đĩa từ…
để thỏa mãn nhu cầu khai thác thông tin đồng thời của nhiều ngƣời sử dụng hay nhiều
chƣơng trình ứng dụng với nhiều mục đích khác nhau.
2.1.2. Hệ quản trị CSDL (Database Management System – DBMS)
Là một hệ thống phần mềm cho phép các nhà phân tích và thiết kế CSDL
cũng nhƣ ngƣời khai thác CSDL đƣợc thuận lợi trong quá trình thiết kế, thao tác, truy
xuất và quản lý dữ liệu.
Hiện nay, một số hệ quản trị CSDL mạnh đang đƣợc đƣa ra thị trƣờng nhƣ
Visual FoxPro, SQL-Server, Oracle…
2.1.3. Các mô hình dữ liệu
Mô hình dữ liệu là sự trừu tƣợng hóa thế giới thực, là sự biểu diễn dữ liệu ở
mức quan niệm. Hiện nay, có năm loại mô hình dữ liệu chính. Đó là:
Mô hình dữ liệu mạng
Mô hình dữ liệu phân cấp
Mô hình dữ liệu quan hệ
Mô hình dữ liệu thực thể kết hợp
Mô hình dữ liệu hƣớng đối tƣợng
2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB
2.2.1. Perl
2.2.1.1. Tóm tắt lịch sử phát triển
Perl (Practical Extraction and Report Language) do Larry Wall tạo ra vào năm
1986 nhằm quản trị các mạng máy tính lớn. Ngôn ngữ này phát sinh từ ngôn ngữ lập
trình C và bị ảnh hƣởng bởi ngôn ngữ khác nhƣ BASIC, Awk, Sed và UNIX shell.
Năm 2000, phiên bản 5.6 xuất hiện. Phiên bản này đã chuyển sang định dạng
tiêu chuẩn và có sự hỗ trợ cả Unicode và UTF-8.
4
Năm 2002, phiên bản Perl 5.8 ra đời cùng với nhiều cải tiến mới đƣợc bổ
sung.
2.2.1.2. Ứng dụng
Perl đƣợc dùng để xử lý tập tin, truy cập dữ liệu và đƣợc dùng cho giao diện
cổng chung (Common Gateway Interface – CGI), tiến hành tạo script của Microsoft
Windows, tạo giao diện ngƣời dùng đồ họa (Graphical User Interface – GUI).
Ƣu điểm: là ngôn ngữ dễ nắm bắt, thích hợp cho xử lý chuỗi và văn bản thuần
túy, đƣợc sự hỗ trợ của nhiều hệ điều hành. Vì vậy, Perl là ngôn ngữ lập trình thích
hợp cho các nhà tin – sinh học vì nó có thể giúp cho việc thao tác trên các chuỗi trình
tự sinh học, tạo CSDL sinh học dễ dàng hơn. Ngoài ra, Perl còn đƣợc hỗ trợ bởi các
module (tập các hàm) giúp kết nối, truy xuất CSDL với trang web, tạo ra trang web
động.
Nhƣợc điểm: chỉ có thể dùng để viết các chƣơng trình, script nhỏ.
2.2.1.3. Một số module của Perl thƣờng đƣợc sử dụng
Module CGI (Common Gateway Interface): Module này gồm các hàm giúp
viết kịch bản Perl theo giao thức CGI. Các script này giúp lấy thông tin từ trình duyệt
khách gởi đến máy chủ, đƣa vào chƣơng trình xử lý và trả thông tin kết quả đến máy
khách.
Module DBI (Database Interface): là tập các hàm, biến và những qui ƣớc
cần thiết cho việc tƣơng tác với một CSDL nhất định thông qua Perl script, hoàn toàn
độc lập với hệ quản trị CSDL (Tim Bunce). Những tƣơng tác có thể nhập, nâng cấp,
xử lý, rút trích…dữ liệu vào hay ra khỏi CSDL.
Module DBD (Database Driver): là một module phụ thuộc loại hệ quản trị
CSDL và liên kết với module DBI để truy cập vào một loại hệ quản trị CSDL nhất
định. Nhƣ vậy tƣơng ứng với một hệ quản trị CSDL có một loại DBD. Ví dụ nhƣ hệ
quản trị MySQL có Database Driver là DBD::MySQL.
5
Hình 2.1. Tương tác giữa Perl script-DBI-DBD và RBDMS
2.2.2. Giới thiệu về mạng Internet
Năm 1957, Bộ quốc phòng Mỹ thành lập cơ quan nghiên cứu các dự án kỹ
thuật cao ARPA (Advanced Research Projects Agency), thuộc một bộ phận trong bộ
quốc phòng. Chỉ một thập niên sau, năm 1969, ARPA thiết lập mạng ARPANET –
tiền thân của Internet ngày nay. ARPANET là một mạng máy tính nối bốn máy chủ tại
các trƣờng đại học California – Los Angeles, đại học California – Santa Barbara, viện
nghiên cứu Standford và đại học Utah lại với nhau.
Đến năm 1973, mạng xuyên quốc gia đầu tiên đƣợc thiết lập giữa hai nƣớc
Anh và Na Uy.
Năm 1982, giao thức TCP/IP ra đời và nhanh chóng trở thành giao thức
chuẩn.
Internet dần dần đƣợc phát triển và đột phá từ khi có sự ra đời của dịch vụ
WWW (World Wide Web). Và từ đây, Internet đƣợc mở rộng sử dụng cho các ngành
nghiên cứu khác và trở thành một công cụ có mục đích thƣơng mại.
2.2.3. Tích hợp CSDL với web dùng CGI
Gồm ba bƣớc:
Bƣớc 1: từ trình duyệt web (trên máy client) gởi đi những yêu cầu của
ngƣời dùng đến máy server. Ở máy server, thông qua trình ứng dụng CGI chuyển
những yêu cầu đó thành những câu truy vấn SQL.
Bƣớc 2: kết nối CSDL, thực hiện những câu truy vấn đó.
P
E
R
L
S
C
R
I
P
T
D
B
I
S
w
i
t
c
h
DBD
DBD
DBD
RDBMS
RDBMS
RDBMS
6
NLM NCBI
NIH
Bƣớc 3: thu lấy kết quả truy vấn, thông qua trình ứng dụng CGI chuyển kết
quả thu đƣợc từ CSDL thành định dạng HTML, rồi trả về máy client.
2.3. CƠ SỞ DỮ LIỆU SINH HỌC
Sự phát triển của kỹ thuật và thiết bị thí nghiệm nhƣ kỹ thuật DNA Microarray, kỹ
thuật giải trình tự tự động cho phép tạo ra hàng ngàn dữ liệu sinh học trong chốc lát.
Nhƣ vậy vấn đề đặt ra là cần phải có biện pháp lƣu trữ, quản lý, sử dụng và chia sẻ
nguồn dữ liệu này. Do đó cần xây dựng các dữ liệu này thành một CSDL hoàn chỉnh
để có thể thực hiện đƣợc mục đích trên. Hơn thế nữa, với việc hệ thống hóa toàn bộ dữ
liệu trên, chúng ta dễ dàng thực hiện việc chia sẻ những thông tin ấy qua mạng Internet
hay kết nối thêm vào những tập dữ liệu ở nơi khác.
Một số CSDL lớn, trực tuyến đã đƣợc xây dựng để cung cấp thông tin cho các
nhà nghiên cứu sinh học nhƣ NCBI, EBI, SIB, DDBJ…
2.3.1. NCBI (National Center for Bioinformatic Information)
2.3.1.1. Vài nét về NCBI
NCBI là chữ viết tắt của “National Center for Bioinformatic Information”.
Đây là trung tâm quốc gia về Công nghệ sinh học, thuộc viện sức khỏe quốc gia của
Hoa Kỳ (NIH – National Institute of Health). NCBI chính thức đƣợc thành lập vào
ngày 4/10/1988. Đến năm 1991, NCBI đảm nhiệm việc quản lý CSDL trình tự DNA
và từ đó NCBI còn đƣợc gọi là GenBank.
Hình 2.2. Tương quan giữa NCBI, NLM (National Library of Medicine) và NIH
NCBI là nơi cung cấp, trao đổi thông tin về sinh học phân tử của Mỹ, thông
qua những CSDL trực tuyến. Ngoài ra, NCBI còn tham gia những nghiên cứu về “sinh
học tính toán” (computation biology), phát triển những công cụ phân tích dữ liệu bộ
gene, protein…
7
2.3.1.2. Một số cơ sở dữ liệu trong NCBI
Nucleotide (GenBank): là CSDL về trình tự nucleotide.
Protein: là CSDL về trình tự amino acid.
Genome: trình tự toàn bộ genome của một số sinh vật.
Structure: hay còn có tên gọi là MMDB (Molecular Modeling Database)
chứa cấu trúc ba chiều của những đại phân tử bao gồm cả protein lẫn những chuỗi
nucleotide.
Ngoài ra, NCBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc
tạo thành từ sự kết hợp của hai hay nhiều CSDL trên, hay do liên kết đến các CSDL
khác.
2.3.1.3. Một số công cụ trong NCBI
– Công cụ khai thác dữ liệu
Tìm kiếm thông tin sinh học dựa trên từ khóa có dạng văn bản:
Entrez: chứa các phƣơng thức tìm kiếm nhƣ tìm kiếm dựa trên accession
number hay dựa theo tên sinh vật, tên gene, tên protein…
Tìm kiếm trình tự tƣơng đồng: có phần mềm điển hình nhƣ:
BLAST (Basic Local Alignment Search Tool). Thông tin hƣớng dẫn về
BLAST có ở trang BLAST Homepage.
Stand-alone BLAST: là phần mềm có thể tải về từ NCBI. Phần mềm này
thực hiện việc tìm kiếm các trình tự tƣơng đồng trên CSDL trình tự cục bộ.
Phân loại sinh vật:
Taxonomy Browser: công cụ thực hiện việc tìm kiếm trên CSDL Taxonomy.
Taxonomy BLAST: nhóm lại những kết quả có tỉ lệ tƣơng đồng khi thực hiện
BLAST, tùy thuộc vào sự phân loại của chúng trong CSDL Taxonomy.
TaxTable: tóm tắt kết quả sau khi thực hiện BLAST với CSDL Taxonomy và
hiển thị mối quan hệ giữa sinh vật này với sinh vật khác bằng các biểu đồ màu.
– Công cụ phục vụ cho việc góp trình tự protein, DNA, EST, STS lên
NCBI
Sequin: phần mềm này có thể tải về từ NCBI, hỗ trợ cho việc tạo ra những
file văn bản (chứa trình tự, tên tác giả, bài báo…) có cấu trúc theo khuôn mẫu. Trong
phần mềm này còn kèm theo một số công cụ nhỏ nhƣ công cụ tìm khung đọc mở, công
8
cụ gióng cột trình tự… phần mềm này thích hợp cho việc góp nhiều trình tự cùng một
lúc.
– NCBI còn tích hợp khá nhiều những công cụ, phần mềm phân tích
trình tự DNA, protein nhƣ:
ORF Finder, Electronic-PCR (e-PCR), VecScreen, Homologene, COGs,
COGnitor, GEO, MGC, Clone Registry, CDD, LocusLink…
2.3.2. EBI (European Bioinformatics Institute)
2.3.2.1. Vài nét về EBI
EBI là viện Tin - sinh học của Cộng đồng chung Châu Âu, EBI đặt tại
Welcome Trust Genome Campus nƣớc Anh, thành lập năm 1992. EBI bắt nguồn từ
EMBL (European Molecular Biology Laboratory). EMBL đƣợc thành lập năm 1980
tại phòng thí nghiệm sinh học phân tử Heidelberg của Đức và đây là CSDL trình tự
nucleotide đầu tiên của thế giới.
EBI phục vụ cho việc nghiên cứu trong các lĩnh vực nhƣ sinh học phân tử, di
truyền, y học, nông nghiệp… bằng cách xây dựng, duy trì những CSDL chia sẻ trực
tuyến thông tin cần thiết. Bên cạnh đó, EBI còn thực hiện những nghiên cứu trong lĩnh
vực Tin-sinh học và sinh học phân tử tính toán.
2.3.2.2. Một số cơ sở dữ liệu trong EBI
EMBL (European Molecular Biology Laboratory): còn đƣợc gọi là EMBL-
BANK chứa CSDL về trình tự DNA, RNA.
MSD (Macromolecular Structure Database): chứa thông tin cấu trúc của các
đại phân tử sinh học nhƣ protein, DNA, RNA…
ArrayExpress: tích trữ nguồn dữ liệu về sự biểu hiện của gene dựa trên kỹ
thuật Microarray.
TrEMBL (Translate EMBL): là cơ sở dữ liệu về protein. Do lƣợng trình tự
này ngày càng nhiều và để quản lý tốt hơn, TrEMBL đã kết hợp với Swiss-Prot (CSDL
về trình tự protein của Thụy Sỹ), PIR (CSDL về protein của trƣờng đại học Y
Georgetown, Hoa Kỳ) tạo thành CSDL UniProt.
Ngoài ra, EBI còn một số CSDL khác. Chúng là các CSDL trung gian, đƣợc tạo
thành từ sự kết hợp của hai hay nhiều CSDL trên hay do liên kết đến CSDL khác
9
Cơ sở dữ liệu về
protein của Thụy
Sỹ đặt tại Geneva
Cơ sở dữ liệu về protein
của trƣờng đại học Y
Georgetown (Mỹ)
2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học
FASTA: Do Smith và Waterman tạo ra năm 1981, là chƣơng trình tìm kiếm
những trình tự tƣơng đồng, có thể là trình tự DNA hay trình tự protein, trong CSDL đã
chọn.
Hình 2.3. Một số cơ sở dữ liệu trong EBI
BLAST: chủ yếu là phần mềm WU-BLAST (Washington University Basic
Local Alignment Tool version 2.0). Đặc điểm chính của công cụ này là tìm kiếm vùng
trình tự tƣơng đồng nhanh chóng.
ClustalW: là công cụ dành cho việc sắp gióng cột ở hai hay nhiều trình tự
sinh học (cả protein và DNA), công cụ này cho ra kết quả có ý nghĩa sinh học cao.
2.3.3. SIB (Swiss Institute of Bioinformatics)
Là viện Tin-sinh học của Thụy Sỹ đặt tại Geneva, nơi cung cấp dịch vụ trên
web chất lƣợng cao cho cộng đồng khoa học thế giới qua trang ExPASy (Expert
Protein Analysis System).
10
Một số CSDL trong ExPASy:
SWISS-PROT: là CSDL protein, đƣợc thành lập năm 1986. Nhƣng kể từ
năm 1987, SWISS-PROT liên kết với EBI.
SWISS-2DPAGE (2-dimensional polyacrylamide gel electrophoresis
database): chứa dữ liệu điện di hai chiều từ protein của ngƣời, chuột, E. coli…
PROSITE: tích trữ về các họ protein có cùng chức năng.
ENZYME (enzyme nomenclature): cung cấp thông tin về danh pháp của
enzyme.
SWISS-3DIMAGE: lƣu trữ hình ảnh chất lƣợng cao của các đại phân tử sinh
học đã biết cấu trúc không gian ba chiều.
2.3.4. DDBJ (DNA Data Bank Japan) và PDBj (Protein Database Japan)
DDBJ là CSDL về trình tự DNA của Nhật Bản, chính thức đi vào hoạt động
năm 1986, đặt tại viện di truyền quốc gia (NIG). Đến năm 2001, trung tâm thông tin về
sinh học ở NIG đƣợc tổ chức lại với cái tên là CIB (Center Information Biology) kết
hợp với DDBJ, viết tắt CIB/DDBJ.
PDBj là CSDL của Nhật Bản, tích trữ dữ liệu về cấu trúc, chức năng protein.
DDBJ của Nhật Bản, EMBL của Châu Âu, NCBI của Hoa Kỳ là ba CSDL về trình
tự nucleotide lớn, mang tính chất toàn cầu và ba cơ sở dữ liệu này có sự hợp tác, trao
đổi qua lại dữ liệu. Từ đó càng làm cho dữ liệu về trình tự nucleotide trở nên phong
phú hơn. Các tổ chức này đều xây dựng công cụ tìm kiếm trong CSDL của họ. Với
NCBI là Entrez, EBI là SRS và CIB là getentry. Nhƣ vậy để có thể khai thác hiệu quả
các CSDL này thì việc đầu tiên cần thực hiện là nắm vững các hoạt động của công cụ
tìm kiếm “search engines” này.
11
Hình 2.4. Ba cơ sở dữ liệu nucleotide (GenBank – EMB – DDBJ) và công cụ tìm kiếm
tương ứng
Ngoài ra còn có sự kết hợp của các CSDL protein trên thế giới để tạo ra một
CSDL thống nhất wwPDB (world wide Protein Database).
Hình 2.5. Sự hợp nhất của ba cơ sở dữ liệu MSD, PDBj, PDB
•Submissions
•Updates
Entrez
NCBI
NIH
getentry
NIG
CIB
•Submissions
•Updates
GenBank
DDBJ
EBI
EMBL
EMBL
SRS
•Submissions
•Updates
12
2.4. BỆNH VIÊM MÀNG NÃO MỦ
2.4.1. Sơ lƣợc về bệnh viêm màng não mủ
2.4.1.1. Định nghĩa
Viêm màng não mủ là hiện tƣợng viêm của màng não. Phản ứng viêm này là do
sự xâm lấn của các loại vi khuẩn sinh mủ vào màng não, từ đó có thể đƣa đến những
biến chứng thần kinh mãn tính hay gây tử vong cho bệnh nhân.
2.4.1.2. Bệnh theo tuổi
Theo tổng kết hồi cứu của Viện Nhi TW từ năm 1996 – 1999 ở trẻ từ 1 tháng đến
15 tuổi, 3 căn nguyên gây bệnh chính vẫn là Haemophilus influenzae, Streptococcus
pneumoniae, Neisseria meningitidis (88,7%) với tỷ lệ tử vong tƣơng ứng là 8,7%,
31,2%, 14,3% trong đó Haemophilus influenzae chiếm 56% tổng số và gặp ở trẻ dƣới
2 tuổi. Ở trẻ sơ sinh thì căn nguyên chính là Klebsiella pneumoniae và Escherichia
coli.
Bảng 2.1. Tóm tắt các tác nhân gây bệnh theo lứa tuổi
Tuổi Tác nhân thông thƣờng
0 tuần đến 4 tuần Streptococcus agalactiae, Escherichia
coli, Listeria monocytogenes, Klebsiella
pneumoniae, Enterococcus spp
4 tuần đến 12 tuần Streptococcus agalactiae, Escherichia
coli, Haemophilus influenzae
3 tháng đến 2 tuổi Haemophilus influenzae, Neisseria
meningitidis
3 tuổi đến 15 tuổi Neisseria meningitidis, Streptococcus
pneumoniae
15 tuổi đến 50 tuổi Neisseria meningitidis, Streptococcus
pneumoniae
Trên 50 tuổi Neisseria meningitidis, Streptococcus
pneumoniae, trực khuẩn gram âm
13
2.4.1.3. Các con đƣờng xâm nhiễm của vi khuẩn gây bệnh
Một số vi trùng ở trong máu đi vào màng não cũng có thể có nguồn gốc từ viêm
nội tâm mạc, viêm phổi, viêm tắc tĩnh mạch hoặc cũng có thể xâm nhập trực tiếp từ
các ổ viêm xoang, viêm tai giữa, viêm mũi.
Ở các bệnh nhân bị chấn thƣơng sọ não hoặc có vết gãy ở xoang mũi hay bị gãy
xƣơng sàng dễ bị viêm màng não. Ở những trƣờng hợp này, sự nhiễm trùng thƣờng do
các vi khuẩn hiện diện ngoài da của bệnh nhân.
Các phẫu thuật ngoại thần kinh cũng có thể gây viêm màng não nhất là các thủ
thuật đụng chạm đến dịch não tủy hoặc do các trƣờng hợp viêm cốt tủy ở xƣơng sọ và
cột sống.
Viêm màng não còn có thể do nhiễm các vi khuẩn từ môi trƣờng bên ngoài nhƣ
các bệnh nhân bị phỏng dễ bị nhiễm Staphylococcus aureus, Pseudomonas
aeruginosa. Trẻ em nằm trong môi trƣờng ẩm ƣớt dễ bị nhiễm các loại vi khuẩn phát
triển trong không khí ẩm.
Trẻ sơ sinh dễ bị nhiễm các loại vi khuẩn có mặt thƣờng xuyên trong âm đạo
hay trực tràng ngƣời mẹ (Escherichia coli) hoặc từ đƣờng tiết niệu của ngƣời mẹ
(Listeria monocytogenes) khi màng ối bị vỡ.
2.4.2. Các triệu chứng biểu hiện lâm sàng của bệnh
2.4.2.1. Những triệu chứng giai đoạn khởi phát
Một bệnh sử đƣợc khai thác tỉ mỉ có thể thấy bệnh nhân viêm màng não trƣớc
đó có nhiễm trùng hô hấp, viêm xoang, viêm tai giữa hay chấn thƣơng sọ não mới hay
cũ. Ở giai đoạn này, các triệu chứng tập trung ở hội chứng nhiễm trùng, một vài bệnh
nhân có đau đầu hay ói mửa.
Một vài triệu chứng gợi ý nhƣ sốt có tử ban, đốm xuất huyết rải rác trong cơ thể
là nghĩ đến não mô cầu…
2.4.2.2. Biểu hiện lâm sàng của viêm màng não mủ
– Hội chứng nhiễm trùng
Sốt cao liên tục ở trẻ em. Ngƣợc lại, sốt có thể không điển hình ở ngƣời lớn
hoặc bệnh nhân cao tuổi. Kèm theo sốt là thể trạng suy sụp, mất nƣớc, môi khô, tim
đập nhanh. Ở trẻ em có thể bức rức, lăn lộn, bỏ ăn.
Đau đầu là triệu chứng thƣờng gặp ở tất cả các trƣờng hợp. Nôn là triệu chứng
xuất hiện muộn hơn đau đầu. Nôn vọt nhất thời không liên quan đến bữa ăn.
14
Rối loạn ý thức: ở giai đoạn đầu bệnh nhân rất tỉnh sau đó rơi vào trạng thái tâm
lý hoảng sợ, sợ ánh sáng, sợ tiếng động; tiến nhanh đến mất ý thức và hôn mê.
Rối loạn cơ vòng: bí tiểu, táo bón là triệu chứng thƣờng gặp trong viêm màng
não mủ.
– Hội chứng màng não
Đau đầu, ói mửa, sợ ánh sáng, cứng tƣ thế do phản ứng, bệnh nhân nằm co,
cứng gáy, tăng phản xạ gân cơ tứ chi.
– Các dấu hiệu thần kinh khác
Co giật, 20 – 30% các trƣờng hợp, xuất hiện sớm ở những ngày đầu.
Liệt các dây thần kinh sọ (dây III, VI,VIII), phù gai thị.
Liệt ½ ngƣời mức độ từ nhẹ đến nặng, trong một số ít trƣờng hợp có thể liệt
một tay, một chân hay ½ mặt.
Rối loạn ý thức và hôn mê. Hôn mê có thể xuất hiện sớm, mức độ khác nhau
nhƣng khi rối loạn ý thức và hôn mê bệnh nhân thƣờng ở giai đoạn nặng.
Một số trƣờng hợp với bệnh cảnh của triệu chứng tăng áp lực nội sọ: đau đầu,
ói mửa và phù gai thị.
Bảng 2.2. Dấu hiệu và triệu chứng của bệnh viêm màng não mủ
Triệu chứng và dấu hiệu Tần số liên quan %
Sốt 90
Đau đầu 90
Kích thích màng não 85
Tăng cảm giác 80
Kernig 50
Brundzinski 50
Co giật kiểu động kinh 30
Nôn 35
Dấu hiệu khu trú 10-20
Phù gai thị <1
15
2.4.3. Hậu quả của bệnh trên những đối tƣợng bị lây nhiễm
Biến chứng nhiễm trùng máu do sự lan tỏa của vi khuẩn theo đƣờng máu.
Vi khuẩn có thể khu trú lại gây viêm nội tâm mạc hay viêm mủ khớp.
Biến chứng thần kinh nặng nề (20%). Ngoài ra còn có rối loạn thị giác, liệt nửa
ngƣời (15%). Tuy nhiên, các biểu hiện liệt dây thần kinh này có thể biến mất sau khi
lành bệnh.
Biến chứng co giật: co giật toàn phần hay cục bộ, có thể kèm giãn đồng tử một
bên, tăng phản xạ gân xƣơng không đồng đều do phù não, do viêm tắc tĩnh mạch vỏ
não.
Áp xe não do nhiễm trùng lan tỏa theo đƣờng máu từ các xoang bị viêm.
Tràn dịch màng cứng nghi ngờ xảy ra ở những trẻ có vòng đầu lớn nhanh, ói,
sốt kéo dài, đạm dịch não tủy tiếp tục tăng cao mặc dù tế bào giảm.
Viêm màng não tái phát nhiều lần xảy ra ở những bệnh nhân có khuyết tật cơ
thể học (rạn nứt hộp sọ trong những trƣờng hợp tiền căn chấn thƣơng sọ não, rò rỉ dịch
não tủy…) do những ổ viêm kế cận tồn tại (viêm xoang, viêm tai…) hoặc do giảm
miễn dịch cơ thể.
2.4.4. Tình hình bệnh viêm màng não mủ trên thế giới và Việt Nam
– Tình hình nhiễm bệnh trên thế giới
Bệnh viêm màng não nói chung (bao gồm cả viêm màng não mủ) xảy ra ở tất cả
các nơi trên thế giới nhƣng những trận dịch lớn nhất và thƣờng xuyên lặp lại là ở vùng
bán khô cằn của vùng cận sa mạc Sahara, châu Phi. Khu vực này còn đƣợc biết với tên
“The meningitis belt” (tạm dịch là “vành đai bệnh viêm màng não”) trải dài từ Senegal
đến Ethiopia gồm 15 nƣớc với dân số ƣớc đoán khoảng 300 triệu ngƣời. Trận dịch
viêm màng não gần đây nhất xảy ra vào giữa thập niên 90 thế kỷ XX với 350 000 ca
bệnh và hàng ngàn ngƣời chết. Năm 1996, hầu hết 190 000 ca bệnh ở Mali, Niger,
Nigeria, Burkina và những nƣớc khác đã làm tê liệt hệ thống chăm sóc y tế và làm cạn
kiệt nguồn dự trữ vaccine thế giới.
Theo thống kê của Tổ chức Y Tế thế giới (WHO), hằng năm số ngƣời mắc bệnh
viêm màng não mủ (không kể những đại dịch) là 1,2 triệu ca. Năm 1999, trên toàn thế
giới có 88006 trƣờng hợp viêm màng não mủ đƣợc ghi nhận, trong đó có 6593 trƣờng
hợp tử vong. Trong số này, các nƣớc châu Phi cũng chiếm một số lƣợng đáng kể,
16
52953 trƣờng hợp, 4129 trƣờng hợp tử vong. Và nếu tính từ ngày 1/1 đến 16/4/2000,
trong một khoảng thời gian ngắn đã có hàng chục ngàn trƣờng hợp nhiễm bệnh viêm
màng não mủ đƣợc ghi nhận, trong đó châu Phi có 18091 trƣờng hợp, 1897 trƣờng hợp
tử vong.
Đối với bệnh viêm màng não mủ, ngƣời ta có thể thống kê đƣợc một bức tranh
toàn diện về dịch tễ của bệnh này. Tuy nhiên, theo các số liệu thống kê chính thức tại
Mỹ, tỷ lệ mắc bệnh viêm màng não mủ là 3-5/100 000 dân và hơn 2000 trƣờng hợp tử
vong trong một năm.
Nếu chỉ tính riêng ở trẻ sơ sinh, theo điều tra của Thụy Điển, tỷ lệ mắc bệnh
viêm màng não mủ là 2,8/100 000 trẻ mới sinh.
Tại các quốc gia đang phát triển, bệnh có khuynh hƣớng trầm trọng hơn. Tại
Brazil, trong giai đoạn 1973 – 1982, tỷ lệ mắc bệnh viêm màng não mủ là 45,8/100
000 dân và tử vong là 33%. Tại Gioudanni, tỷ lệ mắc bệnh viêm màng não mủ là
1,1/1000 trẻ mới sinh.
– Tình hình viêm màng não mủ ở Việt Nam
Tại Việt Nam, bệnh viêm màng não mủ tuy không bùng phát thành dịch nhƣng
vẫn xảy ra liên tục ở các khoảng thời gian khác nhau trong năm.
Theo thống kê của Trung tâm Y Tế Dự Phòng thành phố Hồ Chí Minh cho biết:
Năm 1997 1998 1999 2000
Số ca bệnh 217 177 301 458
Trong đó chỉ có 8 ca tử vong từ năm 1997 đến năm 2000 (chiếm tỉ lệ 0,69%)
Các số liệu thống kê trên cho thấy bệnh viêm màng não mủ đang có chiều hƣớng
gia tăng. Tỷ lệ tử vong của những trƣờng hợp viêm màng não mủ thấp nhƣng di chứng
của bệnh để lại rất nặng nề. Do đó, việc chẩn đoán nhanh và chính xác để điều trị bệnh
một cách nhanh chóng là vô cùng cần thiết.
2.5. VI KHUẨN GÂY BỆNH VIÊM MÀNG NÃO MỦ
Có ít nhất 15 loại vi khuẩn có thể là căn nguyên gây bệnh. Đƣợc thƣờng
xuyên ghi nhận là Haemophilus influenzae, Neisseria meningitidis, Streptococcus
pneumoniae cả 3 loại này chiếm tỷ lệ là 80% các trƣờng hợp viêm màng não mủ. Tuy
nhiên, mức độ mắc phải từng loại vi khuẩn tuỳ thuộc vào lứa tuổi, giới tính và yếu tố
17
thuận lợi cũng nhƣ tuỳ thuộc vào khu vực địa lý. Ngoài ra, điều kiện khí hậu, vệ sinh,
mùa… cũng ảnh hƣởng đến tần số mắc bệnh của các căn nguyên.
– Haemophilus influenzae
Viêm màng não mủ do H. influenzae chiếm khoảng 45 – 48% tổng số bệnh
nhân với tỷ lệ tử vong là 3 – 6%. H. influenzae là căn nguyên quan trọng nhất ở trẻ
dƣới 6 tuổi, đặc biệt ở trẻ 6 – 12 tháng. Các yếu tố nguy cơ là viêm xoang, viêm tai
giữa, viêm nắp thanh quản, viêm phổi, bệnh tiểu đƣờng, suy giảm miễn dịch sau khi
cắt lách, chấn thƣơng đầu có thoát dịch não tủy.
– Neisseria meningitidis (não mô cầu)
Viêm màng não mủ do não mô cầu chiếm 14 – 20% tổng số bệnh nhân với tỷ lệ
tử vong là 10 – 13%. N. meningitidis là căn nguyên phổ biến ở trẻ em và thanh niên.
Căn nguyên này gồm nhiều nhóm, tất cả các nhóm đều có khả năng gây dịch. Tuy
nhiên nhóm B thƣờng gây dịch lẻ tẻ, nhóm A và C thƣờng gây các vụ dịch lớn. Nhóm
Y có thể có viêm phổi kết hợp. Yếu tố nguy cơ là bệnh nhân suy giảm phần cuối của
bổ thể (C5, C6, C7, C9).
– Streptococcus pneumoniae (phế cầu)
Viêm màng não mủ do phế cầu chiếm 13 – 17% tổng số bệnh nhân với tỷ lệ tử
vong là 19 – 26%. Phế cầu là căn nguyên chính ở ngƣời trƣởng thành và là một trong
ba căn nguyên chính ở trẻ em.
– Listeria monocytogenes
Viêm màng não mủ do Listeria chiếm khoảng 2% các trƣờng hợp viêm màng
não mủ với tỷ lệ tử vong là 22 – 29%. 90% các trƣờng hợp viêm màng não mủ do
Listeria là do các type Ia, Ib, VIb gây nên. Nhiễm Listeria monocytogenes hay gặp ở
trẻ sơ sinh, trẻ bị ung thƣ, giảm miễn dịch, tiểu đƣờng, bệnh gan, thận. Phụ nữ mang
thai có thể mang Listeria monocytogenes ở bộ phận sinh dục, trực tràng mà không có
triệu chứng và truyền vi khuẩn cho con.
– Streptococcus agalactiae (liên cầu khuẩn)
Viêm màng não mủ do liên cầu khuẩn chiếm 3 – 6% tổng số bệnh nhân viêm
màng não mủ với tỷ lệ tử vong là 12 – 27%. Liên cầu khuẩn nhóm B là nguyên nhân
phổ biến ở trẻ sơ sinh. Khoảng 15 – 40% phụ nữ có thai có liên cầu khuẩn nhóm B
trong trực tràng và âm đạo nhƣng không có triệu chứng. Nguy cơ truyền bệnh từ mẹ
sang con tăng cao lên khi mẹ mắc bệnh. Bệnh có thể truyền từ tay nữ hộ sinh đến đứa
18
trẻ. Hầu hết các ca nhiễm khuẩn S. agalactiae gây ra bởi type III và xuất hiện ngay sau
tuần đầu.
– Trực khuẩn Gram âm hiếu khí
Các loài vi khuẩn này (Klebsiella pneumoniae, Escherichia coli, Pseudomonas
aeruginosa…) đang trở thành căn nguyên quan trọng với tỷ lệ tử vong tƣơng đối cao.
Bệnh hay gặp sau chấn thƣơng đầu, phẫu thuật thần kinh, trẻ sơ sinh, bệnh nhân có vấn
đề về miễn dịch và nhiễm khuẩn huyết Gram âm.
– Staphylococci (tụ cầu)
Tỷ lệ tử vong của viêm màng não mủ do tụ cầu từ 14 – 77%. S. epidermidis là
căn nguyên chủ yếu ở bệnh nhân có lỗ thông dịch não tủy. Tụ cầu vàng (S. aureus)
thƣờng gặp trong giai đoạn sớm sau phẫu thuật thần kinh, hoặc sau chấn thƣơng có rò
dịch não tủy. Các điều kiện thuận lợi khác gồm: tiểu đƣờng, suy thận có thấm phân
máu và u ác tính.
– Những vi khuẩn khác
Các điều kiện thuận lợi cho viêm màng não mủ do Nocardia spp nhƣ dùng
thuốc miễn dịch, u ác tính, chấn thƣơng đầu và hệ thần kinh trung ƣơng, mụn mủ viêm
mãn tính, bệnh sarcom. Viêm màng não mủ do vi khuẩn kỵ khí thƣờng có điều kiện
nhƣ: viêm tai, viêm xoang, viêm họng, áp xe não, nhiễm khuẩn vết thƣơng sau chấn
thƣơng và sau phẩu thuật thần kinh.
2.6. CÁC PHƢƠNG PHÁP XÉT NGHIỆM BỆNH VIÊM MÀNG NÃO MỦ
2.6.1. Phƣơng pháp chẩn đoán lâm sàng
Ngƣời bị viêm màng não mủ thƣờng có những biểu hiện nhƣ sốt cao, nôn
mửa, đau đầu dữ dội, cứng cổ, sợ ánh sáng, mất ý thức…
2.6.2. Phƣơng pháp xét nghiệm vi khuẩn học
Dịch não tủy đƣợc đem ly tâm lấy phần cặn lắng để nhuộm gram tìm vi khuẩn.
Có thể soi nhìn thấy đƣợc vi khuẩn hay không tùy thuộc vào số lƣợng vi khuẩn bị
nhiễm. Nếu số lƣợng này lên đến 105/ml thì có thể soi (+) trong 97% các trƣờng hợp.
Tỷ lệ nhuộm (+) cũng tùy thuộc vào loại vi khuẩn.
Dịch não tủy đƣợc đem cấy vào môi trƣờng thạch máu hay thạch sô-cô-la. Cấy
dịch não tủy có thể dƣơng tính trong 70 – 80% các trƣờng hợp viêm màng não mủ.
19
2.6.3. Phƣơng pháp miễn dịch học
Phƣơng pháp điện di miễn dịch ngƣợc chiều (Counter Immuno Electrophoresis)
xác định đƣợc viêm màng não do H. influenzae, S. pneumoniae, N. meningitidis A, B,
C, Y và W 135 trong vòng vài giờ.
Phản ứng ngƣng kết với latex nhạy hơn phƣơng pháp CIE, cho kết quả trong 4
giờ, giúp phát hiện kháng nguyên polysaccharide trong H. influenzae type b, S.
pneumoniae, N. meningitidis và Streptococcus nhóm B.
2.6.4. Phƣơng pháp tế bào học
Tế bào dịch não tủy phải đƣợc khảo sát ngay, vì sau 90 phút, các bạch cầu của
dịch não tủy sẽ bắt đầu thoái hóa. Trong trƣờng hợp bệnh viêm màng não mủ, lƣợng tế
bào có thể từ 100 – 1000/mm3, trong đó bạch cầu đa nhân trung tính chiếm đa số (trên
80%). Trong những trƣờng hợp viêm màng não mủ đang điều trị dở dang, số lƣợng
các tế bào đơn nhân có thể cao hơn đa nhân.
Công thức Dejong
Nếu bạch cầu đếm đƣợc trong dịch não tủy lớn hơn số lƣợng trên chính là số
lƣợng bạch cầu viêm. Nếu bạch cầu viêm trên 10/mm3 cho phép kết luận có sự tăng
bạch cầu dịch não tủy, nghĩa là có hiện tƣợng viêm.
2.6.5. Phƣơng pháp sinh hoá
2.6.5.1. Đƣờng trong dịch não tủy
Trong viêm màng não mủ, lƣợng đƣờng ở dịch não tủy thƣờng thấp hơn đƣờng
huyết 50 – 60%. Một số ít trƣờng hợp đƣờng dƣới 10 mg%. Đƣờng trong dịch não tủy
thấp có giá trị phân biệt viêm màng não mủ với các viêm màng não siêu vi hay các
nhiễm trùng cạnh màng não.
2.6.5.2. Đạm trong dịch não tủy
Đạm trong dịch não tủy tăng cao, khoảng 100 mg%. Nếu đạm trong dịch não
tủy tăng lên trên 1000 mg% phải nghĩ đến tắc nghẽn khoang dƣới nhện thứ phát.
Ngoài ra, khi dịch não tủy bị chạm thƣơng, nồng độ đạm có thể gia tăng hơn: cứ 1000
hồng cầu sẽ tăng 0,1 mg/ml.
Bạch cầu dịch não tủy = (Hồng cầu dịch não tủy x bạch cầu máu)/ Hồng cầu máu
20
2.6.5.3. Phƣơng pháp khảo sát nồng độ lactate
Lactate là chất đƣợc sản sinh từ quá trình chuyển hóa kỵ khí của glucose. Nó là
một yếu tố quan trọng giúp chẩn đoán bệnh. Trị số lactate dịch não tủy tăng cao trên 4
mmol/l trong viêm màng não mủ. Độ nhạy cảm của thông số này khá cao so với các
thông số khác nhƣ đạm, đƣờng. Trị số này sẽ giảm trong quá trình đáp ứng với điều trị.
2.6.6. Phƣơng pháp chụp cắt lớp – CT (Computer Tomography)
Phƣơng pháp chụp cắt lớp điện toán – CT sọ não không có ích cho chẩn đoán
nhƣng có thể chỉ định cho bệnh nhân cứ sốt dai dẳng, có biểu hiện tăng áp lực nội sọ,
liệt khu trú, co giật, vòng đầu to, rối loạn thần kinh kéo dài, hoặc kết quả cấy và các
thông số của dịch não tủy bất thƣờng kéo dài để xác định biến chứng. Ở trẻ có sốt và
nghi ngờ có tràn dịch dƣới màng cứng nên chụp CT để phát hiện và dẫn lƣu. Đặc biệt
ở bệnh nhân viêm màng não mủ do vỡ nền sọ có thoát dịch não tủy, chụp CT có thể
phát hiện mức độ khí – dịch, độ mờ của xoang mũi hoặc khí nội sọ. CT cắt dọc có thể
định vị đƣợc vị trí vỡ xƣơng. Chụp CT có thể sử dụng chất cản quang tạo độ tƣơng
phản rõ giữa dịch – chất hòa tan là cách tốt nhất để xác định vị trí thoát dịch.
2.6.7. Phƣơng pháp xét nghiệm dựa vào kỹ thuật PCR
Phƣơng pháp PCR là một phƣơng pháp mới để xét nghiệm bệnh viêm màng não
mủ. Phƣơng pháp này có nhiều ƣu điểm nhƣ độ nhạy, độ chính xác cao, cho phép phát
hiện trực tiếp và chính xác vi khuẩn gây bệnh trong thời gian ngắn, kĩ thuật thao tác
đơn giản và nhanh chóng trên một lƣợng dịch não tủy ban đầu ít. Mặt hạn chế của
phƣơng pháp này là sự ngoại nhiễm cao.
2.7. KỸ THUẬT PCR VÀ ỨNG DỤNG TRONG VIỆC PHÁT HIỆN TÁC
NHÂN GÂY BỆNH VIÊM MÀNG NÃO MỦ
2.7.1. Nguyên tắc của kỹ thuật PCR
Tất cả các DNA polymerase khi hoạt động tổng hợp một mạch DNA mới từ
mạch khuôn đều cần sự hiện diện của những mồi chuyên biệt. Mồi là những đoạn
DNA ngắn, có khả năng bắt cặp bổ sung với một đầu của mạch khuôn. Sau đó DNA
polymerase sẽ nối dài để hình thành mạch mới. Phƣơng pháp PCR đã đƣợc hình thành
dựa trên các đặc tính đó của DNA polymerase. Vậy nếu ta cung cấp hai mồi chuyên
biệt bắt cặp bổ sung với hai đầu của trình tự, ta sẽ tổng hợp đoạn DNA nằm giữa hai
mồi.
21
Thành phần cơ bản của phản ứng PCR gồm có: DNA bản mẫu, mồi xuôi và mồi
ngƣợc, dNTPs (dATP, dCTP, dGTP,dTTP), dung dịch đệm cho phản ứng PCR,
MgCl2, Taq polymerase.
2.7.2. Quy trình của phản ứng PCR
Phản ứng PCR là một chuỗi nhiều chu kỳ nối tiếp nhau, mỗi chu kỳ gồm ba bƣớc
và mỗi chu kỳ sẽ tăng gấp đôi số lƣợng mẫu lần trƣớc (nhân bản theo cấp số nhân).
Bƣớc 1: Giai đoạn biến tính
Trong một dung dịch phản ứng bao gồm các thành phần cần thiết cho sự sao chép,
phân tử DNA đƣợc biến tính ở nhiệt độ cao hơn Tm của phân tử, thƣờng ở 90oC –
95
oC trong vòng 30 giây đến 1 phút.
Bƣớc 2: Giai đoạn bắt cặp (lai)
Nhiệt độ đƣợc hạ thấp (thấp hơn Tm của các mồi) cho phép các mồi bắt cặp với
khuôn. Trong thực nghiệm, nhiệt độ này dao động trong khoảng 40oC – 70oC tuỳ thuộc
Tm các mồi sử dụng và kéo dài từ 30 giây đến 1 phút.
Bƣớc 3: Giai đoạn kéo dài
Nhiệt độ đƣợc tăng lên đến 72oC giúp cho DNA polymerase hoạt động tổng hợp tốt
nhất (DNA polymerase sử dụng là DNA polymerase chịu nhiệt). Thời gian tùy thuộc
vào độ dài của trình tự DNA cần nhân bản.
Hình 2.6. Quy trình phản ứng PCR
22
2.7.3. Seminested PCR/ multiplex PCR
2.7.3.1. Seminested PCR
Đây là một trong những kỹ thuật phát triển sau này dựa vào nền tảng kỹ thuật
PCR. Kỹ thuật này gồm hai bƣớc:
Bƣớc 1: là sự nhân bản một trình tự DNA.
Bƣớc 2: là sự nhân bản các bản mẫu là các đoạn DNA vừa đƣợc nhân bản.
Đoạn DNA đƣợc nhân bản trong bƣớc 2 nằm trong đoạn DNA đƣợc nhân bản trong
bƣớc 1. Một trong hai mồi sử dụng ở bƣớc 1 sẽ đƣợc sử dụng lại trong bƣớc 2 để cùng
mồi mới tạo thành một cặp mồi. Sau bƣớc đầu tiên, các đoạn DNA chứa đoạn DNA
cần nhân bản ở bƣớc 2 đã đƣợc nhân lên rất nhiều so với lƣợng DNA ban đầu. Do đó,
ở bƣớc 2, lƣợng bản mẫu sẽ nhiều hơn lƣợng DNA không mong muốn nên sự nhân
bản các đoạn DNA mong muốn sẽ diễn ra dễ dàng hơn, dẫn đến sự nhân bản đặc hiệu
hơn.
2.7.3.2. Multiplex PCR
Multiplex PCR là một kỹ thuật dùng nhiều cặp mồi khác nhau trong cùng một
phản ứng PCR để nhân bản đồng thời nhiều đoạn trình tự. Số lƣợng các sản phẩm PCR
khác nhau đƣợc nhân bản trong cùng một phản ứng PCR có thể từ 2 sản phẩm đến tối
đa 15 sản phẩm, điều này có nghĩa là có thể dùng đến 15 cặp mồi trong cùng một phản
ứng. Kỹ thuật này đƣợc thử nghiệm thành công vào năm 1988 và từ đó đã đƣợc áp
dụng thành công trong nhiều công trình nghiên cứu về các biến đổi di truyền ở ngƣời
cũng nhƣ nhiều lĩnh vực nghiên cứu khác.
Kỹ thuật multiplex PCR thƣờng dùng để kết hợp với kỹ thuật nested PCR hay
seminested PCR nhằm thu đƣợc kết quả với độ chính xác và độ đặc hiệu cao.
2.7.4. Ứng dụng kỹ thuật PCR trong việc phát hiện vi khuẩn gây bệnh viêm
màng não mủ
Gene 16S rRNA của các vi khuẩn thuộc nhóm Eubacteria có những vùng bảo tồn
cao ở cấp độ nhóm, xen kẽ với các vùng biến động khác nhau giữa các loài trong
nhóm. Do đó, những trình tự này rất phù hợp với mục đích thiết kế mồi nhằm phát
hiện sự hiện diện của vi khuẩn và các kỹ thuật chẩn đoán dựa vào kỹ thuật PCR ngày
càng đƣợc phát triển với mục đích tăng độ nhạy của phản ứng.
Năm 1994, Radstrom và các cộng sự đã đề ra phƣơng án sử dụng cặp mồi u3 và
ru8 để nhân bản vùng trình tự bảo tồn trên gene 16S rRNA trong bƣớc đầu và sử dụng
23
mồi ru8 với các mồi đặc hiệu cho từng loài vi khuẩn để nhân bản vùng trình tự đặc biệt
của mỗi loài trong bƣớc 2. Kỹ thuật tiếp tục đƣợc nhóm nghiên cứu phát triển (năm
1998) để phát hiện đồng thời các chủng vi khuẩn gây bệnh viêm màng não mủ trong
dịch não tủy nhƣ Haemophilus influenzae, Neisseria meningitidis, Streptococcus
agalactiae, Streptococcus pneumoniae và Listeria monocytogenes.
Cũng vào năm 1994, Greisen và các cộng sự công bố công trình nghiên cứu
những mồi và mẫu dò cho gene 16S rRNA của hầu hết các loài vi khuẩn gây bệnh, bao
gồm vi khuẩn tìm thấy trong dịch não tủy. Đầu tiên là sự nhân bản vùng trình tự bảo
tồn trên gene 16S rRNA bằng phƣơng pháp PCR. Sau đó sử dụng các mẫu dò đặc hiệu
để phát hiện DNA các loài vi khuẩn.
Tƣơng tự các công trình nghiên cứu trƣớc, Jang – Jih Lu và các cộng sự vào năm
2000 cũng đã thiết lập một cặp mồi chung trên gene 16S rRNA cho các loài vi khuẩn
Staphylococcus aureus, Staphylococcus epidermidis, Streptococcus pyogenes,
Streptococcus agalactiae, Streptococcus pneumoniae, Enterococcus faecium,
Enterococcus faecalis, Mycobacterium tuberculosis, Legionella pneumophila,
Escherichia coli, Klebsiella pneumoniae, Serratia marcescens, Enterobacter cloacae,
Pseudomonas aeruginosa, Acinetobacter baumannii, Proteus mirabilis, Haemophilus
influenzae, Neisseria meningitidis để thiết lập phản ứng PCR nhân bản đoạn có kích
thƣớc 996 bp. Ở bƣớc 2 tác giả sử dụng enzyme cắt giới hạn phân cắt đoạn trình tự lớn
996 bp. Các sản phẩm PCR sau khi đã xử lý bằng enzyme sẽ đƣợc điện di trên gel
polyacrylamide 6% và so sánh với thang chuẩn để xác định sự hiện diện của vi khuẩn
trong dịch não tủy.
Qua một số công trình nghiên cứu trên, chúng tôi thấy hầu hết việc phát hiện vi
khuẩn gây viêm màng não mủ đều trải qua bƣớc cơ bản là nhân bản 1 trình tự bảo tồn.
Do đó, trong khuôn khổ khóa luận này chúng tôi tiến hành thu thập các trình tự gene
16S và 23S rRNA bảo tồn trên các loài vi khuẩn và lƣu trữ trong CSDL. Từ các trình tự
này chúng tôi sử dụng phần mềm Primrose để thiết kế mồi cho phản ứng PCR phát
hiện vi khuẩn gây bệnh viêm màng não mủ.
24
2.8. GENE 16S rRNA VÀ 23S rRNA
2.8.1. RNA ribosome (rRNA) – Cấu trúc ribosome
Sự tổng hợp các chuỗi polypeptide trong tất cả các hệ thống sống đƣợc thực hiện
tại các ribosome. Ribosome của vi khuẩn có khối lƣợng khoảng chừng 2,5 triệu dalton,
có hệ số lắng là 70S, trong đó protein chiếm 1/3 khối lƣợng và phần còn lại là các
rRNA.
Tất cả các ribosome đƣợc hình thành từ hai tiểu đơn vị ribonucleoprotein có kích
thƣớc không bằng nhau. Ở vi khuẩn, những tiểu đơn vị này có hệ số lắng là 50S và
30S. Ribosome ở E. coli cũng nhƣ ở các loài vi khuẩn khác chứa 3 loại rRNA: 16S
rRNA, 23S rRNA và 5S rRNA.
16S rRNA ở E. coli có chiều dài khoảng 1542 ribonucleotide là một thành phần
cấu thành tiểu đơn vị nhỏ của ribosome. Tiểu đơn vị lớn của ribosome thì chứa hai loại
rRNA là 23S và 5S (ở E. coli có chiều dài lần lƣợt là 2904 và 120 ribonucleotide).
Ngƣời ta cho rằng rRNA đóng vai trò rất quan trọng trong cấu trúc của ribosome, giúp
cho việc gắn kết của các protein ribosome và góp phần quyết định hình dạng của
ribosome.
Thành phần cấu tạo của ribosome điển hình (ở vi khuẩn E. coli) bao gồm 55 phân
tử protein có khối lƣợng khoảng 900 000 dalton, trong số này có 4 phân tử protein
cùng loại, các phân tử còn lại là khác nhau. Tiểu đơn vị nhỏ của ribosome bao gồm 21
protein kết hợp với 16S rRNA, tiểu đơn vị lớn bao gồm 34 protein kết hợp với 23S
rRNA và 5S rRNA.
25
Hình 2.7. Thành phần cấu tạo của ribosome ở prokaryote
Cho đến nay, chƣa có một kết luận hợp lý nào về sự xuất hiện một lƣợng lớn
rRNA trong ribosome. Tuy nhiên, mọi ngƣời đều tin rằng các ribonucleotide không bắt
cặp trong cấu trúc bậc 2 của rRNA có liên quan đến sự gắn kết của các RNA khác lên
ribosome. Chẳng hạn một vài ribonucleotide ở gần đầu 3‟ của 16S rRNA là điểm bắt
cặp với các nucleotide (trình tự Shine – Dalgarno) trên phân tử RNA thông tin
(mRNA) để ribosome có thể gắn vào RNA thông tin và tiến hành tổng hợp chuỗi
polypeptide. Tƣơng tự, một vài trình tự rRNA của ribosome cũng tƣơng tác với các
trình tự của RNA vận chuyển (tRNA) khác nhau trong quá trình tổng hợp protein.
2.8.2. Gene 16S rRNA thƣớc đo tiến hóa
Từ năm 1967, Zuckerkand và Pauling đã đƣa ra ý kiến cho rằng các phân tử sinh
học có thể là “tài liệu của lịch sử tiến hoá” hay “thƣớc đo tiến hoá”. Để là một thƣớc
đo tiến hóa, phân tử đƣợc chọn phải có các đặc điểm sau.
- Phân tử phải có mặt ở tất cả các sinh vật khảo sát.
- Phân tử không đƣợc truyền qua lại giữa các loài.
- Trình tự của phân tử này phải có độ bảo tồn và biến động thích hợp trong
khoảng cách tiến hóa khảo sát.
26
- Phân tử phải có kích thƣớc đủ lớn để chứa nhiều thông tin. Mặc dù các tRNA
có mặt ở hầu hết các vi sinh vật nhƣng chúng không đƣợc chọn làm thƣớc đo tiến hóa
do có kích thƣớc quá nhỏ (75 ribonucleotide).
Một thập kỷ sau, vào năm 1977, Woese và các cộng sự đã xác định 16S rRNA
là phân tử rất thích hợp làm thƣớc đo tiến hóa. 16S rRNA là phân tử cổ, là thành phần
của bộ máy tổng hợp protein có từ lâu đời. Hơn nữa, các rRNA là những phân tử có
chức năng không thay đổi, phân bố ở hầu hết các hệ thống sống và có độ bảo tồn vừa
phải cho phép phản ảnh sự liên quan tiến hóa giữa các loài sinh vật.
Ba loại rRNA là thành phần của ribosome đều có một số tính chất để có thể
đƣợc chọn làm thƣớc đo tiến hóa. Tuy nhiên, 5S rRNA có kích thƣớc quá nhỏ (khoảng
120 ribonucleotide), mang ít thông tin của quá trình tiến hóa nên ít đƣợc chọn. 23S
rRNA là phân tử lớn (có khoảng 2900 ribonucleotide), có đầy đủ các tính chất để có
thể làm thƣớc đo tiến hóa. Tuy nhiên, kích thƣớc của 23S rRNA lớn nên thao tác
nghiên cứu trên phân tử này không thuận lợi lắm. Phân tử 16S rRNA có kích thƣớc
vừa phải, khoảng 1500 ribonucleotide, thuận lợi cho các thao tác nghiên cứu nên hiện
nay, phân tử này đƣợc coi nhƣ là “tiêu chuẩn vàng” cho phân loại học. Tuy nhiên, do
RNA đòi hỏi phải rất cẩn trọng trong thao tác do dễ bị phân hủy nên khuynh hƣớng
hiện nay là sử dụng gene mã hóa cho RNA – gọi là gene 16S rRNA – trong các nghiên
cứu. Gene 16S rRNA của các vi khuẩn thuộc nhóm Eubacteria có một điểm rất đặc biệt
là có những vùng bảo tồn cao ở cấp độ của nhóm xen kẽ những vùng biến động khác
nhau giữa các loài trong cùng nhóm này. Tuy là những vùng biến động, nhƣng những
vùng này lại là những vùng bảo tồn ở cấp độ loài. Sự bảo tồn và biến động ở các cấp
độ khác nhau đã giúp cho gene 16S rRNA luôn là sự lựa chọn đầu tiên của các nhà
nghiên cứu khi tiến hành định danh vi khuẩn hay xác định mối quan hệ họ hàng giữa
hai hay nhiều loài vi khuẩn. Cho đến nay, số lƣợng các gene 16S rRNA đã đƣợc giải
trình tự lên đến hơn 10 000. Điều này cho thấy có sự quan tâm rất lớn của các nhà
khoa học đến đối tƣợng này.
27
Hình 2.8. Vị trí và kích thước của 16S và 23S rRNA trong bộ gene vi khuẩn
– Ứng dụng của gene 16S rRNA trong lĩnh vực y học
Gene 16S rRNA đƣợc sử dụng nhiều trong các nghiên cứu xác định tác nhân vi
khuẩn gây bệnh. Trƣớc đây, trong nhiều công trình nghiên cứu, trình tự DNA đích
đƣợc nhân trong kỹ thuật PCR liên quan đến các gene gây bệnh đặc hiệu cho tác nhân,
nhƣ gene protease A (Kuritza & Oehler, 1991) hay gene dhps (dihydropteroate
synthase) (Salo & cs, 1995) nhằm phát hiện N. meningitidis, gene autolysin (Cherian
& cs, 1998) nhằm phát hiện các serotype của S. pneumoniae. Đôi khi, trình tự đích là
một trình tự ngẫu nhiên đƣợc chọn từ thƣ viện bộ gene của một tác nhân gây bệnh nhƣ
trong công trình về Legionella sp và Legionella pneumophila (Mahbubani & cs, 1989).
Tuy nhiên trong những năm gần đây, khuynh hƣớng sử dụng các gene có độ bảo tồn
cao giữa các vi khuẩn gây bệnh nhƣ vùng gene 16S rRNA ngày càng đƣợc ƣa chuộng.
Việc lựa chọn và sử dụng phối hợp consensus primer nằm trong các vùng bảo tồn và
các primer đặc hiệu trong các vùng biến động sẽ cho phép phát hiện sự hiện diện của
các vi khuẩn gây bệnh nói chung đồng thời xác định đƣợc tên của vi khuẩn. Greisen &
cs (1994) sử dụng các consensus primer để nhân bản trình tự DNA của 124 loài vi
khuẩn. Các trình tự này sau đó đƣợc lai (Southern blotting) với các probe đặc hiệu cho
các nhóm và loài vi khuẩn gây bệnh khảo sát. Các tác giả đã phát hiện và định danh
đƣợc hầu hết các vi khuẩn gây bệnh hiện diện. Radstrom & cs (1994) nhân bản gene
16S rRNA bằng hai phản ứng PCR nối tiếp (seminested PCR). Phản ứng PCR I cho sản
phẩm nhân bản là một trình tự chung cho mọi vi khuẩn trong khi sản phẩm nhân bản
lần II là đặc hiệu cho từng loài vi khuẩn. Theo công bố, quy trình đạt độ nhạy cao
(0,94) và độ đặc hiệu cao (0,96). Công trình trên đƣợc hoàn thiện bởi Backman & cs,
(1999) nhằm hạn chế các kết quả âm tính giả do tác động ức chế của các tạp chất có
mặt trong bệnh phẩm hoặc dƣơng tính giả do sự ngoại nhiễm, đồng thời bổ sung thêm
primer đặc hiệu để tăng phổ phát hiện của qui trình.
28
2.8.3. Gene 23S rRNA
Gần đây, đã có nhiều nghiên cứu đƣợc tiến hành trên trình tự của tiểu đơn vị
lớn (23S rRNA) ở vi khuẩn. Theo Rina Uzuka và cộng sự (2004), vùng 23S rRNA thể
hiện sự biến động giữa các loài hơn vùng 16S rRNA. Theo đó, có thể thiết kế mồi
chung (universal primer) dựa trên vùng bảo tồn và mồi chuyên biệt (specific primer)
dựa trên vùng biến động của trình tự 23S rRNA để phân biệt đƣợc các nhóm vi khuẩn
gây viêm màng não. Nếu thiết kế mồi trên trình tự 16S rRNA thì không có khả năng
phân biệt các loài trong nhóm vi khuẩn này. Nhóm tác giả sử dụng 10 loài vi khuẩn lấy
từ dịch não tủy của trẻ bị viêm màng não để nghiên cứu. Thiết kế mồi trong vùng
chung và vùng chuyên biệt của gene 23S rRNA. Sau đó khuếch đại những vùng này
bằng kỹ thuật multiplex PCR và real-time PCR. Kết quả, tất cả các vi khuẩn đều cho
một băng điện di của sản phẩm PCR chỉ sử dụng mồi chung. Haemophilus influenzae
và Streptococcus pneumoniae cho hai băng khi sử dụng phƣơng pháp PCR kết hợp
mồi chung và mồi chuyên biệt. Tác giả định lƣợng H. influenzae bằng phƣơng pháp
real-time PCR trong 15 phút. Nhƣ vậy ta có thể định danh và định lƣợng vi khuẩn có
trong dịch não tủy của bệnh nhân chỉ trong một thời gian ngắn (< 3 giờ).
Theo Rina Uzuka, vùng 23S rRNA thƣờng liên quan đến việc kháng kháng sinh
phân tử vòng lớn (macrolide antibiotic). Việc thiết kế các universal primer mới để
khuếch đại vùng 23S rRNA là rất hữu ích trong chẩn đoán các vi khuẩn kháng thuốc.
2.9. ĐIỀU TRỊ BỆNH VIÊM MÀNG NÃO MỦ BẰNG KHÁNG SINH
Việc phân chia vi khuẩn theo khả năng tác động của các nhóm kháng sinh có ý
nghĩa rất quan trọng. Nếu dùng đúng thuốc đặc trị cho từng vi khuẩn sẽ giúp cho việc
điều trị bệnh một cách hiệu quả. Ngƣợc lại dùng kháng sinh không đúng sẽ xảy ra tình
trạng lờn thuốc rất nguy hiểm.
Bảng 2.3. Các nhóm kháng sinh đặc trị vi khuẩn viêm màng não mủ
Vi khuẩn Chọn kháng sinh
S. pneumonia Vancomycin + Broad-spectrum cephalosporin
H. influenzae Ceftriaxone
N. meningitidis Penicillin G
L. monocytogenes Ampicillin + gentamicin
S. agalactiae Penicillin G
Enterobacteriaceae Broad-spectrum cephalosporin + aminoglycoside
Pseudomonas aeruginosa Ceftazidime + aminoglycoside
29
PHẦN 3: PHƢƠNG PHÁP VÀ CHƢƠNG
TRÌNH SỬ DỤNG
3.1. CÁC CHƢƠNG TRÌNH VÀ NGÔN NGỮ LẬP TRÌNH ĐƢỢC SỬ DỤNG
3.1.1. Hệ điều hành
Windows XP (Microsoft). Xây dựng CSDL gene 16S và 23S rRNA ở vi khuẩn
trên hệ điều hành này.
3.1.2. Các chƣơng trình phân tích trình tự
3.1.2.1. Chƣơng trình so sánh trình tự ClustalW
ClustalW là một phần mềm (chạy trên nền Dos) dùng để so sánh sự tƣơng
đồng của hai hay nhiều trình tự sinh học (pairswise or mutiple alignment). ClustalW
mô tả kết quả bằng hệ thống các kí hiệu làm nổi bật những nét đặc trƣng trong những
đoạn tƣơng đồng. ClustalW ngày càng trở nên hữu ích cho các nhà nghiên cứu trong
việc tìm kiếm những vùng bảo tồn trên những trình tự DNA hoặc protein. Sự hiểu biết
về mutiple alignment giúp ích rất nhiều cho các nhà khoa học trong việc dự đoán cấu
trúc bậc hai, bậc ba của protein, đồng thời phát hiện sự tƣơng đồng giữa những đoạn
gene (hoặc protein) vừa đƣợc giải trình tự với những gene (hoặc protein) đã có.
ClustalW tiến hành so sánh tƣơng đồng nhiều trình tự sinh học qua ba giai đoạn:
Đầu tiên chƣơng trình sử dụng thuật toán alignment xấp xỉ của Wilbur và
Lipman năm 1983 để tính hệ số tƣơng đồng giữa mỗi cặp trình tự.
Những hệ số tƣơng đồng tính đƣợc sẽ đƣợc sử dụng để thành lập cây phả hệ
(“Guide tree” hay “dendrogram”) bằng phƣơng pháp UPGM (Unweighted Pair –
Group Method) của Sneath và Sokal năm 1973.
Cuối cùng các trình tự đƣợc so sánh với những nhóm trình tự lớn hơn và cứ
thế tiếp tục. Ở mỗi giai đoạn so sánh, ClustalW sẽ sử dụng thuật toán của Myers và
Miller (1998) nhằm tối ƣu kết quả.
ClustalW 1.83 đƣợc sử dụng trong khóa luận này, có thể tải về từ trang web
(
30
3.1.2.2. Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST
BLAST là một chƣơng trình tìm kiếm và so sánh trình tự tƣơng đồng đƣợc
nhiều ngƣời dùng nhất hiện nay. Thuật toán của BLAST xuất phát từ ý tƣởng “liệu
trong ngân hàng dữ liệu (bao gồm cả CSDL cục bộ và những CSDL lớn trên thế giới
nhƣ GenBank, EMBL…) có trình tự nào giống hoặc gần giống với trình tự đang quan
tâm”. BLAST thực hiện so sánh trình tự nhập vào (có thể DNA hay protein) với những
trình tự trong CSDL. Kết quả của BLAST là những số liệu thống kê chính xác về tỉ lệ
tƣơng đồng và nguồn gốc các trình tự.
Chiến lƣợc tìm kiếm trình tự tƣơng đồng trong BLAST đƣợc thực hiện qua ba
bƣớc chính:
Đầu tiên BLAST tìm kiếm những đoạn tƣơng đồng HSPs (High Scoring Pair)
giữa một trình tự đƣa vào và mỗi trình tự trong CSDL.
Công việc tiếp theo là thực hiện đánh giá ý nghĩa thống kê dựa trên bất cứ sự
tƣơng đồng nào đƣợc tìm thấy.
Sau cùng BLAST đƣa ra một báo cáo kết quả giống nhau thỏa mãn ngƣỡng giá
trị mà ngƣời dùng mong muốn.
Stand-alone BLAST version 2.28 là phiên bản đƣợc sử dụng trong khóa luận
này, có thể tải về từ địa chỉ web của trang CSDL NCBI
(ftp://ftp.ncbi.nih.gov.blast/executables/).
3.1.3. Hệ quản trị CSDL quan hệ MySQL
MySQL là một hệ quản trị CSDL quan hệ nguồn mở phổ biến nhất, dƣới sự
phát triển, phân phối và bảo vệ bởi MySQL AB (MySQL AB là một công ty thƣơng
mại). Phần SQL của MySQL đƣợc viết tắt từ chữ “Structure Query Language”. SQL là
một ngôn ngữ chuẩn đƣợc dùng phổ biến để xây dựng CSDL và đƣợc cơ quan tiêu
chuẩn SQL là ANSI/ISO công nhận.
Xuất xứ của tên MySQL không rõ. Tiền tố My của MySQL chỉ xuất hiện cách
đây khoảng 10 năm nay, có lẽ nó đƣợc lấy từ tên con gái của Monty Widenius (ngƣời
đặt nền móng cho sự phát triển của MySQL). MySQL đƣợc viết dựa trên ngôn ngữ C
và C++, hoạt động trên nhiều hệ điều hành khác nhau. Phiên bản mới nhất của MySQL
là MySQL 5.0.
– Ƣu điểm.
Dễ sử dụng.
31
Mã nguồn mở.
Thích hợp cho việc xây dựng CSDL vừa và nhỏ.
– Nhƣợc điểm:
Không thích hợp cho việc xây dựng CSDL lớn.
Phiên bản MySQL 4.0.15 đƣợc sử dụng trong khóa luận.
3.1.4. Apache web server
Trên thế giới hiện nay có rất nhiều trình chủ web hỗ trợ CGI và một trong số đó
là Apache web Server. Apache web Server là một trình chủ web đƣợc nhiều ngƣời
dùng nhất hiện nay trên Internet. Theo số liệu thăm dò của NetCraft, có trên 60% trình
chủ web đang đƣợc sử dụng trên Internet hiện nay là sử dụng Apache web Server. Sở
dĩ Apache có đƣợc một vị trí đáng nể nhƣ thế là nhờ vào việc nó là một chƣơng trình
mã nguồn mở và hoàn toàn miễn phí. Hai ƣu điểm này đã giúp Apache đƣợc yêu thích
đối với những công việc vừa và lớn của nhiều công ty trên thế giới. Hơn thế, Apache
hoạt động ổn định, an toàn và đáng tin cậy. Chỉ trong thời gian 5 năm qua, Apache đã
trở thành một trình chủ web có chức năng tƣơng đƣơng, thậm chí còn vƣợt trội so với
nhiều trình chủ web thƣơng mại khác.
Một trong những điểm mạnh của Apache là khả năng nâng cấp trình chủ web
thông qua các module. Có 2 loại module trong Apache đó là external module và
internal module. Cả hai loại module này đều có thể đƣợc sửa chữa, thay thế hoặc nâng
cấp vì chúng có kèm theo mã nguồn mở. Khi một yêu cầu từ trình tự khách đƣợc gởi
đến Apache phải trải qua một loạt nhiều giai đoạn xử lý để cuối cùng trả về kết quả
cho ngƣời dùng.
Apache có một chế độ bảo mật đáng tin cậy. Quy trình làm việc của Apache
cho phép ngƣời dùng thêm mới những module cần thiết vào bất kỳ giai đoạn nào của
quá trình xử lý.
Apache 1.3.24 là phiên bản đƣợc sử dụng trong khóa luận này, có thể tải phiên
bản này từ địa chỉ (
3.1.5. Ngôn ngữ lập trình Perl và các gói sử dụng
Trình phiên dịch Perl phiên bản 5.6
DBI: version 1.37
32
DBD::MySQL version 2.9002
CGI.pm version 2.752
Các gói này đƣợc cài đặt thông qua ppm trong Perl.
3.1.6. Chƣơng trình thiết kế mồi Primrose 2.17
Primrose là một chƣơng trình máy tính dùng để thiết kế các mẫu dò (probe) hoặc
đoạn mồi (primer) cho phản ứng PCR. Mặc dù chủ yếu sử dụng dữ liệu trình tự rRNA
trong tiểu đơn vị nhỏ của ribosome, Primrose vẫn có thể thiết kế các mẫu dò hay mồi
cho nhiều gene khác. Có thể tải chƣơng trình này về từ địa chỉ trang web sau:
Để thiết kế một mồi hoặc probe phải trải qua bốn bƣớc chính.
– Xây dựng CSDL: tạo một CSDL trình tự từ một hoặc nhiều file trình tự.
– Chọn trình tự đích: chỉ ra các trình tự trong CSDL mà mồi hoặc mẫu dò đƣợc
tạo ra từ các trình tựu này.
– Tạo mẫu dò hoặc mồi: tìm ra các đoạn oligonucleotide mà có thể bắt đƣợc với
trình tự đích.
– Kiểm tra các mẫu dò hay mồi trên CSDL: kiểm tra tất cả các mẫu dò hay mồi
tạo đƣợc trên CSDL trình tự để tìm mồi hoặc mẫu dò tốt nhất. Những mẫu dò
hay mồi tốt nhất bắt cặp nhiều nhất với trình tự đích và bắt cặp ít nhất với trình
tự không mong muốn.
33
3.2. PHƢƠNG PHÁP
3.2.1. Thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai
gene 16S và 23S rRNA
Sơ đồ tóm tắt quá trình thu nhận nhƣ sau:
Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA
Các bƣớc thực hiện cụ thể nhƣ sau:
– Từ trình duyệt web ta vào trang Home Page của NCBI theo địa chỉ:
. Trong khung Search chọn Nucleotide.
– Nhập từ khóa tìm kiếm trong khung for
Từ khóa sử dụng lần lƣợt cho từng gene là:„16S ribosomal RNA gene complete
sequence NOT 23S‟ và „23S ribosomal RNA gene complete sequence NOT 16S‟
– Nhấn nút Go hoặc Enter để tìm kiếm.
Dùng Perl script tải về tất
cả các trình tự có
ACCESSION NUMBER
của hai gene 16S và 23S
rRNA
TỪ KHÓA
ACCESSION NUMBER
NCBI
Toàn bộ thông tin về trình
tự gene 16S và 23S rRNA
34
Hình 3.1. Tìm kiếm bằng từ khóa trong trang Home Page của NCBI
Kết quả tìm kiếm đƣợc trình bày nhƣ hình sau
Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa cho gene 16S rRNA
– Trong khung Show thay Send to bằng Text
35
Hình 3.3. Kết quả tìm kiếm thể hiện ở dạng text
– Chỉ chọn những mã số truy cập có phần tóm tắt phía dƣới là “complete
sequence”, không lấy những mã số truy cập có phần tóm tắt là “partial sequence”.
– Dùng ngôn ngữ Perl để viết script tách lấy tất cả mã số truy cập và lƣu vào
một file dạng (.txt)
Hình 3.4. File text chứa mã số truy cập
– Từ những mã số truy cập tách đƣợc ở bƣớc trên viết script kết nối với CSDL
GenBank, tải về những mẫu tin chứa trình tự và thông tin liên quan của gene.
36
Tất cả các mẫu tin tải về đƣợc lƣu trong hai thƣ mục tƣơng ứng cho hai gene.
Hình 3.5. Tất cả mẫu tin của gene 16S rRNA
37
Chi tiết một mẫu tin thu đƣợc nhƣ hình dƣới đây
Hình 3.6. Một mẫu tin của gene 16S rRNA có mã số truy cập AB016268
LOCUS AB016268 1524 bp DNA linear BCT 10-MAY-2000
DEFINITION Alteromonas sp. gene for 16S rRNA, strain NIBH P3M26, complete
sequence.
ACCESSION AB016268
VERSION AB016268.1 GI:6691642
KEYWORDS 16S rRNA; 16S ribosomal RNA.
SOURCE Alteromonas sp.
ORGANISM Alteromonas sp.
Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales;
Alteromonadaceae; Alteromonas.
REFERENCE 1 (sites)
AUTHORS Maruyama,A., Honda,D., Yamamoto,H., Kitamura,K. and Higashihara,T.
TITLE Phylogenetic analysis of psychrophilic bacteria isolated from the
Japan Trench, including a description of the deep-sea species
Psychrobacter pacificensis sp. nov
JOURNAL Int. J. Syst. Evol. Microbiol. 50 Pt 2, 835-846 (2000)
PUBMED 10758895
REFERENCE 2 (bases 1 to 1524)
AUTHORS Maruyama,A. and Kitamura,K.
TITLE Direct Submission
JOURNAL Submitted (16-JUL-1998) Akihiko Maruyama, National Institute of
Bioscience and Human-Technology, Department of Applied and
Environmental Microbiology; 1-1 Higashi, Tsukuba, Ibaraki 305-8566,
Japan (E-mail:maruyama@nibh.go.jp, Tel:+81-298-54-6062,
Fax:+81-298-54-6412)
FEATURES Location/Qualifiers
source 1..1524
/organism="Alteromonas sp."
/mol_type="genomic DNA"
/strain="NIBH P1M3"
/db_xref="taxon:232"
rRNA 1..1524
/product="16S ribosomal RNA"
ORIGIN
1 agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc
61 ggtaacagaa agtagcttgc tactttgctg acgagcggcg gacgggtgag taatgcttgg
121 gaacatgcct tgaggtgggg gacaacagtt ggaaacgact gctaataccg cataatgtct
181 acggaccaaa gggggctcgc tctcgccttt agattggccc aagtgggatt agctagttgg
241 tgaggtaatg gctcaccaag gcaacgatcc ctagctggtt tgagaggatg accagccaca
301 ctggaactga gacacggtcc agactcctac gggaggcagc agtggggaat attgcacaat
361 gggcgaaatg atgcagccat gccgcgtgtg tgaagaaggc cttcgggttg taaagcactt
421 tcagtcagga ggaaagggtg tnagttaata cctcatatct ntgacgttac tgacagaaga
481 agcaccggct aactccgtgc cagcagccgc ggtaatacgg agggtgcgag cgttaatcgg
541 aattactggg cgtaaagcgt acgcaggcgg tttgttaagc gagatgtgaa agccccgggc
601 tcaacctggg aactgcattt cgaactggca aactagagtg tgatagaggg tggtagaatt
661 tcaggtgtag cggtgaaatg cgtagagatc tgaaggaata ccgatggcga aggcagccac
721 ctgggtcaac actgacgctc atgtacgaaa gcgtggggag caaacgggat tagatacccc
781 ggtagtccac gccgtaaacg atgtctacta gaagctcgga acctcggttc tgtttttcaa
841 agctaacgca ttaagtagac cgcctgggcg agtacggccg caaggttaaa actcaaatgg
901 attgacgggg gcccgcacaa gcggtggagc atgtngttta attcgatgca acgcgaagaa
961 ccttacctac acttgacata cagagaactt tctagagata gattggtgcc ttcgggaact
1021 ctgatacagg tgctgcatgg ctgtcgtcag ctcgtgttgt gagatgttgg gttaagtccc
1081 gcaacgagcg caacccctat ccttagttgc tagcaggtaa tgctgagaac tctaaggaga
1141 ctgccggtga taaaccggag gaaggtgggg acgacgtcaa gtcatcatgg cccttacgtg
1201 tagggctaca cacgtgctac aatggcgcat acagagtgct gcgaacctgc gaaggtaagc
1261 gaatcactta aagtgcgtcg tagtccggat tggagtctgc aactcgactc catgaagtcg
1321 gaatcgctag taatcgcgta tcagaatgac gcggtgaata cgttcccggg ccttgtacac
1381 accgcccgtc acaccatggg agtgggttgc tccagaagta gatagtctaa ccctcgggag
1441 gacgtttacc acggagtatt catgactggg gtgaagtcgt aacaaggtag ccctagggga
1501 acctggggtt ggatcacctc ctta
//
38
3.2.3. Thiết kế CSDL gene 16S và 23S rRNA
3.2.3.1. Phân tích dữ liệu
Dữ liệu về trình tự nucleotide của gene 16S và 23S rRNA gồm có hai thực thể
chính cần quan tâm là Trình tự (Sequence) và Sinh vật (Organism). Nhƣ vậy, ta có thể
xác định đƣợc sơ đồ đối tƣợng nhƣ sau:
Sơ đồ các đối tượng chính trong CSDL hai gene 16S và 23S rRNA
Bảng 3.1. Các đối tượng phụ dựa trên đối tượng chính sinh vật (Organism)
Tên đối
tƣợng
Ý nghĩa của
đối tƣợng
Thuộc tính Ý nghĩa của thuộc tính
Organism
Chứa các đặc
điểm về các
loài,
thông tin về
quan hệ họ
hàng
Organism_name Chứa tên của các loài vi khuẩn
Nucleic acid
Mô tả về trạng thái DNA và
kích thƣớc genome
Taxonomy Đặc điểm phân loại học
Acc
Chứa số truy
cập trên
NCBI
Acc_no Các số truy cập
Mối quan hệ của các thông tin này là: một sinh vật có thể có nhiều gene (mỗi
trình tự thì chỉ có một accession number) và một sinh vật có những đặc điểm (phân
loại…) riêng biệt.
Sinh vật Trình tự
có
39
Bảng 3.2. Các đối tượng phụ dựa trên đối tượng chính trình tự (sequence)
Mối quan hệ của các thông tin này là một trình tự của đối tƣợng Sequence chỉ
có một accession number, một thông tin chung về trình tự đó. Nhƣng có một hay nhiều
tác giả cũng nhƣ một hay nhiều bài báo về trình tự đó.
3.2.3.2. Thiết kế CSDL dạng bảng
Theo các mô tả trong mô hình đối tƣợng, ta chuyển từ mô hình đối tƣợng
sang mô hình quan hệ nhƣ sau:
– Mỗi đối tƣợng trong mô hình đối tƣợng là một quan hệ trong mô hình quan hệ.
– Mỗi thuộc tính trong mô hình đối tƣợng là thuộc tính trên quan hệ tƣơng ứng.
– Khóa của đối tƣợng là khóa của quan hệ tƣơng ứng.
Tạo các quan hệ nhƣ sau:
1:1 đặt khóa chính của quan hệ thứ nhất thành khóa ngoại của quan hệ thứ hai
và ngƣợc lại.
Tên đối
tƣợng
Ý nghĩa của đối tƣợng Thuộc tính Ý nghĩa của thuộc tính
Gene_seq Chứa trình tự nucleotide
Gene_name Chứa tên trình tự nucleotide
Gene_seq Chứa trình tự nucleotide
Length Chứa chiều dài của gene
Accession
number
Chứa số truy cập của
các trình tự trong CSDL
Acc_no Là các số truy cập
NCBI
Các thông tin chung cho
trình tự
Các thông tin về tác giả
giải trình tự và những
bài báo của tác giả về
các trình tự đó
Definition Định nghĩa của trình tự
Pubday Ngày công bố trình tự
Author Tác giả của trình tự
Title
Bài báo của tác giả về trình
tự
Journal Tạp chí đăng tải bài báo
40
1: n đặt khóa chính của quan hệ ở đầu một thành khóa ngoại của quan hệ ở
đầu n.
Ta có sơ đồ chi tiết của các bảng quan hệ nhƣ sau:
Sơ đồ chi tiết các bảng quan hệ
Bƣớc tiếp theo là thiết kế các bảng này ở mức vật lý, nghĩa là đƣa vào hệ quản
trị CSDL quan hệ MySQL bằng các ngôn ngữ truy vấn SQL nhƣ tạo CSDL, tạo
bảng…
1
1
1
1
1 1
1
ACCS_TABLE
acc_id
acc_no
species_id
gi
DEFINITION_TABLE
definition_id
definition
seq_id
SPECIES_TABLE
species_id
species
SEQS_TABLE
seq_id
seq
length
acc_id
gene_id
NCBI_TABLE
ncbi_id
author
title
journal
pub_day
seq_id
TAXONOMY_TABLE
taxonomy_id
taxonomy
seq_id
GENE_TABLE
gene_id
gene_name
seq_id
n
1
1
1
1
41
Hình 3.7. Thiết kế CSDL ở mức vật lý
3.2.3.3. Lƣu trữ các thông tin vào CSDL
Sau khi CSDL đƣợc thiết kế ở mức vật lý, ta thực hiện việc đƣa các dữ liệu
vào CSDL. Công việc này đƣợc thực hiện tự động cùng một lúc tất cả các quan hệ
bằng Perl script và thông qua hai gói DBI, DBD::MySQL để kết nối với CSDL.
– Lƣu trữ các trình tự, thông tin chung, tác giả và bài báo…
Một mẫu tin về trình tự gene 16S hay 23S rRNA đƣợc trình bày nhƣ Hình 3.6. ta
có thể rút trích các thông tin trong mẫu tin để đƣa vào CSDL.
Trong phần LOCUS: lấy ngày tháng “02-MAR-2000 “ cho vào trƣờng pubday
trong bảng ncbi_table, lấy chiều dài “1524” cho vào trƣờng length trong bảng
seqs_table.
Trong phần DEFINITION: lấy toàn bộ phần này cho vào trƣờng definition
trong bảng definition_table.
Phần ACCESSION: lấy số truy cập này cho vào trƣờng acc_no của bảng
accs_table.
Phần ORGANISM: tách lấy dòng đầu tiên để cho vào trƣờng species trong
bảng species_table và các dòng còn lại cho vào trƣờng taxonomy trong bảng
taxonomy_table.
42
Phần AUTHOR, TITLE, JOURNAL lần lƣợt cho vào trƣờng author, title,
journal của bảng ncbi_table.
Phần ORIGIN: cho vào trƣờng seq của bảng seqs_table.
– Lƣu trữ thông tin trong bảng gene_name
Vì chúng ta xây dựng CSDL cho 2 gene 16S rRNA và 23S rRNA nên trong trƣờng
gene_name ở bảng gene_table ta sẽ có 2 thông tin đó là “16S rRNA” và “23S rRNA”
và trƣờng gene_id là “1” cho gene 16S rRNA và “2” cho gene 23S rRNA.
3.2.4. Tích hợp CSDL gene 16S rRNA và 23S rRNA với trang web
Nhằm mục đích cung cấp giao diện cho ngƣời sử dụng truy xuất thông tin, chia
sẻ CSDL trực tuyến, CSDL gene 16S rRNA và 23S rRNA đƣợc tích hợp với web bằng
giao thức CGI. Bên cạnh đó, việc tích hợp với web cũng nhằm cung cấp một vài công
cụ phân tích trình tự sinh học để hỗ trợ cho việc truy xuất thông tin tốt hơn.
Tiến trình ngƣời sử dụng lấy thông tin từ CSDL về hai gene trên đƣợc thực hiện
ở hình 3.6 gồm các bƣớc nhƣ sau:
Thông qua giao thức truyền siêu văn bản HTTP, trình chủ web Apache nhận
thông tin từ yêu cầu trình duyệt, sau đó xử lý và chuyển đến script CGI.
Từ yêu cầu đƣa vào, sử dụng ngôn ngữ truy vấn SQL và các hàm trong
module DBI, DBD::MySQL để lấy kết quả trong CSDL của hai gene trên.
Kết quả đƣợc script CGI chuyển đến trình chủ Apache. Sau đó Apache
chuyển thông tin kết quả lên trình duyệt của ngƣời sử dụng.
Hình 3.8. Tiến trình lấy thông tin từ CSDL hai gene ở vi khuẩn
3.3. Thiết kế mồi cho phản ứng PCR phát hiện vi khuẩn viêm màng não
Chúng tôi sử dụng trình tự của gene 16S và 23S rRNA để thiết kế mồi thông
qua chƣơng trình thiết kế mồi Primrose, cụ thể để phát hiện Streptococcus pneumoniae
(tác nhân chiếm khoảng 17%) trong nhóm các vi khuẩn viêm màng não mủ.
Trình duyệt client
CSDL
HAI
GENE
Trình chủ web Apache
* Nhận và xử lý yêu
cầu
* Tƣơng tác CSDL
* Trả kết quả
PERL
DBI, CGI
DBD::MySQL
Kết quả
Yêu cầu
43
3.3.1 Thiết kế mồi dựa trên trình tự gene 16S rRNA
Từ cửa sổ chính của chƣơng trình Primrose thực hiện từng bƣớc cụ thể nhƣ sau
– Tạo CSDL: Đƣa vào các file chứa trình tự của tất cả các vi khuẩn viêm
màng não mủ ở định dạng fasta (.fas).
Hình 3.9. Tạo CSDL trình tự gene 16S rRNA ở các vi khuẩn viêm màng não
– Chọn trình tự đích: ở đây chúng ta muốn phát hiện Streptococcus
pneumoniae nên chọn trình tự đích là file Strepcococcus pneumoniae.fas
Hình 3.10. Chọn trình tự đích trong thiết kế mồi phát hiện Streptococcus pneumoniae
dựa trên gene 16S rRNA.
– Tạo mồi: chúng ta xác định các thông số nhƣ chiều dài mồi, số base đƣợc
cho phép biến đổi trong mồi…Chọn thẻ “Find oligonucleotide” để chƣơng
trình tìm ra các mồi có thể có.
44
Hình 3.11. Xác định các thông số cho mồi và số lượng mồi được tạo ra trên trình tự
đích 16S rRNA
– Kiểm tra lại tất cả các mồi với các trình tự trong CSDL đƣợc tạo ở bƣớc
đầu tiên. Chƣơng trình sẽ loại bỏ các mồi bắt cặp với trình tự ngoài trình
tự đích và trình bày danh sách các mồi thích hợp.
Hinh 3.12. Danh sách các mồi thiết kế được trên 16S rRNA
Việc tổ hợp các mồi đơn này thành một cặp mồi để thực hiện các phản ứng
PCR phụ thuộc vào nhiều yếu tố nhƣ chiều dài sản phẩm PCR, tính chuyên biệt của
cặp mồi và sự tƣơng thích giữa hai mồi…
Ở đây chúng tôi chọn một cặp mồi cho đoạn sản phẩm có kích thƣớc vào
khoảng 300-400 bp.
45
Mồi xuôi: đoạn oligonnucleotide 68 trong danh sách.
Forward primer 16S 5‟-AGAGGGGAGAGTGGAATTCC-3‟(sense)
Mồi ngƣợc: đoạn oligonnucleotide 166
Reverse primer 16S 5‟-TTGACATCCCTCTGACSRCT-3‟ (sense)
Trong đó S = (G hoặc C)
R = (A hoặc G)
Nhấp đúp chuột vào trình tự từng mồi để biết đƣợc các thông tin chi tiết nhƣ vị trí bắt
cặp của mồi trên trình tự đích, số base trong mồi không bắt cặp (mismatch)…
Hình 3.13. Vị trí bắt cặp của mồi xuôi trên trình tự đích 16S rRNA
46
Hình 3.14. Vị trí bắt cặp của mồi ngược trên trình tự đích 16S rRNA
Kiểm tra lại sự bắt cặp của cặp mồi này trên trình tự đích
Hinh 3.15. Kiểm tra sự bắt cặp của mồi ngược và mồi xuôi trên trình tự đích 16S
rRNA
47
Hình 3.16. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngược trên trình tự đích gene
16S rRNA
3.3.2. Thiết kế mồi dựa trên trình gene 23S rRNA
– Tạo CSDL: chọn các file trình tự gene 23S rRNA ở vi khuẩn viêm màng
não mủ.
– Xác định trình tự đích: tƣơng tự nhƣ ở gene 16S rRNA ta chọn trình tự
gene 23S rRNA ở Streptococcus pneumoniae.
– Các bƣớc tạo mồi, kiểm tra mồi tƣơng tự các bƣớc đã tiến hành cho gene
16S rRNA.
Sau khi kiểm tra loại bỏ các mồi bắt cặp với trình tự ngoài trình tự đích (gene
23S rRNA ở Streptococcus pneumoniae) ta có danh sách các mồi phù hợp
48
Hình 3.17. Danh sách các mồi thiết kế được cho trình tự gene 23S rRNA ở
Streptococcus pneumoniae
Chúng tôi chọn một cặp mồi cho đoạn sản phẩm có kích thƣớc vào khoảng 300-400 bp.
Mồi xuôi: đoạn oligonnucleotide 190 trong danh sách.
Forward primer 23S 5‟- AAGCGATTGCCTTAGTAGCG -3‟(sense)
Mồi ngƣợc: đoạn oligonnucleotide 426
Reverse primer 23S 5‟- CGGGAGGGGAGTGAAATAGA-3‟ (sense)
Nhấp đúp chuột vào trình tự từng mồi để biết đƣợc các thông tin chi tiết nhƣ vị trí bắt
cặp của mồi trên trình tự đích, số base trong mồi không bắt cặp (mismatch),…
49
Hình 3.18. Vị trí bắt cặp của mồi xuôi trên trình tự đích 23S rRNA
Hình 3.19. Vị trí bắt cặp của mồi ngược trên trình tự đích 23S rRNA
Kiểm tra lại sự bắt cặp của cặp mồi tổ hợp với trình tự đích (gene 23S rRNA trên
Streptococcus pneumoniae)
50
Hình 3.20. Kiểm tra sự bắt cặp của mồi ngược và mồi xuôi trên trình tự đích 23S
rRNA
Hình 3.21. Kết quả kiểm tra sự bắt cặp mồi xuôi và mồi ngược trên trình tự đích gene
23S rRNA
51
3.3.3. Nhiệt độ nóng chảy của mồi
Sử dụng chƣơng trình TmCheck đi kèm trong Primrose để tính nhiệt độ nóng
chảy của mồi theo phƣơng pháp “Nearest Neighbour”.
Hình 3.22. Tính nhiệt độ nóng chảy của mồi xuôi 16S
Tƣơng tự ta tính nhiệt độ nóng chảy của mồi còn lại.
52
PHẦN 4: KẾT QUẢ VÀ THẢO LUẬN
4.1. Kết quả thu nhận các mẫu tin chứa trình tự và thông tin liên quan của hai
gene 16S và 23S rRNA
Sau khi thực hiện các bƣớc tìm kiếm bằng từ khóa, tách mã số truy cập, viết mã
script tải các mẫu tin trên trang NCBI. Kết quả chúng tôi đã thu nhận đƣợc 2825 mẫu
tin chứa trình tự và thông tin liên quan đến gene 16S rRNA và 305 mẫu tin liên quan
đến gene 23S rRNA.
4.2. CSDL gene 16S và 23S rRNA
CSDL chứa 1616 loài vi khuẩn, 2825 trình tự gene 16S rRNA và 305 trình tự
gene 23S rRNA.
Trong CSDL ngoài hai đối tƣợng chính thì còn chứa đối tƣợng phụ nhằm cung
cấp các thông tin khác để bổ sung cho hai đối tƣợng chính nhƣ: tên tác giả, tên bài báo,
phân loại…
CSDL về hai gene 16S rRNA và 23S rRNA, rất tiện ích cho việc truy xuất,
nghiên cứu các thông tin liên quan đến trình tự DNA, các đặc trƣng của từng loài chứa
hai gene này, tiết kiệm thời gian tìm hiểu, nắm bắt thông tin nhanh. CSDL này đƣợc
xây dựng trên hai gene khá bảo tồn ở vi khuẩn nên chúng ta có thể dựa vào các thông
tin trong CSDL để nghiên cứu các hiện tƣợng biến chủng trong họ, giúp đƣa ra các kết
luận chính xác về các biến chủng xảy ra ở trên hai gene này. Nhƣng CSDL nhỏ, chứa
lƣợng thông tin ít và chƣa có chế độ bảo mật. Ở cấp độ phòng thí nghiệm, cơ quan
nghiên cứu hay trƣờng đại học thì việc xây dựng CSDL cho từng đối tƣợng (về một
gene, một sinh vật…) thì rất tiện ích để phục vụ cho các nghiên cứu về một đối tƣợng
nhất định.
4.3. Trang web thể hiện thông tin CSDL gene 16S và 23S rRNA.
Sơ đồ các trang web CSDL gene 16S và 23S rRNA nhƣ sau:
53
Sơ đồ cấu trúc các trang web thể hiện thông tin CSDL gene 16S và 23S rRNA
16S and 23S rRNA
gene DATABASE
WEB PAGE
HOME
PAGE
ABOUT
PAGE
LINK
PAGE
TOOL
PAGE
BLAST
ALIGNMENT
SEARCH
PAGE
SPECIES ACCESSION
NUMBER
MENINGITIDIS
54
4.3.1. Trang thông tin chung về CSDL gene 16S và 23S rRNA (Home Page)
– Nội dung trang web: thể hiện số lƣợng trình tự của từng gene chứa trong
CSDL. Từ trang Home Page này có thể xem tất cả các thông tin tổng quát của từng
gene bằng cách nhấp chuột vào các liên kết đến từng trang CSDL 16S rRNA hoặc 23S
rRNA.
– Hình thức thể hiện (Hình 4.1)
Hình 4.1. Trang Home Page
55
4.3.2. Trang tìm kiếm (Search Page)
Cung cấp cho ngƣời dùng 2 công cụ tìm kiếm trình tự và các thông tin liên quan
của 2 gene có trong CSDL.
– Trang tìm kiếm khi biết mã số truy cập (accession number)
Ngƣời dùng có thể nhập một hoặc nhiều mã số này, để tìm các trình tự
nucleotide có mã số tƣơng ứng (Hình 4.2).
Ngƣời dùng có thể tùy chọn các phần sẽ hiển thị trong kết quả tìm kiếm
nhƣ phần định nghĩa trình tự (definition), tên loài (species), chiều dài của trình tự cần
tìm (Hình 4.3)
Hình 4.2. Trang tìm kiếm theo mã số truy cập (accession number)
56
Hình 4.3. Trang kết quả tìm kiếm bằng mã số truy cập
– Trang tìm kiếm khi biết tên loài (species name)
Tất cả tên của vi khuẩn có trong CSDL đƣợc thể hiện trong menu
SPECIES NAME(s). Chúng ta có thể chọn một hoặc nhiều tên để tìm kiếm trình tự và
các thông tin liên quan đến gene 16S và 23S rRNA ở sinh vật đó (Hình 4.4).
Ngƣời dùng có thể tùy chọn các phần sẽ hiển thị trong kết quả tìm kiếm
(Hình 4.5).
57
Hình 4.4. Trang tìm kiếm theo tên loài (species name)
Hình 4.5. Trang kết quả tìm kiếm theo tên loài (species name)
58
4.3.3. Trang công cụ (Tool Page)
– Nội dung trang web: trang này cung cấp hai công cụ chủ yếu để phân tích
trình tự sinh học, đó là sắp gióng cột (alignment) và tìm kiếm trình tự tƣơng đồng
(BLAST).
Sắp gióng cột (alignment) hai hay nhiều trình tự là một công cụ khá thông dụng
để khảo sát sự tƣơng đồng, đột biến, nghiên cứu chức năng của gene. Mặt khác để tìm
trình tự tƣơng đồng với một trình tự quan tâm, các nhà sinh học thƣờng sử dụng công
cụ BLAST. Do nhu cầu đó, chúng tôi đã tích hợp hai công cụ này vào trang web
CSDL gene 16S và 23S rRNA.
– Hình thức thể hiện:
Với công cụ Alignment: ngƣời sử dụng có thể nhập vào một hay nhiều trình
tự DNA thông qua ô nhập văn bản hay một tập tin chứa trình tự DNA dƣới định dạng
FASTA. Chọn một hay nhiều trình tự trong CSDL gene 16S và 23S rRNA để thực
hiện sắp gióng cột (có thể thực hiện Alignment giữa các gene trong CSDL) (Hình 4.6).
Hình 4.6. Trang công cụ sắp gióng cột (Alignment)
59
Hình 4.7. Trang kết quả sắp gióng cột hai trình tự
Với công cụ BLAST: ngƣời dùng có thể nhập vào một trình tự DNA. Trình tự
này sẽ đƣợc so sánh tƣơng đồng cục bộ với CSDL của trình tự gene 16S và 23S rRNA.
(Hình 4.8).
Hình 4.8. Trang công cụ BLAST
60
4.3.4. Trang Meningitidis
– Nội dung trang web: liệt kê các vi khuẩn viêm màng não mủ. Ngƣời dùng có
thể chọn một hoặc nhiều trình tự của các vi khuẩn này cho việc thiết kế mồi.
– Hình thức thể hiện: Hình 4.9
Hình 4.9. Trang Meningitidis
4.4. Kết quả thiết kế mồi phát hiện các tác nhân viêm màng não mủ
Theo các bƣớc tiến hành nhƣ phần 3.3. chúng ta thu đƣợc hai cặp mồi cho phản
ứng PCR phát hiện Streptococcus pneumoniae dựa trên hai gene 16S và 23S rRNA.
Tuy nhiên các mồi ngƣợc đều đƣợc viết theo chiều 5‟-3‟ trên sợi sense. Do đó, chúng
ta phải chuyển các mồi này theo chiều 5‟-3‟ trên sợi antisense bằng cách dịch sang
trình tự ngƣợc và bổ sung (Reverse complement).
Trình tự các cặp mồi thiết kế đƣợc cho từng gene nhƣ sau
Gene 16S rRNA Gene 23S rRNA
F 5‟-3‟sense AGAGGGGAGAGTGGAATTCC AAGCGATTGCCTTAGTAGCG
R 5‟-3‟antisense AGYSGTCAGAGGGATGTCAA TCTATTTCACTCCCCTCCCG
Trong đó S = (C hoặc G)
Y = (T hoặc C)
So sánh cặp mồi cho gene 16S rRNA với cặp mồi cho gene 23S rRNA
– Tính chuyên biệt
Kết quả bắt cặp của cặp mồi 16S rRNA với trình tự đích và trình tự ngoài vùng
đích.
61
Hình 4.10. Sự bắt cặp của cặp mồi 16S rRNA trên trình tự đích và trình tự ngoài vùng
đích
Hình 4.11. Sự bắt cặp của cặp mồi 23S rRNA trên trình tự đích và trình tự ngoài vùng
đích
62
Nếu có 0 đến 2 mismatch: hai cặp mồi bắt cặp hoàn toàn với vùng đích (target).
Nếu có trên 2 mismatch: số lƣợng trình tự ngoài vùng đích (non-target) mà hai
mồi có khả năng bắt cặp tăng lên. Tuy nhiên, số lƣợng trình tự này ở cặp mồi cho gene
16S rRNA lớn hơn rất nhiều so với cặp mồi cho gene 23S rRNA. Điều này có nghĩa là
tính chuyên biệt của cặp mồi gene 16S rRNA thấp hơn cặp mồi cho gene 23S rRNA.
– Sự tƣơng thích giữa mồi ngƣợc và mồi xuôi trong từng cặp mồi
Theo việc tính toán nhiệt độ nóng chảy (Tm) đã thực hiện ở mục 3.3.3. ta tính đƣợc
nhiệt độ nóng chảy cho các mồi còn lại.
Mồi Tm (
o
C) %GC
Forward primer 16S 51,3 55
Reverse primer 16S 47,5 52,5
Forward primer 23S 52,6 50
Reverse primer 23S 53,5 55
– Nhiệt độ bắt cặp (Tanneal = Tm – 4) thể hiện sự tƣơng thích giữa hai mồi. Sự
chênh lệch giữa Tanneal của mồi ngƣợc và mồi xuôi thích hợp là 3
oC. Nhiệt độ bắt cặp
của hai mồi càng gần nhau thì phản ứng PCR diễn ra càng tốt.
Chênh lệch nhiệt độ bắt cặp (ΔTanneal) giữa mồi xuôi và mồi ngƣợc trong từng cặp mồi:
ΔTanneal 16S = 51,3 –
Các file đính kèm theo tài liệu này:
- LE VAN TAM - 02126088.pdf