Tin sinh học. Медицинский портал Vrachi.name

Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

Tin sinh học

Подписчиков: 0, рейтинг: 0

Hóa sinh
Đây là một trong loạt bài về

Các nét quan trọng
Phân tử sinh học Trao đổi chất
Mục lục Nét chính
Lịch sử và chủ đề
Lịch sử
Hóa sinh Sinh học tế bào Tin sinh học Enzyme Di truyền học Miễn dịch học Sinh học phân tử Hóa sinh thực vật Sinh học cấu trúc
Các nhánh hóa sinh
Danh sách các nhà hóa sinh học
Thuật ngữ
Thuật ngữ sinh học Thuật ngữ hóa học
Lĩnh vực: Sinh học, Sinh học phân tử, tế bào
x t s

Tin sinh học (bioinformatics) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa học và hóa sinh (biochemistry) để giải quyết các vấn đề sinh học. Một thuật ngữ thường được dùng thay thế cho tin sinh học là sinh học tính toán (computational biology). Tuy nhiên, tin sinh học thiên về việc phát triển các giải thuật, lý thuyết và các kĩ thuật thống kê và tính toán để giải quyết các bài toán bắt nguồn từ nhu cầu quản lý và phân tích dữ liệu sinh học. Trong khi đó, sinh học tính toán thiên về kiểm định các giả thuyết (hypothesis) được đặt ra của một vấn đề trong sinh học nhờ máy tính thực nghiệm trên dữ liệu mô phỏng, với mục đích chính là phát hiện và nâng cao tri thức về sinh học (ví dụ: dự đoán mối quan hệ tương tác giữa các protein, dự đoán cấu trúc bậc 2 phân tử của protein, v.v.).

Do đó, các nghiên cứu trong ngành sinh học tính toán (computational biology) thường trùng lặp với sinh học hệ thống (systems biology). Những lĩnh vực nghiên cứu chính của nó bao gồm bắt cặp trình tự (sequence alignment), bắt cặp cấu trúc protein (protein structural alignment), dự đoán cấu trúc protein (protein structure prediction), dự đoán biểu hiện gene (gene expression) và tương tác protein - protein (protein-protein interactions), và mô hình hóa quá trình tiến hoá. Thuật ngữ tin sinh học và sinh học tính toán thường được dùng hoán đổi cho nhau, mặc dù cái trước, nói một cách nghiêm túc, là tập con của cái sau. Những mối quan tâm chính trong các dự án tin sinh học và sinh học tính toán là việc sử dụng các công cụ toán học để trích rút các thông tin hữu ích từ các dữ liệu hỗn độn được thu nhận từ các kĩ thuật sinh học với lưu lượng mức độ lớn. (Lĩnh vực khai phá dữ liệu (data mining) trùng lắp với sinh học tính toán về phương diện này.) Những bài toán đặc trưng trong sinh học tính toán bao gồm việc lắp ráp (assembly) những trình tự DNA chất lượng cao từ các đoạn ngắn DNA được thu nhận từ kỹ thuật xác định trình tự DNA (shotgun sequencing), và việc dự đoán quy luật điều hòa gene (gene regulation) với dữ liệu từ các mRNA, microarray hay khối phổ (mass spectrometry).

Lý giải những thông tin thu được từ các nguồn cơ sở dữ liệu khổng lồ về DNA chỉ là một trong nhiều bài toán mà các nhà tin sinh học phải giải quyết

Các lĩnh vực nghiên cứu chính

Genomics - Hệ gene học

Phân tích trình tự

Bài chính: Bắt cặp trình tự, CSDL trình tự

Kể từ khi bộ gene của Phage Φ-X174 được xác định trình tự (1977) cho đến nay, trình tự DNA của rất nhiều loài sinh vật đã được lưu trữ trong các ngân hàng cơ sở dữ liệu gene. Những dữ liệu này sẽ được phân tích để tìm ra những gene cấu trúc (gene mã hoá cho một protein nào đó), cũng như tìm ra quy luật của những trình tự tương đồng giữa các protein). Việc so sánh các gene trong cùng một loài hay giữa các loài khác nhau có thể cho thấy sự tương đồng về chức năng của protein, hay mối quan hệ phát sinh chủng loài giữa những loài này (thể hiện trên cây phát sinh chủng loài (phylogenetic tree)). Với sự tăng trưởng khổng lồ của dữ liệu loại này, việc phân tích trình tự DNA một cách thủ công trở nên không thể thực hiện nổi.

Ngày nay, các chương trình máy tính được sử dụng để giúp tìm các trình tự tương đồng trong bản đồ gen (genome) của hàng loạt sinh vật, với số lượng nucleotide trong trình tự lên đến hàng tỉ. Những chương trình này có thể tìm kiếm những trình tự DNA không giống nhau hoàn toàn do các đột biến nucleotide (thay thế, mất hay thêm các gốc base). Những giải thuật bắt cặp trình tự (sequence alignment) cũng được áp dụng ngay cả trong quá trình xác định trình tự DNA, là kỹ thuật xác định trình tự đoạn nhỏ (shotgun sequencing). (Kỹ thuật này đã được công ty Celera Genomics sử dụng để xác định trình tự genome của vi khuẩn Haemophilus influenza.) Kỹ thuật xác định trình tự hiện nay không thể tiến hành với cả đoạn trình tự DNA lớn (cỡ vài chục nghìn nucleotide trở lên) nên người ta sử dụng xác định trình tự nhỏ để giải mã hàng nghìn đoạn trình tự với kích thước khoảng 600 - 800 nucleotide. Sau đó, những đoạn trình tự nhỏ này sẽ được sắp xếp thứ tự và nối lại với nhau (thông qua việc bắt cặp trình tự ở những đầu gối lên nhau (overlap)) tạo thành một trình tự genome hoàn chỉnh.

Kỹ thuật xác định trình tự đoạn nhỏ tạo ra chuỗi dữ liệu một cách nhanh chóng, nhưng nhiệm vụ sắp xếp lại các mảnh DNA có thể là khá phức tạp cho các genome lớn. Trong trường hợp dự án bản đồ gen người (Human Genome Project), các nhà tin sinh học phải mất cả hàng tháng đồng thời sử dụng hàng loạt siêu máy tính (các máy DEC Alpha ra đời năm 2000) để sắp xếp đúng trình tự ngắn lại. Xác định trình tự đoạn nhỏ là kỹ thuật ưu tiên sử dụng trong hầu hết các dự án giải mã genome hiện nay và giải thuật lắp ráp genome (genome assembly algorithms) là một trong những lĩnh vực nóng của tin sinh học.

Một khía cạnh khác của tin sinh học trong việc phân tích trình tự là việc tìm kiếm tự động các gen và những trình tự điều khiển bên trong một genome. Không phải là tất cả nucleotides bên trong một genome đều là gene. Phần lớn các DNA bên trong genome của các sinh vật bậc cao là các đoạn DNA không phục vụ cho một nhiệm vụ cụ thể nào (hoặc do khoa học hiện nay chưa nhận ra) được gọi là những đoạn DNA rác (junk DNA). Tin sinh học còn giúp kết nối dữ liệu giữa các dự án genomics và proteomics, ví dụ việc sử dụng trình tự DNA để nhận dạng protein.

Xem thêm: phân tích trình tự, công cụ định danh chuỗi (sequence profiling tool), trình tự motif.

Chỉ định Genome

Bài chính: Tìm kiếm gene

Về phía lĩnh vực gen chuyên về nghiên cứu bản đồ gen (genomics), annotation là quá trình đánh dấu các gen và các đặc tính sinh học (biological features) khác trong một chuỗi DNA. Hệ thống phần mềm làm nhiệm vụ "genome annotation" đầu tiên đã được thiết kế vào năm 1995 bởi Owen White, anh thuộc nhóm đảm nhiệm việc sắp xếp trình tự và phân tích bản đồ gen đầu tiên của các sinh vật tự do ('free-living organism) để giải mã, khuẩn Haemophilus influenzae. Dr. White đã xây dựng hệ thống phần mềm này để tìm kiếm các gen (nằm trong chuỗi DNA nhằm nhiệm vụ mã hóa các proteine), RNA chuyển vận (transfer RNA), và các chức năng khác, và để tạo các chức năng đầu tiên cho các gen đó. Hầu hết các hệ thống genome annotation hiện nay đều hoạt động tương tự, nhưng các chương trình nhằm để phân tích lãnh vực nghiên cứu bản đồ gen DNA (genomic DNA) thì thường xuyên thay đổi và được cải tiến. Hệ thống Ensembl là hệ thống genome annotation pipeline cho bản đồ gen người được phát triển bởi Ewan Birney tại viện Sanger (The Sanger Institute) gần Cambridge, Anh.

Dò tìm đột biến và SNP

Rất nhiều các nghiên cứu xác định trình tự (sequencing) hiện nay là nhằm tìm ra các đột biến điểm (point mutation) xảy ra trên các gene khác nhau trong ung thư. Tập sơ khởi (sheer volume) các dữ liệu được tạo ra đòi hỏi các hệ thống tự động đọc những dữ liệu kiểu chuỗi này (sequence data), rồi so sánh trình tự kết quả với các trình tự đã biết trên genome người, bao gồm cả những điểm đa hình trên tế bào dòng tinh (germline) đã biết.

Những hệ thống oligonucleotide microarray, bao gồm những hệ thống dùng để phát hiện điểm đa hình đơn nucleotide (single nucleotide polymorphism) hoặc khảo sát tính dị biệt so sánh genome (comparative genomic hybridization), với khả năng cho phép nghiên cứu đồng thời hàng trăm ngàn vị trí trên toàn bản đồ gen đang được sử dụng để xác định những đột biến thêm và mất đoạn nhiễm sắc thể trong quá trình hình thành ung thư. Mô hình chuỗi Markov ẩn (Hidden Markov Model) và phương pháp phân tích điểm thay đổi (change-point analysis) đang được phát triển để có thể suy ra số lượng thực của những thay đổi từ các dữ liệu hỗn độn (noisy data). Các phương pháp tiếp cận thông tin vẫn đang được phát triển để có thể phát hiện những thương tổn DNA đã trùng hợp xảy ra trên nhiều dạng ung thư.

Sinh học tiến hoá

Phân loại học phân tử

Sinh học tiến hoá (Evolutionary biology) là ngành học nghiên cứu tổ tiên, hậu duệ cũng như quá trình phát triển của các chủng loài theo thời gian. Những phát triển gần đây trong lĩnh vực xác định trình tự gen và sự phổ biến các máy tính tốc độ cao cho phép các nhà nghiên cứu theo dõi sự tiến hoá của các loài dựa trên những thay đổi trong trình tự DNA. Tiến hóa học máy tính (Computational Evolutionary Biology, CEB) đã ra đời trước kỷ nguyên hệ gene học (genomics) nghiên cứu xây dựng các mô hình tính toán quần thể và sự biến thiên của chúng theo thời gian.

Tiếp cận vấn đề theo chiều hướng ngược lại với CEB --- thay vì sử dụng các chương trình máy tính để điều tra quá trình tiến hoá, lĩnh vực giải thuật di truyền (genetic algorithm) tìm cách tối ưu hóa những chương trình máy tính thông qua các nguyên lý tiến hoá (evolutionary principles).

Bảo tồn đa dạng sinh học

Tin sinh học thường áp dụng trong lĩnh vực bảo tồn đa dạng sinh học (biodiversity). Thông tin quan trọng nhất được thu thập chính là tên, miêu tả, sự phân bố, trạng thái và kích thước dân số của các chủng loài (species), nhu cầu thói quen (habitat) và cách mà mỗi tổ chức tương tác với các chủng loài khác. Thông tin này được lưu trữ vào trong cơ sở dữ liệu các máy tính, được truy xuất bởi các chương trình phần mềm để tìm kiếm, hiển thị, phân tích các thông tin đó một cách tự động, và quan trọng nhất, là để giao tiếp được với con người, đặc biệt qua internet. Các chuỗi DNA của các loài sắp tuyệt chủng có thể được bảo quản, và tên cùng miêu tả của mỗi loài đang bị giam giữ được lưu lại để có thể cho phép truy xuất tối đa đến các thông tin cần cho việc bảo tồn đa dạng sinh học.

Một ví dụ của ứng dụng này là dự án Species 2000 . Nó là một dự án nghiên cứu toàn cầu dựa vào internet để giúp cung cấp thông tin về mỗi chủng loài được biết đến của cây, động vật, nấm (fungus), và vi khuẩn (microbe) còn tồn tại để làm nền tảng cho việc nghiên cứu đa dạng sinh học toàn cầu. Bất cứ ai trên thế giới cũng có thể tìm thấy lượng lớn thông tin về bất kì chủng loài nào từ các cơ sở dữ liệu cung cấp.

Phân tích chức năng gene

Mức độ biểu hiện gene

Nhà sinh học phân tử có thể đánh giá mức độ biểu hiện của một gene bằng cách xác định lượng mRNA được tạo ra từ gene đó thông qua các kỹ thuật như microarray, EST (expressed sequence tag), SAGE (Serial Analysis of Gene Expression), MPSS (massively parallel signature sequencing), hay khối phổ (định lượng protein). Tất cả những kĩ thuật trên đều tạo ra những dữ liệu chứa thông tin nhiễu (noise-prone) làm việc tính toán, phân tích trở nên phức tạp. Yêu cầu thực tế đó đã cho ra đời một lĩnh vực mới trong sinh học tính toán là phát triển các công cụ thống kê để lọc tín hiệu xác đáng khỏi thông tin nhiễu trong những nghiên cứu biểu hiện gene đa lượng (high-throughput gene expression). Các nghiên cứu này thường dùng để xác định các gene liên quan đến một bệnh lý nhất định, người ta có thể so sánh dữ liệu microarray từ những tế bào bị ung thư với tế bào bình thường để xác định những protein nào được tăng cường hay giảm thiểu do ung thư.

Dữ liệu biểu hiện gene cũng được dùng để nghiên cứu điều hòa gen, người ta có thể so sánh dữ liệu microarray của một sinh vật ở những trạng thái sinh lý khác nhau từ đó kết luận về vài trò của từng gen tham gia vào mỗi trạng thái. Đối với sinh vật đơn bào, ta có thể so sánh các giai đoạn khác nhau của chu kỳ tế bào (cell cycle), hay phản ứng của cơ thể ở những điều kiện stress (stress sốc nhiệt, stress đói dinh dưỡng,.v.v.). Người ta cũng có thể áp dụng giải thuật phân nhóm (clustering algorithms) đối với những dữ liệu biểu hiện để xác định những nhóm gene đồng biểu hiện, hay đơn vị điều hòa (regulon). Những phân tích tiếp theo có thể triển khai theo nhiều hướng, ví dụ phân tích trình tự promoter của những nhóm gene để xác định nhân tố điều hòa chung hoặc sử dụng các công cụ máy tính để dự đoán những promoter liên quan đến cơ chế điều hòa từng nhóm gene (tham khảo [3]).

Nhận diện protein

Bài chính: Nhận diện chuỗi polypeptide

Protein microarray và hệ thống khối phổ cao năng (high throughput mass spectrometry) có thể cung cấp hình ảnh (snapshot) tổng thể của các protein hiện có trong một mẫu sinh học (biological sample). Các ứng dụng tin sinh học có liên quan rất nhiều đến việc lý giải các dữ liệu thu được từ những hệ thống này. Đối với protein microarray, những nhà tin sinh học cần chuyển kiểm tra dữ liệu mRNA gắn trên array. Trong khi đó, những vấn đề tin sinh học liên quan đến việc so trùng (matching) dữ liệu khối phổ với cơ sở dữ liệu về trình tự protein.

Dự đoán cấu trúc protein

Bài chính: Dự đoán cấu trúc protein

Dự đoán cấu trúc là một ứng dụng quan trọng nữa của tin sinh học. Có thể dễ dàng xác định trình tự amino acid hay còn gọi là cấu trúc bậc một của protein từ trình tự gene mã hóa cho nó. Nhưng, protein chỉ có chức năng vốn có khi nó cuộn gấp thành hình dạng chính xác (nếu điều này xảy ra ta có cấu trúc bậc hai, cấu trúc bậc ba và cấu trúc bậc bốn). Tuy nhiên, sẽ là vô cùng khó khăn nếu chỉ dự đoán các cấu trúc gấp nếp này từ trình tự amino acid. Một số phương pháp dự đoán cấu trúc bằng máy tính hiện đang phát triển.

Một trong các ý tưởng quan trọng trong nghiên cứu tin sinh học là quan điểm tương đồng. Trong một nhánh genomic của tin sinh học, tính tương đồng được sử dụng để dự đoán cấu trúc của gene: nếu biết trình tự và chức năng của gene A và trình tự này tương đồng với trình tự của gene B chưa biết chức năng thì có thể kết luận là A và B có cùng chức năng. Trong nhánh cấu trúc của tin sinh học, tính tương đồng được dùng để xác định những hợp phần quan trọng trong cấu trúc của protein cũng như tương tác của nó với các protein khác. Với kỹ thuật mô phỏng tính tương đồng (homology modelling), thông tin này được dùng để dự đoán cấu trúc của một protein khi đã biết cấu trúc của một protein khác tương đồng với nó. Hiện tại đây là cách dự đoán cấu trúc protein đáng tin cậy nhất.

Một ví dụ là hemoglobin ở người và hemoglobin của các cây họ đậu (leghemoglobin) khá tương đồng với nhau. Cả hai đều có vai trò vận chuyển oxy. Mặc dù trình tự amino acid hoàn toàn khác nhau, cấu trúc của chúng trên thực tế lại đồng nhất cho thấy rằng chúng hầu như có cùng một chức năng.

Các kỹ thuật dự đoán cấu trúc protein khác là protein threading và de novo (from scratch) physics-based modeling.

Xem thêm: motif cấu trúc

Các hệ thống sinh học kiểu mẫu

Bài chính: sinh học hệ thống

Sinh học hệ thống bao gồm việc sử dụng khả năng mô phỏng bằng máy tính (computer simulation) các hệ cơ quan tế bào cellular (như mạng các metabolites và enzyme, chúng bao gồm các metabolism, signal transduction pathways và gene regulatory networks) để có thể phân tích và hiển thị hoá (visualize) việc kết nối phức tạp của các quá trình tế bào này. Sự sống nhân tạo (Artificial life) hay tiến hoá ảo nỗ lực nhằm tìm hiểu quá trình tiến hoá thông qua việc mô phỏng bằng máy tính các dạng sự sống (nhân tạo) đơn giản.

Phân tích hình ảnh mức độ cao

Các kĩ thuật tính toán cũng được dùng để tăng tốc độ hoặc giúp tự động hoàn toàn quá trình xử lý, định lượng và phân tích một lượng lớn các hình ảnh sinh học có chứa-thông-tin-cao. Các hệ thống xử lý ảnh hiện đại tăng cường khả năng quan sát để giúp cho việc tính toán từ một tập lớn và phức tạp các hình ảnh, bằng cách cải tiến độ chính xác, tính khách quan, hay tốc độ. Một hệ thống phân tích được phát triển hoàn thiện có thể hoàn toàn thay thế người quan sát. Trong khi những hệ thống này không chỉ duy nhất phục vụ cho các ảnh liên quan đến sinh học, ứng dụng của chúng đối với các vấn đề sinh học vẫn tiếp tục tìm các giải pháp và là một thách thức, nhằm đưa nhiều ứng dụng xử lý ảnh về cùng thuộc lĩnh vực tin sinh học. Những hệ thống này đang dần trở thành quan trọng đối với cả chẩn đoán và nghiên cứu. Một vài ví dụ là:

Định lượng với tốc độ cao, độ tin cậy cao và xác định vị trí các tế-bào-con (hiển thị hình ảnh giàu nội dung (high-content screening), cytohistopathology)
Động học hình thái (Morphometrics) được dùng để phân tích các hình ảnh về quá trình phát triển của phôi nhằm theo dõi và dự đoán số phận của từng cụm tế bào (cell cluster) trong suốt quá trình phát sinh hình thái (morphogenesis).
Phân tích và hiển thị hình ảnh các hình ảnh lâm sàng
Xác định các mẫu dòng khí trong phổi của mỗi sinh vật sống tại thời gian thực
Định lượng mức độ lưu giữ trong các hình ảnh thời gian thực từ sự phát triển và hồi phục trong suốt thời gian tổn thương động mạch (arterial injury)
Đưa ra các quan sát về sự xử sự từ các đoạn phim được thu lại của các động vật thí nghiệm
Đo đạc bằng tia hồng ngoại để xác định các hoạt động trao đổi chất

Công cụ phần mềm

Một trong các công cụ dùng trong sinh học tính toán (computational biology) nổi tiếng nhất là BLAST, một giải thuật để tìm kiếm những trình tự nucleic acid hoặc protein tương đồng lưu trữ trên các cơ sở dữ liệu. Ba nguồn cơ sở dữ liệu công cộng lớn nhất về trình tự DNA và protein (thường được gọi là ngân hàng gene (ngân hàng cơ sở dữ liệu gene) là NCBI, EMBL và DDBJ.

Các ngôn ngữ lập trình của máy tính như Perl và Python thường được dùng để giao tiếp (interface) và ly trích (parse) dữ liệu từ các ngân hàng cơ sở dữ liệu sinh học (biological database) thông qua những chương trình tin sinh học (bioinformatics program). Cộng đồng những lập trình viên tin sinh học đã triển khai nhiều dự án phần mềm mã nguồn mở (free/open source) như EMBOSS, Bioconductor, BioPerl, BioPython, BioRuby và BioJava. Điều này giúp cho việc chia sẻ, phát triển và phổ biến các công cụ lập trình và tài nguyên lập trình (programming objects) giữa các nhà tin sinh học.

Môn học liên quan

Toán ứng dụng
Sinh học
Khoa học máy tính
Tin học
Toán sinh học (biomathematics)
Sinh học lý thuyết
Lý sinh học

Hình ảnh

Tham khảo

R. Durbin, S. Eddy, A. Krogh and G. Mitchison, Biological sequence analysis. Cambridge University Press, 1998. ISBN 0-521-62971-3
Kohane, et al. Microarrays for an Integrative Genomics. The MIT Press, 2002. ISBN 0-262-11271-X
Mount, David W. "Bioinformatics: Sequence and Genome Analysis" Spring Harbor Press, May 2002. ISBN 0-87969-608-7
JM. Claverie, C. Notredame, Bioinformatics for Dummies. Wiley, 2003. ISBN 0-7645-1696-5

Liên kết ngoài

Human Genome Project and Bioinformatics Lưu trữ 2003-10-09 tại Wayback Machine
Bioinformatics journal Lưu trữ 2008-11-22 tại Wayback Machine
BMC Bioinformatics journal
Genome Canada: Canadian Bioinformatics Help Desk Lưu trữ 2006-04-29 tại Wayback Machine
The OpenScience Project
Biohealthmatics.com
Bioinformatics News
Books and articles on Bioinformatics from O'Reilly

Dự án phần mềm

BIOMAP Project Lưu trữ 2006-03-19 tại Wayback Machine – Creating a Unified Global Map of various Macromolecular Biological Structures
Proteome Ontology Project Lưu trữ 2018-08-10 tại Wayback Machine – an effort to build a protein ontology specification, part of the BIOMAP Project
Bioinformatics.org – cổng giao tiếp và nơi lưu trữ các phần mềm tin sinh học mã nguồn mở
Bioconductor
BioJava
BioPerl
BioPython
BioRuby
EMBOSS
EnsEMBL
The Generic Model Organism Database Project (GMOD)

Tổ chức

European Bioinformatics Institute
National Center for Biotechnology Information
European Molecular Biology Laboratory
Open Bioinformatics Foundation – umbrella non-profit organization focused on supporting open source programming in bioinformatics
The International Society for Computational Biology

Thư mục

Danh sách các khóa học
- Một danh sách các khóa học trên toàn thế giới Lưu trữ 2006-02-10 tại Wayback Machine.
- Các khóa đào tạo tại Viện Tinh Sinh Học châu Âu.
- Các khóa Lưu trữ 2006-02-26 tại Wayback Machine về Ensembl.
Các tạp chí quan trọng
- Bioinformatics journal Lưu trữ 2008-11-22 tại Wayback Machine
- BMC Bioinformatics journal
- Cancer Informatics Open Access journal
- Online Journal of Bioinformatics Lưu trữ 2008-12-05 tại Wayback Machine
Một số site quan trọng
- Tin tức Tin sinh học
- Tin tức Tin sinh học trực tuyến
- Các sách và bài viết về Tin sinh học từ O'Reilly
- Genome Canada: Trung tâm hỗ trợ về Tin sinh học Canada Lưu trữ 2006-04-29 tại Wayback Machine
- Dự án Genome người và Tin sinh học Lưu trữ 2003-10-09 tại Wayback Machine
- Wikiomics.org Lưu trữ 2008-09-17 tại Wayback Machine: bioinformatics wiki cho người dùng và các nhà phát triển Tin sinh học trên toàn thế giới. Tập trung vào các câu hỏi thực tiễn và hướng đến các ấn phẩm học thuật và các nguồn phần mềm (khai trương vào tháng 11 năm 2005).

Sách tham khảo

Baxevanis, A.D. and Ouellette, B.F.F., eds., Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, third edition. Wiley, 2005. ISBN 0-471-47878-4
Claverie, J.M. and C. Notredame, Bioinformatics for Dummies. Wiley, 2003. ISBN 0-7645-1696-5
Durbin, R., S. Eddy, A. Krogh and G. Mitchison, Biological sequence analysis. Cambridge University Press, 1998. ISBN 0-521-62971-3
Kohane, et al. Microarrays for an Integrative Genomics. The MIT Press, 2002. ISBN 0-262-11271-X
Michael S. Waterman, Introduction to Computational Biology: Sequences, Maps and Genomes. CRC Press, 1995. ISBN 0-412-99391-0
Mount, David W. Bioinformatics: Sequence and Genome Analysis Spring Harbor Press, May 2002. ISBN 0-87969-608-7

x t s Tin sinh học
Cơ sở dữ liệu	Dữ liệu thứ tự: GenBank, European Nucleotide Archive và DNA Data Bank of Japan Dữ liệu thứ cấp: UniProt, database of protein sequences grouping together Swiss-Prot, TrEMBL and Protein Information Resource Các dữ liệu khác: Protein Data Bank, Ensembl và InterPro Cơ sở dữ liệu chuyên ngành di truyền: Saccharomyces Genome Database, FlyBase, WormBase, The Arabidopsis Information Resource và Zebrafish Information Network
Khác	Thuật toán: Basic Local Alignment Search Tool Server: ExPASy
Tổ chức	European Bioinformatics Institute NCBI Swiss Institute of Bioinformatics National Institute of Genetics
List of biological databases Xác định trình tự Sequence database Bắt cặp trình tự Molecular phylogenetics

Phân ngành sinh học

x t s Gen
Tin sinh học Cheminformatics Chemogenomics Computational genomics Genome project Glycomics Dự án bản đồ gene người Immunomics Nutrigenomics Metabolomics Metagenomics Paleopolyploidy Personal genomics Pharmacogenetics Pharmacogenomics Proteomics Structural genomics Sinh học hệ thống Toxicogenomics

Công nghệ

Phác thảo của công nghệ
Phác thảo của khoa học ứng dụng

Lĩnh vực

Nông nghiệp	Kỹ thuật nông nghiệp Nuôi trồng thủy sản Khoa học thủy sản Hóa thực phẩm Kỹ thuật thực phẩm Vi sinh thực phẩm Công nghệ thực phẩm Công nghệ hạn chế sử dụng di truyền Công nghệ thông tin và truyền thông trong nông nghiệp Dinh dưỡng
Công nghệ y sinh học	Tin sinh học Biomechatronics Kỹ thuật y sinh Công nghệ sinh học Tin hóa học Kỹ thuật di truyền Khoa học chăm sóc sức khỏe Nghiên cứu y học Công nghệ y học Y học nano Khoa học thần kinh Công nghệ thần kinh Dược lý học Công nghệ sinh sản Kỹ thuật mô
Xây dựng	Kỹ thuật âm thanh Kỹ sư kiến trúc Kỹ thuật xây dựng dân dụng Kỹ thuật xây dựng Công nghệ trong nhà Facade engineering Fire protection engineering Safety engineering Sanitary engineering Structural engineering
Công nghệ giáo dục	Phần mềm giáo dục Giáo dục trực tuyến Information and communication technologies in education Impact of technology on the educational system Virtual campus
Công nghệ năng lượng	Kỹ thuật hạt nhân Công nghệ hạt nhân Kỹ thuật xăng dầu Công nghệ năng lượng mềm
Công nghệ môi trường	Công nghệ sạch Công nghệ than sạch Thiết kế sinh thái Kỹ thuật sinh thái Công nghệ Eco Kỹ thuật môi trường Khoa học kỹ thuật môi trường Công trình xanh Công nghệ nano xanh Kỹ thuật cảnh quan Năng lượng tái tạo Thiết kế bền vững Kỹ thuật bền vững
Công nghệ công nghiệp	Tự động hóa Tin học kinh tế Quản lý kỹ thuật Kỹ thuật doanh nghiệp Kỹ thuật tài chính Công nghệ sinh học công nghiệp Kỹ thuật công nghiệp Luyện kim Kỹ thuật khai thác mỏ Năng suất cải thiện công nghệ Ma sát học
CNTT và truyền thông	Trí tuệ nhân tạo Broadcast engineering Kỹ thuật máy tính Khoa học máy tính Công nghệ tài chính Công nghệ thông tin Công nghệ âm nhạc Ontology engineering RF engineering Công nghệ phần mềm Kỹ thuật viễn thông Công nghệ hình ảnh Kỹ thuật Web
Công nghệ quân sự	Tác chiến điện tử Thông tin liên lạc quân sự Công binh Công nghệ tàng hình
Giao thông Vận tải	Kỹ thuật hàng không vũ trụ Kỹ thuật ô tô Kiến trúc hàng hải Công nghệ vũ trụ Kỹ thuật giao thông
Khoa học ứng dụng khác	Chất làm lạnh Electro-optics Điện tử học Kỹ thuật địa chất Vật lý kỹ thuật Thủy lực học Khoa học vật liệu Vi chế Kỹ thuật nano
Khoa học kỹ thuật khác	Kỹ thuật âm thanh Kỹ thuật sinh hóa Kỹ thuật gốm sứ Kỹ thuật hóa học Kỹ thuật Polymer Kiểm soát kỹ thuật Kỹ thuật điện Kỹ thuật điện tử Công nghệ giải trí Địa kỹ thuật Kỹ thuật thủy lực Kỹ thuật cơ khí Cơ điện tử Kỹ thuật quang học Kỹ thuật Protein Công nghệ lượng tử Tự động hóa Robot Hệ thống kỹ thuật

Thành phần

Công trình hạ tầng xã hội
Sáng chế
- Biên niên sử các sáng chế
Tri thức
Máy móc
Kỹ năng
- Nghề
Dụng cụ
- Gadget

Thang đo

Công nghệ femto
Công nghệ pico
Công nghệ nano
Công nghệ micro
Kỹ thuật Macro
Kỹ thuật Megascale

Lịch sử
công nghệ

Outline of prehistoric technology
Neolithic Revolution
Ancient technology
Medieval technology
Renaissance technology
Cách mạng công nghiệp
- Cách mạng công nghiệp lần thứ hai
Jet Age
Digital Revolution
Information Age

Các lý thuyết
công nghệ,
các khái niệm

Appropriate technology
Critique of technology
Diffusion of innovations
Disruptive innovation
Dual-use technology
Ephemeralization
Ethics of technology
Công nghệ cao
Hype cycle
Inevitability thesis
Low-technology
Mature technology
Philosophy of technology
Strategy of Technology
Technicism
Techno-progressivism
Technocapitalism
Technocentrism
Technocracy
Technocriticism
Technoetic
Technoethics
Technological change
Technological convergence
Technological determinism
Technological escalation
Technological evolution
Technological fix
Technological innovation system
Technological momentum
Technological nationalism
Technological rationality
Technological revival
Điểm kỳ dị công nghệ
Technological somnambulism
Technological utopianism
Technology lifecycle
- Technology acceptance model
- Technology adoption lifecycle
Technomancy
Technorealism
Triết học siêu nhân học

Khác

Công nghệ mới nổi
- Danh sách
Công nghệ hư cấu
Technopaganism
Khu thương mại công nghệ cao
Thang Kardashev
Danh mục công nghệ
Khoa học, Công nghệ và xã hội
- Technology dynamics
Khoa học và công nghệ theo quốc gia
Technology alignment
Technology assessment
Technology brokering
Công ty công nghệ
Technology demonstration
Technology education
- Đại học Kỹ thuật
Công nghệ truyền giáo
Công nghệ tổng hợp
Quản trị công nghệ
Tích hợp công nghệ
Công nghệ báo chí
Quản lý công nghệ
Bảo tàng công nghệ
Chính sách công nghệ
Công nghệ sốc
Công nghệ và xã hội
Chiến lược công nghệ
Chuyển giao công nghệ
Vũ khí
- Danh sách vũ khí

Sách
Thể loại
Commons
Chủ đề
Wikiquote

x t s Những lĩnh vực chính của khoa học máy tính
Các nền tảng toán học	Logic toán học · Lý thuyết tập hợp · Lý thuyết số · Lý thuyết đồ thị · Lý thuyết kiểu · Lý thuyết thể loại · Giải tích số · Lý thuyết thông tin · Đại số · Nhận dạng mẫu · Nhận dạng tiếng nói · Toán học tổ hợp · Đại số Boole · Toán rời rạc
Lý thuyết phép tính	Độ phức tạp Kolmogorov · Lý thuyết Automat · Lý thuyết tính được · Lý thuyết độ phức tạp tính toán · Lý thuyết điện toán lượng tử
Các cấu trúc dữ liệu và các giải thuật	Phân tích giải thuật · Thiết kế giải thuật · Hình học tính toán · Tối ưu hóa tổ hợp
Các ngôn ngữ lập trình và Các trình biên dịch	Các bộ phân tích cú pháp · Các trình thông dịch · Lập trình cấu trúc · Lập trình thủ tục · Lập trình hướng đối tượng · Lập trình hướng khía cạnh · Lập trình hàm · Lập trình logic · Lập trình máy tính · Lập trình mệnh lệnh · Lập trình song song · Lập trình tương tranh · Các mô hình lập trình · Prolog · Tối ưu hóa trình biên dịch
Tính song hành, Song song, và các hệ thống phân tán	Đa xử lý · Điện toán lưới · Kiểm soát song hành · Hiệu năng hệ thống · Tính toán phân tán
Công nghệ phần mềm	Phân tích yêu cầu · Thiết kế phần mềm · Các phương pháp hình thức · Kiểm thử phần mềm · Quy trình phát triển phần mềm · Các phép đo phần mềm · Đặc tả chương trình · LISP · Mẫu thiết kế · Tối ưu hóa phần mềm
Kiến trúc hệ thống	Kiến trúc máy tính · Tổ chức máy tính · Các hệ điều hành · Các cấu trúc điều khiển · Cấu trúc bộ nhớ lưu trữ · Vi mạch · Thiết kế ASIC · Vi lập trình · Vào/ra dữ liệu · VLSI design · Xử lý tín hiệu số
Viễn thông và Mạng máy tính	Audio máy tính · Chọn tuyến · Cấu trúc liên kết mạng · Mật mã học
Các cơ sở dữ liệu và Các hệ thống thông tin	Hệ quản trị cơ sở dữ liệu · Cơ sở dữ liệu quan hệ · SQL · Các giao dịch · Các chỉ số cơ sở dữ liệu · Khai phá dữ liệu · Biểu diễn và giao diện thông tin · Các hệ thống thông tin · Khôi phục dữ liệu · Lưu trữ thông tin · Lý thuyết thông tin · Mã hóa dữ liệu · Nén dữ liệu · Thu thập thông tin
Trí tuệ nhân tạo	Lập luận tự động · Ngôn ngữ học tính toán · Thị giác máy tính · Tính toán tiến hóa · Các hệ chuyên gia · Học máy · Xử lý ngôn ngữ tự nhiên · Robot học
Đồ họa máy tính	Trực quan hóa · Hoạt họa máy tính · Xử lý ảnh
Giao diện người-máy tính	Khả năng truy cập máy tính · Giao diện người dùng · Điện toán mang được · Điện toán khắp mọi nơi · Thực tế ảo
Khoa học tính toán	Cuộc sống nhân tạo · Tin sinh học · Khoa học nhận thức · Hóa học tính toán · Khoa học thần kinh tính toán · Vật Lý học tính toán · Các giải thuật số · Toán học kí hiệu
Chú ý: khoa học máy tính còn có thể được chia thành nhiều chủ đề hay nhiều lĩnh vực khác dựa theo Hệ thống xếp loại điện toán ACM.

Chuyên ngành chính của Tin học

Phần cứng • Phần mềm

Công nghệ thông tin

Cuộc sống nhân tạo
Đa xử lý
Điện toán lưới
Đồ họa máy tính
Hệ chuyên gia
Hệ thống thông tin quản lý
Hoạt họa máy tính
Khoa học nhận thức
Khoa học tính toán
Khoa học thần kinh tính toán
Khoa học thông tin
Kiểm soát song hành
Kiến trúc hệ thống
Lập luận tự động
Ngôn ngữ hình thức
Ngôn ngữ học tính toán
Người máy
Robot học
Thực tế ảo
Tính toán song song
Tối ưu hóa trình biên dịch
Tổ chức máy tính
Trí tuệ nhân tạo
Từ điển học
Tương tranh
Vật lý học tính toán

Hệ thống thông tin

An toàn thông tin
Cơ sở dữ liệu đa phương tiện
Cơ sở dữ liệu thông minh
Dữ liệu lớn
Hệ cơ sở tri thức
Hệ dựa trên logic
Hệ gợi ý
Hệ thích nghi dựa trên ngữ cảnh
Hệ thống hướng tác tử
Hệ thống thông minh
Hệ thống thông tin địa lý
Hệ trợ giúp quyết định
Kỹ nghệ dữ liệu
Kỹ nghệ tri thức
Logic mờ
Phân tích dữ liệu
Phân tích và thiết kế hệ thống
Quản trị dự án
Quản trị tri thức
Thiết kế và quản trị dữ liệu
Tích hợp dữ liệu
Tính toán hiệu năng cao
Web ngữ nghĩa
Xử lý thông tin mờ

Khoa học máy tính

Cơ sở dữ liệu phân tán
Hệ quản trị cơ sở dữ liệu
Hệ thống đa lõi
Hệ thống truyền thông
Hình học tính toán
Hóa học tính toán
Học máy
Khai phá dữ liệu
Lập trình song song
Lý thuyết mã hóa
Lý thuyết tính toán
Ngôn ngữ và phương pháp dịch
Nguyên lý ngôn ngữ lập trình
Quy hoạch ràng buộc
Sinh học tính toán (Tin sinh học)
Thiết kế và phân tích thuật toán
Tìm kiếm thông tin
Tính toán khoa học
Tính toán kí hiệu
Tính toán phân tán
Tính toán tiến hóa
Tính toán tự nhiên
Tối ưu hoá tổ hợp
Xử lý song song

Kỹ thuật máy tính

Đa phương tiện
Định vị vệ tinh (GNSS)
Giao diện người dùng
Ghép nối máy tính
Hệ nhúng
Hệ thống thời gian thực
Hiệu năng hệ thống
Kiến trúc máy tính
Lập trình đôi
Lập trình đồ họa
Lập trình hệ thống
Lý thuyết nhận dạng
Mạng nơ-ron
Nhận dạng tiếng nói
Phân tích tín hiệu
Thị giác máy tính
Thiết kế IC
Thoại IP
Tổng hợp giọng nói
Tương tác người–máy tính
Vi xử lý
Xử lý ảnh
Xử lý dữ liệu đa phương tiện
Xử lý ngôn ngữ tự nhiên
Xử lý tiếng nói
Xử lý tín hiệu số

Kỹ nghệ phần mềm

Bảo trì phần mềm
Các phương pháp hình thức
Chất lượng phần mềm
Đảm bảo chất lượng phần mềm
Đánh giá phần mềm
Đo lường và quản trị phần mềm
Độ tin cậy và chịu lỗi phần mềm
Kiểm thử phần mềm
Kiến trúc doanh nghiệp
Kiến trúc phần mềm
Kinh tế công nghệ phần mềm
Kỹ nghệ hướng dịch vụ
Lập trình linh hoạt
Mẫu thiết kế
Mô hình hóa phần mềm
Phân tích hệ thống
Phân tích thiết kế hướng đối tượng (UML)
Phân tích yêu cầu phần mềm
Phát triển phần mềm
Quản lý cấu hình phần mềm
Quản lý dự án phần mềm
Quản lý kỹ thuật phần mềm
Quy trình phát triển phần mềm (Vòng đời phát hành phần mềm)
Thiết kế phần mềm
Triển khai phần mềm
Tối ưu hóa phần mềm

Mạng máy tính

An ninh mạng
An ninh trong giao dịch điện tử
Đánh giá hiệu năng mạng (QoS)
Điện toán đám mây
Định tuyến
Hệ phân tán
Kỹ thuật truyền thông
Lý thuyết thông tin
Mạng không dây
Mạng thế hệ mới
Mạng thiết bị di động
Mạng thông tin quang
Mật mã học
Mô phỏng mạng
Nhận dạng
Quản trị mạng
Thiết bị truyền thông và mạng
Thiết kế mạng
Tính toán khắp nơi và di động
Trung tâm dữ liệu
Truyền thông di động
Truyền thông đa phương tiện
Truyền thông số
Vệ tinh thông tin
Viễn thông (Mạng viễn thông)
Ước lượng tín hiệu và hệ thống
Web thế hệ mới

Tin học kinh tế

Giám đốc công nghệ thông tin · Tin học kinh tế · Quản lý công nghệ thông tin

Quản lý

ITIL & ITSM
Định hướng phát triển
Phát triển nhân lực
Quản lý bảo mật
Quản lý chất lượng
Quản lý công nghệ
Quản lý dự án
Quản lý mua sắm
Quản lý ngân sách
Quản lý nguồn lực
Quản lý phát hành
Quản lý rủi ro
Quản lý tài sản
Quản lý thay đổi
Quản lý tích hợp
Quản lý tổ chức
Quản lý truyền thông
Quản lý tuân thủ
Quản lý vấn đề
Thiết kế giải pháp
Xây dựng chiến lược
Xây dựng chính sách

Quản lý mạng

Ảo hóa
Mạng campus
Mạng diện rộng
Mạng nội bộ
Mạng riêng ảo
STP
VLAN
IVR
VTP

Quản trị hệ thống

Hoạt động vận hành	Bảo trì thiết bị Bảo vệ hệ thống Đối phó sự cố Kế hoạch dự phòng
Hoạt động kỹ thuật	Hỗ trợ kỹ thuật Kiểm soát truy cập Kiểm tra hệ thống Xác thực người dùng
Hoạt động an toàn	An ninh nhân sự An ninh hệ thống Nhận thức an toàn Rủi ro hệ thống

Quản lý hệ thống

Bàn dịch vụ
Quản lý cấu hình
Quản lý công suất
Quản lý dịch vụ
Quản lý hạ tầng
Quản lý khôi phục
Quản lý người dùng
Quản lý sự cố
Quản lý tính liên tục
Quản lý tính sẵn sàng
Tổ chức công việc
Tổ chức hỗ trợ

Kỹ năng lãnh đạo

Kỹ năng cộng tác nhóm
Kỹ năng đàm phán
Kỹ năng giải quyết vấn đề
Kỹ năng giao tiếp
Kỹ năng gọi thoại
Kỹ năng huấn luyện
Kỹ năng lắng nghe
Kỹ năng phân công ủy thác
Kỹ năng phỏng vấn tuyển dụng
Kỹ năng quản lý thời gian
Kỹ năng tạo động lực
Kỹ năng tư duy
Kỹ năng thiết kế quy trình
Kỹ năng thuyết trình
Kỹ năng viết tài liệu kỹ thuật

Ứng dụng

Chính phủ điện tử
Giáo dục trực tuyến
Hoạch định tài nguyên doanh nghiệp
Kinh doanh điện tử (Mua sắm trực tuyến · Thương mại điện tử · Tiếp thị trực tuyến)
Kinh doanh thông minh
Quản lý quan hệ khách hàng
Quản lý tri thức

Các lĩnh vực liên quan

Kinh tế
Luật pháp
Tài chính
Kế toán
Kinh doanh
Tổ chức
Xã hội
Quản lý

Quản trị kinh doanh