Bioinformática
De Wikipedia, la enciclopedia libre
Genómica |
---|
Genoma |
Bioinformática |
Genómica estructural |
Glicómica |
Metabolómica |
Proteómica |
Genoma humano |
Proyecto Genoma Humano |
Biología de sistemas |
Glosario relacionado con genoma |
Bioinformática es la aplicación de los ordenadores y los métodos informáticos en el análisis de datos experimentales y simulación de los sistemas biológicos. Una de las principales aplicaciones de la bioinformática es la simulación, la minería de datos (data mining) y el análisis de los datos obtenidos en el estudio de moléculas relevantes para la vida, por ej. el ADN/ARN/genoma (Proyecto Genoma Humano) o las proteínas proteoma, así como el diseño y desarrollo de herramientas tales como: bases de datos, directorios web, etc.
Una definición mucho más global es:
- Bioinformática es la aplicación del desarrollo de la computación y las matemáticas que permite la administración, análisis y comprensión de datos para resolver preguntas biológicas. (con conexiones a medi-, quimio-, neuro-, etc. informática). Modificado de: Center for Research on Innovation and Competition (Harvey & Mc. Meekin, 2002).
Dos escuelas, la de EE.UU. y la del Reino Unido con Australia le dan diferentes coberturas al término.
- Para los estadounidenses la bioinformática se enmarca dentro de lo mencionado en el párrafo anterior.
- Para los británicos la bioinformática se extiende al estudio de cualquier tipo de dato obtenido de entidades biológicas independientemente de la escala de estudio, desde moléculas hasta paisaje, ecosistemas, etc.
La bioinformática se nutre especialmente de dos grandes áreas del conocimiento, las ciencias biológicas y las ciencias de la computación, dado este origen existen dos grandes líneas de trabajo: La primera en la cuál las ciencias de la computación utilizan modelos de las biológicas, ejemplo de ello lo constituyen las redes neurales, los algoritmos genéticos, computación con DNA, entre otras. La segunda en la cuál las ciencias biológicas utilizan modelos y herramientas de las ciencias de la computación, como se menciona en el primer párrafo.
Tabla de contenidos |
[editar] Bases de datos
Existen bases de datos primarias, que contienen información directa de la secuencia, estructura o patrón de expresión de ADN o proteína, y secundarias, que contienen datos e hipótesis derivados del análisis de las bases de datos primarias, como mutaciones, relaciones evolutivas, agrupación por familias o funciones, implicación en enfermedades, etc.
[editar] De nucleótidos
La colaboración de las tres bases de datos más importantes hace posible acceder a casi toda la información de secuencias de ADN desde cualquiera de sus tres sedes:
- EMBL-BANK en el Instituto europeo de Bioinformática (EBI)
- Enlace externo: EMBL-BANK
- DNA Data Bank of Japan (DDBJ) en el Centro de Información Biológica (CIB)
- Enlace externo: DDBJ
- GenBank en el Centro Nacional de Información Biotecnológica (NCBI)
- Enlace externo: GenBank Entrez Nucleotide
Si bien son mantenidas por distintos organismos en distintos paises, existe una coordinación entre las distintas bases. Una secuencia enviada a cualquiera de las bases se verá reflejada en las otras dos en aproximadamente una semana, ya que esa es la frecuencia de actualización entre las distintas bases genéticas. Por este motivo es indistinto que base se use para enviar nuevas secuencias, aunque normalmente los europeos utilizan EMBL-BANK y los americanos GenBank.
[editar] De proteínas
Bases de datos de secuencias de aminoácidos.
- Swissprot contiene secuencias anotadas o comentadas, es decir, cada secuencia ha sido revisada, documentada y enlazada a otras bases de datos.
- Enlace externo: Swissprot en el EBI, Swissprot en Expasy
- TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes derivadas del (EMBL-BANK) y que todavía no han podido ser anotadas en Swissprot.
- Enlace externo: TrEMBL
- PIR por Protein Information Resource está dividida en cuatro sub-bases que tienen un nivel de anotación decreciente.
- Enlace externo: PIR
- ENZYME enlaza la clasificación de actividades enyimáticas completa a las secuencias de Swissprot.
- Enlace externo: ENZYME
- PROSITE contiene información sobre la estructura secundaria de proteínas, familias, dominios, etc.
- Enlace externo: PROSITE
- INTERPRO integra la información de diversas bases de datos de estructura secundaria como PROSITE, proporcionando enlaces a otras bases de datos e información más extensa.
- Enlace externo: INTERPRO
- PDB por Protein Data Bank es la base de datos de estructura terciaria 3-D de proteínas que han sido cristalizadas.
- Enlace externo: PDB
[editar] De genomas
- Ensembl integra genomas eucariotas grandes, por el momemto contiene genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae.
- Enlace externo: Ensembl
- Genomes server y TIGR son portales con información o enlaces de todos los genomas secuenciados por el momento, desde virus a humanos.
- Enlace externo: Genome Server
- Enlace externo: TIGR
- Wormbase es el portal del genoma de gusano C. elegans.
- Enlace externo: Wormbase
- Flybase es el portal de la mosca del vinagre Drosophila melanogaster.
- Enlace externo: Flybase
[editar] Otras
- Taxonomy es el portal de clasificación taxonómica de organismos
- Enlace externo: Taxonomy Browser
- Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca Nacional de Medicina (NLM), con enlaces a artículos completos
- Enlace externo: PubMed
- OMIM por Online Mendelian Inheritance in Man es un catálogo de genes humanos relacionados con informaciones genéticas.
- Enlace externo: OMIM
- Xenobase es el portal del organismo modelo Xenopus laevis
- Enlace externo: [1]
[editar] Bibliografía complementaria
- Rafael Lahoz-Beltrá. Bioinformatica: Simulación, Vida Artificial, Inteligencia Artificial, 2004. ISBN: 84-7978-645-0. [2]
- R. Durbin, S. Eddy, A. Krogh y G. Mitchison. Biological Sequence Analysis, 1998. ISBN: 0-521-62971-3.
[editar] Véase también
- Biología computacional
- Biología de sistemas
- BLAST
- Glosario relacionado con genoma
- Alineamiento de secuencias
[editar] Enlaces externos
- Proyectos de Software
- Organizaciones
- Foro de Investigadores Argentinos en Biología e Informática
- Directorios
- Libros en español
- Otros