Es difícil ser exhaustivo, pero la bioinformática incluye el análisis computacional de conjuntos de datos biológicos de alto rendimiento. Los tipos de conjuntos de datos biológicos de alto rendimiento incluyen los conjuntos de datos ómicos tales como genómica (el análisis de genomas completos, es decir, conjuntos completos de genes en una especie determinada), proteómica (el análisis de proteomas, es decir, conjuntos completos de proteínas en una célula), transcriptómica (el análisis de la expresión génica de genomas completos, es decir, el análisis de conjuntos completos de transcripciones), metabolómica y glicómica. Muchas tecnologías miden ciertas métricas sobre esos conjuntos completos de diferentes moléculas biológicas (genes, transcripciones, proteínas, metabolitos, glicanos, etc.). El más popular es el de microarrays, y especialmente en la medición de transcriptomas, es decir, la expresión génica. Consulte este repositorio abierto de dichos conjuntos de datos Inicio – GEO – NCBI.
El análisis de dichos conjuntos de datos se puede realizar mediante varias clases de métodos computacionales, tales como clasificación supervisada, agrupamiento no supervisado, métodos de optimización, métodos estadísticos y otros. Esto realmente depende del objetivo de la investigación.
Además, el análisis de redes biológicas es un subcampo caliente de bioinformática. Por ejemplo, una red biológica puede tener genes como sus nodos e interacciones genéticas como bordes, o proteínas como nodos e interacciones proteína-proteína como bordes. Existen muchos otros tipos de redes en este campo. Eche un vistazo a este sitio web GeneMANIA e intente enviar cualquier lista de nombres de genes allí, vea lo que obtiene.
En resumen, debe elegir dos elementos principales: uno o más conjuntos de datos y uno o más métodos computacionales; el conjunto de datos es un gran conjunto de números y / o descripciones que cuantifican o califican algunas variables biológicas, y el método computacional puede ser desde un único método estadístico trivial hasta una compleja tubería de métodos y técnicas de aprendizaje automático, optimización y estadística. Las opciones realmente dependen de los datos disponibles y la pregunta de investigación objetivo.
¿Cuáles son las principales áreas de la investigación bioinformática actual?
Related Content
¿Cómo se encuentran los trabajos de consultoría en machine learning + PNL?
¿Cómo funcionan los bots de chat desde una perspectiva de Machine Learning?
More Interesting
¿Por qué los lars y glmnet dan diferentes soluciones? ¿Cuál es mejor?
¿Cuáles son algunas aplicaciones interesantes de aprendizaje profundo en FinTech?
¿Cuáles son los algoritmos utilizados en los sistemas de preguntas y respuestas en PNL?
Cómo agregar una razón de probabilidad para una característica en mi conjunto de datos
¿Cómo cambiará el aprendizaje automático la sociología?
¿Cuáles son las cosas divertidas que encontró en el procesamiento del lenguaje natural (PNL)?
¿Cuál es la diferencia entre adaboost y el clasificador de perceptrones de una capa?
¿Puede el aprendizaje reforzado aprovechar la memoria o transferir el aprendizaje?