Cómo ingresar a la genómica o la biología computacional como científico de datos

Proporcioné la respuesta (a continuación) en otro lugar también. Tengo que agregar que, si eres bueno en programación y conoces biología, entonces eres un recurso muy valioso y podrías conseguir un trabajo u oportunidades con bastante facilidad, que es cómo debes comenzar, principalmente trabajando para un laboratorio o una compañía. Pero tener una fortaleza con la programación y la codificación debe alinearse igualmente con tener una comprensión muy clara de la biología; para esto, primero tendrá que leer. En biología y evolución, el fenómeno de un proceso biológico y la evolución dependen en gran medida del contexto y son específicos de los nichos (de organismos, células, especies, etc.), y esto debe entenderse muy claramente. Puede encontrar firmas de selección en varios patrones diferentes que necesitan una base profunda para comprender las probabilidades de los caminos evolutivos que ha tomado un rasgo u organismo. Pero, como titular, tener un equipo colaborativo podría significar una gran ventaja.

Como biólogo, en realidad tengo problemas en el lado de la programación. Creo que será mejor que comiences con:

1) Comprender la estructura lineal del ADN

2) nucleótidos en ADN y ARN

3) códigos IUPAC

4) códigos de traducción de ARNm a proteína

5) iniciar, detener codones

6) recombinación

Esta es la mayoría de las cosas que necesitará comprender como principiante.

Además de esto, desarrollar una bioinformática o herramientas de manipulación de archivos necesitará la comprensión de la biología en el marco del contexto, como la evolución, la selección natural, la inducción de mutaciones, las relaciones entre padres e hijos, la estructura de la población, varios otros, etc.

La mayoría de las herramientas de niveles superiores se diseñan teniendo en cuenta el contexto del diseño experimental, la biología del organismo y varios supuestos subyacentes de los individuos y las poblaciones. Comprender esto es muy importante para alinear el diseño de la herramienta con la biología en mente. Aprenderá sobre la marcha, pero probablemente necesitará algunas colaboraciones y debates.

Salud !

Bien, voy a dar una respuesta de muchas partes, algunas de las cuales son autoproclamadas (y puedo reescribir esta respuesta de alguna forma en mi blog, porque me gusta mucho la pregunta. También dé algunos ejemplos específicos, pero no se sienta atado a ellos, están destinados a hacer las cosas más concretas. Además, no sienta que necesita hacer todo esto; son un conjunto de opciones.

¿Cuál es tu objetivo? ¿Quieres un trabajo en el espacio? Ir a la escuela de posgrado? Eso no cambiará mucho de esto, pero a veces podría influir en las elecciones y debe tenerse en cuenta.

Haga un inventario de sus habilidades actuales. ¿Cuáles consideras tus fortalezas particulares? Por ejemplo, en el espacio de aprendizaje automático, ¿en qué técnicas de aprendizaje automático estás particularmente informado? El término “ciencia de datos” cubre mucho terreno: ¿cuáles son específicamente sus habilidades aquí?

Establezca un presupuesto en términos de tiempo y dinero. Gran parte de lo que recomendaré a continuación es gratuito, pero algunas cosas no lo son. Muchas cosas están en línea; otros no lo son y pueden requerir dinero para viajar o registrarse.

Luego, considere comenzar un diario o incluso mejor dar el salto y escribir un blog. Esto lo ayudará a realizar un seguimiento de su progreso y a capturar pensamientos o preguntas importantes. Si escribes en un blog, entonces será una plataforma para encontrar a otros que puedan ayudarte con tu viaje, así como una forma de

Ahora, familiarícese con el servidor de preimpresión BioXiv y la base de datos de publicaciones PubMed. Serán importantes fuentes de información. Puede filtrar PubMed para artículos de acceso abierto. Si está cerca de algunos colegios o universidades, averigüe si puede acceder a sus suscripciones electrónicas visitando la biblioteca; muchos dejan que el público lo haga.

Encuentre algunos documentos que apliquen el tipo de técnicas con las que está familiarizado con los problemas de biología. Como ejemplo, si está familiarizado con las redes neuronales recurrentes, entonces este enfoque se describió recientemente en una preimpresión de BioRiv para convertir las señales eléctricas de una nueva forma de secuenciador de ADN (Oxford Nanopore MinION) en secuencias de ADN reales. Si está familiarizado con los bosques aleatorios, entonces hay muchos documentos que los utilizan para resolver problemas. Lea los documentos y luego comience a tratar de comprender el problema biológico subyacente.

Toma algunos cursos en línea. Algunos son gratis; algunos no lo son. Sé que Coursera tuvo una clase de biología computacional impartida por un gran científico que también es un gran maestro, Pavel Pevzner (sin ninguna pista sobre el costo). Las notas del curso para muchas clases ahora están disponibles gratis en línea.

Participe en algunos proyectos de código abierto. Hay muchos en Github, y leer los documentos que encontró en BioXiv y PubMed lo llevará a muchos repositorios. Contribuir a estos proyectos puede ayudarlo a establecer conexiones y algunos de buena fe, además de familiarizarse íntimamente con algunos de los detalles de bajo nivel de la bioinformática (como los formatos de archivo horribles y horribles que impregnan el campo).

Lee algunos blogs en el espacio (¡por ejemplo, el mío!). Entra en Twitter y al menos mira a tu alrededor; Hay muchas conversaciones interesantes que pueden llevarlo a personas y lugares interesantes. Anuncie su blog (si comenzó uno), haga buenos comentarios y, de lo contrario, muestre cómo sería como colega.

Busque recursos cerca de donde vive. ¿Hay académicos que trabajan en el espacio? ¡Contáctalos! Tal vez te den sugerencias o incluso te permitan participar en reuniones de laboratorio o ayudarte con un proyecto. ¿Hay seminarios cerca? ¿Hay grupos profesionales? Por supuesto, esto depende mucho de la geografía: si vives en Santa Elena, ¡no tienes suerte! Pero si tienes suerte de tenerlos, ¡aprovecha!

Para el espacio biológico que ha identificado, obtenga una comprensión básica. Por ejemplo, si estaba apuntando al cáncer, entonces debería comprender ideas como oncogenes, supresores de tumores, características distintivas del cáncer. Si estaba apuntando a la inmunología, entonces algunas ideas como anticuerpos, inmunidad celular, tolerancia. Ojear un libro de texto de introducción es un buen enfoque, o encontrar algunos buenos libros escritos para audiencias laicas (por ejemplo, El Emperador de todas las enfermedades para el cáncer) o encontrar algunos buenos artículos de revisión gratuitos o tal vez un tratamiento en Scientific American o American Scientist. No esperes convertirte en un experto, pero trata de poder conversar con alguien en el campo.

Gran parte de esto será cíclico. Por ejemplo, puede encontrar un documento relevante para una técnica que sabe que tiene código en un sitio de GitHub. No comprende la biología, por lo que pasa tiempo obteniendo una comprensión básica. Luego observa el código de GitHub y tiene un poco de sentido, pero necesita investigar más. Luego vuelva al papel: tal vez ahora hay cosas que ahora está mejor equipado para comprender, y también comprende lo que antes no sabía que era importante entender, por lo que puede recorrer todo esto para obtener aún más comprensión.

Solo recuerda en todo esto que no te obsesiones con algo que no tiene sentido. A veces eso se debe a que simplemente no ha encontrado la información correcta, o aún no ha construido una base clave. Pero a veces será porque eso es solo una brecha en nuestra comprensión colectiva (si está en la biología), y a veces el código no será comprensible porque alguien tomó una decisión extraña o algún patrón histórico extraño se ha encerrado. Biología computacional , como cualquier otro esfuerzo humano, tiene algunos fósiles extraños que simplemente están encerrados.

Si bien el conocimiento de la biología es ciertamente útil, un conocimiento profundo no es esencial. Siempre que pueda recoger lo que necesita, puede hacerlo bien (siempre que sus habilidades en ciencia de datos sean muy sólidas).

Mira este curso en línea y libros para ello. Estos probarán si eres lo suficientemente bueno para ser Bioinformática | Coursera

Avíseme si necesita más orientación.