Levántate. Sirve la primera de las muchas tazas de café del día. Siéntate en mi escritorio. Mire el error en el que dejé de trabajar a las 2:00 a.m. de la noche anterior. Darse cuenta de que el error no se ha solucionado. Mascullar enojado. Sirve otra taza de café …
De acuerdo, no todo el tiempo. Honestamente, no puedo decir cómo es un día de trabajo típico de bioinformática porque mi trabajo es algo inusual, ya que soy el único bioinformático en mi grupo (un laboratorio de fisiología) y trabajo en casa la mayor parte del tiempo, lo que tiene Sus puntos buenos y malos. Ver “2:00 AM” arriba. Pero las tareas que ocupan la mayor parte de mi tiempo, en orden aproximado de mayor a menor, son:
- Codificación. Hay mucho más en bioinformática que programación, pero la programación es donde paso la mayor parte de mi tiempo. Aproximadamente una cuarta parte del tiempo de codificación se dedica a implementar nuevos algoritmos y pruebas estadísticas. El resto genera principalmente informes personalizados.
- Matemáticas. Los biólogos quieren respuestas a preguntas, generalmente sí o no. Mi trabajo como estadístico es responder esas preguntas y transmitir una idea de cuán inseguros deberíamos estar sobre las respuestas. Probablemente el 90% del tiempo, puedo hacerlo muy rápido, con algún procedimiento de prueba estándar. El otro 10%, tengo que idear nuevos procedimientos que sean defendibles y produzcan resultados interpretables. Esto no significa reinventar las pruebas estándar (otras personas ya han hecho ese trabajo y sería un error tratar de vencerlas), pero sí significa lidiar con muchas comparaciones múltiples y probabilidades condicionales que requieren el uso de pruebas de manera creativa.
- Aprendizaje y anotación de los datos. Esto ocurre casi por completo al comienzo de un proyecto; es muy lento en ese momento, pero después de eso conozco el conjunto de datos como un viejo amigo y no debería ser necesario volver a él. Si tengo que regresar, lo que a veces hago, más a menudo de lo que me gustaría, eso significa que no profundicé en ello tan a fondo como debería haberlo hecho la primera vez.
- Escritura. Esto incluye la documentación interna (todo lo que hago en los puntos 1 a 3 debe escribirse de una manera que tenga sentido no solo para mí, sino para cualquier otra persona que necesite leerlo en caso de que un autobús me atropele mañana) y preparación de trabajos y presentaciones de conferencias. A veces esto va muy bien, otras veces es un ejercicio de dolor.
- Estudiar biología. Mis compañeros de trabajo de laboratorio húmedo intentan explicar todo lo que necesito saber sobre lo que estamos trabajando, y hacen un trabajo bastante bueno. Pero todavía necesito descargar biografías y abrir libros de texto abiertos y leer sobre el tema hasta que lo entienda. Esa es la única forma en que sabré si las respuestas que les estoy dando tienen sentido.
- Reuniones Una buena reunión de laboratorio, sí, ¡existe! Es una oportunidad para que todos en el laboratorio den un resumen de lo que han estado trabajando y se hagan preguntas. Es muy fácil para las personas concentrarse en sus propios pequeños nichos y perder la noción de cómo su trabajo hace que el laboratorio avance. Lanzar ideas de un lado a otro en persona es la mejor manera de mejorar ese problema.
- Estudiar bioinformática. Solo porque esto es lo que hago para vivir no significa que sepa todo lo que necesito saber. Leer documentos y asistir a seminarios me ayuda a estar al día.
Al comienzo de un proyecto, 2 y 3 son en lo que paso la mayor parte de mi tiempo. Una vez que las cosas se ponen en marcha, 1 y 4 son diarias, y 2 generalmente aparecen un par de veces a la semana. 5, 6 y 7 son semanales a mensuales. Trato de tomarme un tiempo todos los días para dormir lo suficiente, nutrición, ejercicio y relajación también. Algunos días eso sucede, otros no.
- Cómo convertir datos categóricos a datos continuos
- ¿Qué libro es mejor para principiantes para comenzar a aprender ciencia de datos, Python para Data Science for Dummies o Data Science from Scratch?
- Cómo prepararse para una maestría en informática en aprendizaje automático / ciencia de datos como una persona sin mucha experiencia en el campo de la informática
- ¿Cuál es el software más eficiente para el análisis de big data?
- Cómo usar Simplescalar para crear un proyecto de ciencia de datos