Creo que el estadístico automático de la Universidad de Cambridge / MIT cuenta como respuesta
El científico de datos había sido nombrado el “trabajo más sexy del siglo XXI”. Hoy, tenemos ejércitos de profesionales altamente capacitados, la mayoría armados con doctorados, que trabajan diligentemente para producir inferencias utilizando aprendizaje automático y estadísticas sobre problemas muy complejos.
Resolver estos problemas en la ciencia de datos requiere la selección de modelos apropiados y la creación de características, que luego se ajustan rigurosamente para producir resultados precisos y útiles. Esto, si alguna vez has hecho ciencia de datos que sabrías, es un trabajo muy duro que requiere días e incluso semanas de trabajo.
- Cómo decidir el tamaño de la muestra para el aprendizaje automático con datos de series temporales
- ¿Puede un fármaco ser estadísticamente efectivo para toda la población, pero estadísticamente no es efectivo para todas las subpoblaciones (como hombres y mujeres) por separado?
- Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST
- Para un maestro en aprendizaje automático, ¿cuál sería una mejor opción, KTH (MS en aprendizaje automático) o Chalmers (MS en sistemas adaptativos complejos)?
- ¿Cómo explicaría la desigualdad de Hoeffding y, como consecuencia natural, la dimensión Vapnik Chervonenkis a un niño de diez años?
Como científico de datos, siempre enfrenta dilemas lanzados desde prácticamente cualquier dirección. ¿Cómo debes limpiar los datos? ¿Qué método de aprendizaje automático debe usar? ¿Qué características debe seleccionar / combinar? ¿Qué métodos de optimización y validación debería utilizar? Hay una cantidad asombrosamente grande de opciones para tomar, la mayoría de ellas dependiendo de algunas reglas generales o preferencias determinadas por expertos que son difíciles de cuantificar, incluso si el método seleccionado en sí es de naturaleza matemáticamente sólida.
El estadístico automático es un proyecto en curso para crear una especie de científico de datos automatizado . Su objetivo es automatizar los procedimientos que sigue el científico de datos, utilizando técnicas de selección de modelos bayesianas para seleccionar los modelos y las características, y procediendo a ajustarlos automáticamente para producir inferencias que el usuario busca.
Las ambiciones del equipo tampoco terminan ahí. Incluso están haciendo que el sistema produzca sus inferencias en forma de informe en un formato legible para humanos, completo con gráficos y similares. Ahora si eso no es asombroso, no sé lo que es.
Creo que esto es alucinante debido a su ambición. En mi opinión, si logra alcanzar sus objetivos originales, sería una gran mella, haciendo que el trabajo más sexy del siglo sea tan sexy como un canguro que se despierta con una resaca después de una noche de fiesta.