TL; DR Sí, para seguir siendo relevante.
Mis amigos Jessy Hwang y Keli Liu le preguntaron esto a Xiao-Li Meng, ex presidente del Departamento de Estadística de Harvard y actual decano de la Escuela de Graduados de Artes y Ciencias de Harvard. En resumen, dijo:
- Se siente incómodo porque las estadísticas se quedan fuera cuando la gente habla sobre ciencia de datos.
- Le preocupa que los practicantes de ciencias de datos / ML se burlen de las estadísticas de la misma manera que los estadísticos se burlan de los matemáticos.
- Señala el destino divertido de que las estadísticas son un spin-off más aplicable de las matemáticas, pero ahora es el turno de ML / data science para ser un spin-off más aplicable de las estadísticas.
- Como los estadísticos han ayudado a reorientar las matemáticas para que sean más relevantes, él cree que la ciencia de ML / datos reorientará las estadísticas para que sean más relevantes.
- Admite que las estadísticas deben adaptarse para seguir siendo relevantes, sin embargo, quiere preservar el “panorama general de las estadísticas”: varios conceptos clave que incluyen el condicionamiento, el equilibrio de sesgo-varianza, etc.
(He hecho todo lo posible para representar con precisión lo que dijo. Si hubo alguna mala interpretación, ¡la culpa es mía!)
Aquí está su respuesta completa del artículo (el énfasis es mío):
- ¿Qué piensa Pedro Domingos de la investigación de aprendizaje automático que está ocurriendo en la industria versus la academia?
- ¿Sigue siendo útil saber HTML hoy?
- Cómo interpretar la trama de ACF
- ¿Cómo aprendiste Machine Lerning?
- ¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización?
¿Crees que las estadísticas necesitan un cambio de marca, en respuesta a la ciencia de datos y el aprendizaje automático?
No me he convencido de ninguna manera. Recientemente me pidieron que me uniera a un equipo de personas que escribían un artículo argumentando que necesitamos contratar a más personas en ciencia de datos. Finalmente me sentí incómodo al decir que necesitamos ciencia de datos sin mencionar las estadísticas. Había informáticos y científicos de la información en este equipo, pero ninguno de ellos discutía por sus campos; Todos estaban discutiendo por la ciencia de datos. Eso me hizo hacer una pausa, porque estaba más preocupado por las estadísticas.
Tal vez hay una imagen más amplia para la que todos debemos unirnos, pero si lo hacemos, ¿qué pasará con las estadísticas? Tengo dos pensamientos, una preocupación egoísta y una noble preocupación. Mi preocupación egoísta es preservar mi identidad como estadístico. Mi preocupación más noble es, ¿estamos perdiendo el pensamiento estadístico? ¿Los conceptos como el condicionamiento, que consideramos tan fundamental, van a ser marginados? Sin juego de palabras. Entiendo por qué algunos filósofos se agitan, porque la filosofía solía ser todo, pero ahora escuchas a algunas personas decir: “Oh, aquí hay un filósofo, no trabajan en nada real”. También hay un paralelo histórico: una forma de pensar sobre el aprendizaje automático y la ciencia de datos es que son spin-offs de estadísticas.
Pero nosotros mismos somos un spin-off de las matemáticas. Todos hablaban de ciencias matemáticas, pero un pequeño grupo se hacía llamar estadísticos, y crecieron y crecieron hasta convertirse en nosotros. Los matemáticos deben pensar: “Estas personas nunca hacen matemáticas serias y rigurosas”. Pero también escuchan a los estadísticos decir que los matemáticos no se ocupan de problemas de la vida real y que tenemos las respuestas porque tenemos todos estos principios estadísticos. Lo que me preocupa es, ¿dicen los científicos de datos: “Estos estadísticos, colgados de estos modelos rigurosos, no entienden los cálculos y las complicaciones de la vida real”?
Esta historia muestra que necesitamos adaptarnos al nuevo entorno de datos de manera proactiva, pero ¿podemos convertir esto en una transformación que conserve la información? Mi formación matemática me hace darme cuenta de que la parte de las matemáticas que no funciona para nosotros es una parte tan pequeña. Un estadístico nunca debe decir: “Las matemáticas no se ocupan de problemas reales, así que cerremos el departamento de matemáticas”. Eso sería completamente incorrecto. Lo que hemos hecho es reorientar las matemáticas hacia construcciones y suposiciones prácticamente relevantes, manteniendo al mismo tiempo el pensamiento lógico. ¿Cómo continuamos pensando en el panorama general de las estadísticas, como el equilibrio de la variación de sesgo, la minimización de la pérdida de información, el condicionamiento, la elección de las réplicas correctas, mientras se renuevan las partes de estadísticas inapropiadas para las aplicaciones modernas?
Fuente: http://icsa.org/bulletin/issues/…
Como científico de datos y ex especialista en estadísticas, diré que al menos una de las preocupaciones de Xiao-Li está completamente fundada. Desafortunadamente, los estadísticos se burlan ocasionalmente, exactamente de la misma manera que él imaginó: “Estos estadísticos, colgados de estos modelos rigurosos, no entienden los cálculos y las complicaciones de la vida real”.
Otras lecturas:
- ¿Cuál es la diferencia entre ciencia de datos y estadística?
- ¿Cuál es la diferencia entre estadística y aprendizaje automático?
- ¿Cuál es la relación entre estadísticos y científicos de datos? (Resumo otra de las respuestas de Xiao-Li)