Sí, en realidad es verdad. Como estadístico por capacitación, podría decir que si desea hacer estadísticas reales , solo tiene una opción: R (o SAS). Esto se debe a que R se ha creado con ese propósito en mente y encontrará las técnicas estadísticas más actualizadas ya implementadas en funciones individuales. Hacer lo mismo es Python sería imposible ( por ejemplo, si desea ajustar un GLMM en Python, tendría que codificar todo usted mismo, porque no existe una implementación para ello).
Por el contrario, si solo quieres hacer ML (y hoy en día los límites entre las estadísticas y ML son bastante borrosos), Python está absolutamente bien: en realidad lo estoy usando ahora para mi disertación para construir una red neuronal para la clasificación de imágenes.
Nota al margen: Minería de datos / Ciencia de datos simplemente define el superconjunto formado por Estadísticas (principalmente enfoques paramétricos) y ML (enfoques no paramétricos).
- ¿Cómo puede un estudiante de CS en su segundo año de ingeniería (en una universidad de nivel 3) encontrar su dominio / área de interés en ciencias de la computación?
- ¿Sigue siendo una amenaza el hack de compilación de Ken Thompson?
- Cómo convertirse en un técnico
- ¿Por qué necesitamos comunicaciones entre procesos?
- ¿Cuál sería una descripción rápida de las diferencias entre un informático, un software y un ingeniero de redes?
Para resumir: Sí, su intuición es correcta.