¿Podemos aplicar el aprendizaje automático en cualquier idioma o hay algo específico que sirva para ese propósito? ¿Cuáles son los modelos matemáticos efectivos utilizados principalmente en ML?

Para empezar, ML es un conjunto de algoritmos que intenta integrar la “capacidad de aprendizaje” en las máquinas. Por lo tanto, siempre que el lenguaje de programación que use sea Turing completo (integridad de Turing), puede usarlo para realizar cualquier tarea de ML.

Sin embargo, existen algunos lenguajes que son más eficientes, menos verbosos, con mejor soporte y bibliotecas y con comunidades más grandes y más amplias para realizar e implementar programas de LD. Mis favoritos (y hasta cierto punto la comunidad de Data Science) son: Python (con la biblioteca scikit-learn) y R.

Para la segunda parte de su respuesta, diría que cualquier modelo matemático podría ser bueno siempre que:

  • Existe un equilibrio entre la simplicidad de implementación y el poder de predicción
  • Existe una buena compensación entre un ajuste excesivo y un ajuste insuficiente
  • La métrica de evaluación está bien diseñada y se adapta a los datos que está viendo.

Si esta respuesta es demasiado general para usted, finalmente diría que dos técnicas para comenzar a aprender serían MLE (estimador de máxima verosimilitud) y OLS (mínimos cuadrados ordinarios) que se usan ampliamente. Después de eso, puede pasar a las variantes (versiones regulares de OLS como LASSO y Ridge …).

¡Disfruta aprendiendo y buena suerte!


Fuentes y enlaces útiles:

Software | Kaggle

scikit-learn: aprendizaje automático en Python
Bienvenido a Python.org
La red completa de archivos R
Máxima verosimilitud
Mínimos cuadrados ordinarios