¿Es necesario conocer la teoría detrás del aprendizaje automático ya que Python tiene tantos paquetes?

Sí lo es. En lo básico, la intuición detrás de los algoritmos. Si conoce la intuición, sabrá los requisitos previos, cómo preparar los datos, cómo medir el rendimiento de su modelo.

Supongamos que ejecuta todos los paquetes posibles sobre sus datos y que puede obtener algún resultado, por ejemplo, tiene un problema de clasificación, ejecuta todo, imprime todas las matrices de confusión y, en función de eso, elige un modelo.

¿Ahora que? ¿Elegiste el modelo correcto? ¿Está sobreajustado? ¿Escogió el modelo correcto para su cuerpo de datos? Si no, ¿por qué? ¿Qué pasaría si ensamblas modelos?

Aún más importante, ¿cómo preparó los datos? ¿Lo preprocesó? ¿Fue el proceso previo igual para todos los modelos? ¿Si es así por qué? ¿Si no, porque no?

Todas estas preguntas ocurren antes y después de ajustar un modelo para validar nuestro conocimiento de los datos y los supuestos del modelo. Eso solo es posible cuando se conoce la intuición detrás del modelo. Cualquiera puede escribir la línea de código para que se ajuste a un modelo. Muy pocas personas saben qué hacer antes y después de esa línea.


Dado que las otras respuestas ya estaban detalladas sobre el tema, pensé que solo referiría este diagrama como un recordatorio visual de las preguntas asociadas a este tema 🙂

Como tal, también recomendaría a un experto por la experiencia sustantiva establecida para evitar reducir el análisis a la comparación de errores. El análisis exploratorio es hermoso si se hace correctamente y, a menudo, supervisado en la prisa por ejecutar algoritmos dada la gran cantidad de bibliotecas que existen.

En primer lugar, gracias por A2A. Por lo general, es importante conocer la teoría, porque cada algoritmo tiene su fuerza y ​​debilidad Owen, y a veces es más adecuado para ciertas situaciones, mientras que no lo es para otros. La mayoría de los libros de texto clásicos, como Los elementos de aprendizaje estadístico, Reconocimiento de patrones y Aprendizaje automático , ofrecen una buena explicación de los más importantes. Es útil tener algún conocimiento de ellos antes de ponerlos en uso.