Trabajé en y con el aprendizaje automático (ML) durante varios años, haciendo investigación y desarrollo. Durante ese tiempo, dirigí y participé en el desarrollo de una serie de sistemas basados en aprendizaje automático que se utilizaron en la producción.
Para su pregunta, lo mejor con mucho es aprender ML “desde cero” y familiarizarse con las bibliotecas / plataformas disponibles. Este último puede ahorrar mucho trabajo, pero para poder utilizarlos de manera efectiva, uno necesita el primero.
En la mayoría de las aplicaciones en las que trabajé, la parte más crítica de encontrar una solución viable fue crear un buen conjunto de características: el conjunto de atributos / medidas que utiliza el algoritmo ML para hacer lo que hace. En raras ocasiones, uno de estos paquetes lo hará automáticamente. Puede haber algunas herramientas para ayudarlo, pero necesitará información y comprensión para utilizarlas.
- Cómo diseñar una red neuronal para predecir la rutina diaria de un usuario
- ¿Qué tan buena será una carrera en IA / aprendizaje automático en el futuro?
- ¿Cómo es trabajar en el equipo de Machine learning / Data Mining?
- ¿Qué significan las redes bayesianas en Machine Learning?
- ¿Por qué decimos que las redes neuronales simples no pueden manejar la entrada de longitud variable?
Esto puede haber cambiado ahora que la “ciencia de datos” se ha convertido en un campo candente, pero, en mi experiencia, un área donde la mayoría de los graduados en ciencias de la computación son deficientes cuando se trata de ML es ciertos aspectos de las estadísticas, especialmente una comprensión “fundamental”. Esto es importante para cosas como determinar el número óptimo de características, el tamaño óptimo del conjunto de entrenamiento, comprender profundamente lo que significa obtener una muestra representativa, cómo hacer un muestreo estratificado y tratar esas muestras en un procedimiento / algoritmo de ML. Esto es importante para una población desequilibrada. Por ejemplo, en un simple problema de detección binaria, la población puede contener muchos menos ejemplos positivos (lo que desea detectar) que negativos. En el extremo, esto se convierte en lo que se conoce como detección de “eventos raros”.
Finalmente, una comprensión profunda de ML generalmente es crítica para diagnosticar problemas: cuando algo no funciona correctamente o lo suficientemente bien, cuáles son las causas probables, cómo verificar una hipótesis relacionada y cómo solucionar el problema.