Como alguien que a menudo se encuentra explicando el aprendizaje automático a no expertos, ofrezco la siguiente lista como un anuncio de servicio público.
- El aprendizaje automático significa aprender de los datos ; La IA es una palabra de moda. El aprendizaje automático está a la altura de las expectativas: hay una increíble cantidad de problemas que puede resolver al proporcionar los datos de entrenamiento correctos a los algoritmos de aprendizaje correctos. Llámelo AI si eso lo ayuda a venderlo, pero sepa que la IA, al menos como se usa fuera de la academia, a menudo es una palabra de moda que puede significar lo que la gente quiera que signifique.
- El aprendizaje automático se trata de datos y algoritmos, pero principalmente de datos. Hay mucha emoción sobre los avances en los algoritmos de aprendizaje automático, y particularmente sobre el aprendizaje profundo. Pero los datos son el ingrediente clave que hace posible el aprendizaje automático. Puede tener aprendizaje automático sin algoritmos sofisticados, pero no sin buenos datos.
- A menos que tenga muchos datos, debe apegarse a modelos simples. El aprendizaje automático entrena un modelo a partir de patrones en sus datos, explorando un espacio de posibles modelos definidos por parámetros. Si su espacio de parámetros es demasiado grande, se sobreajustará a sus datos de entrenamiento y formará un modelo que no se generaliza más allá. Una explicación detallada requiere más matemática, pero, por regla general, debe mantener sus modelos lo más simples posible.
- El aprendizaje automático solo puede ser tan bueno como los datos que usa para entrenarlo. La frase “basura adentro, basura afuera” es anterior al aprendizaje automático, pero caracteriza adecuadamente una limitación clave del aprendizaje automático. El aprendizaje automático solo puede descubrir patrones que están presentes en sus datos de entrenamiento. Para tareas supervisadas de aprendizaje automático como la clasificación, necesitará una colección sólida de datos de entrenamiento correctamente etiquetados y con muchas funciones.
- El aprendizaje automático solo funciona si sus datos de entrenamiento son representativos. Al igual que un prospecto del fondo advierte que “el rendimiento pasado no es garantía de resultados futuros”, el aprendizaje automático debería advertir que solo se garantiza que funcione para los datos generados por la misma distribución que generó sus datos de capacitación. Esté atento a los sesgos entre los datos de entrenamiento y los datos de producción, y vuelva a entrenar sus modelos con frecuencia para que no se vuelvan obsoletos.
- La mayor parte del trabajo duro para el aprendizaje automático es la transformación de datos. Al leer el bombo publicitario sobre las nuevas técnicas de aprendizaje automático, puede pensar que el aprendizaje automático se trata principalmente de seleccionar y ajustar algoritmos. La realidad es más prosaica: la mayor parte de su tiempo y esfuerzo se dedica a la limpieza de datos y la ingeniería de características, es decir, transformar las características sin procesar en características que representan mejor la señal en sus datos.
- El aprendizaje profundo es un avance revolucionario, pero no es una bala mágica. El aprendizaje profundo se ha ganado su entusiasmo al ofrecer avances en una amplia gama de áreas de aplicación de aprendizaje automático. Además, el aprendizaje profundo automatiza parte del trabajo realizado tradicionalmente a través de la ingeniería de características, especialmente para datos de imagen y video. Pero el aprendizaje profundo no es una bala de plata. No puede usarlo de inmediato, y aún tendrá que invertir un esfuerzo significativo en la limpieza y transformación de datos.
- Los sistemas de aprendizaje automático son altamente vulnerables al error del operador. Con disculpas a la NRA, “los algoritmos de aprendizaje automático no matan a las personas; las personas matan a las personas ”. Cuando los sistemas de aprendizaje automático fallan, rara vez se debe a problemas con el algoritmo de aprendizaje automático. Lo más probable es que haya introducido un error humano en los datos de entrenamiento, creando un sesgo o algún otro error sistemático. Sea siempre escéptico y aborde el aprendizaje automático con la disciplina que aplica a la ingeniería de software.
- El aprendizaje automático puede crear inadvertidamente una profecía autocumplida. En muchas aplicaciones de aprendizaje automático, las decisiones que toma hoy afectan los datos de capacitación que recopilará mañana. Una vez que su sistema de aprendizaje automático incorpora sesgos en su modelo, puede continuar generando nuevos datos de entrenamiento que refuerzan esos sesgos. Y algunos prejuicios pueden arruinar la vida de las personas. Sea responsable: no cree profecías autocumplidas.
- La IA no se volverá consciente de sí misma, se levantará y destruirá a la humanidad. Un sorprendente número de personas (tos) parecen estar obteniendo sus ideas sobre inteligencia artificial de las películas de ciencia ficción. Deberíamos estar inspirados en la ciencia ficción, pero no tan crédulos como para confundirlos con la realidad. Hay suficientes peligros reales y actuales de los que preocuparse, desde seres humanos conscientemente malvados hasta modelos de aprendizaje automático sesgados inconscientemente. Para que pueda dejar de preocuparse por SkyNet y la “superinteligencia”.
Hay mucho más sobre el aprendizaje automático de lo que puedo explicar en una lista de los 10 principales. Pero espero que esto sirva como una introducción útil para los no expertos.
- ¿Cuál es el caso más infame, desde el punto de vista financiero y de reputación, de que un algoritmo de aprendizaje automático falla debido a una fuga objetivo?
- ¿Cómo usan las redes sociales la inteligencia artificial?
- ¿Cuál es su opinión sobre el argumento de la habitación china de John Searle?
- ¿Qué universidades debe considerar un indio con obligaciones familiares para su doctorado en Machine Learning / Deep Learning / AI?
- ¿Qué diferencia exactamente una red neuronal recurrente de una red de alimentación directa con una ventana de tiempo limitado?