¿Qué deben saber todos sobre el aprendizaje automático?

Como alguien que a menudo se encuentra explicando el aprendizaje automático a no expertos, ofrezco la siguiente lista como un anuncio de servicio público.

  1. El aprendizaje automático significa aprender de los datos ; La IA es una palabra de moda. El aprendizaje automático está a la altura de las expectativas: hay una increíble cantidad de problemas que puede resolver al proporcionar los datos de entrenamiento correctos a los algoritmos de aprendizaje correctos. Llámelo AI si eso lo ayuda a venderlo, pero sepa que la IA, al menos como se usa fuera de la academia, a menudo es una palabra de moda que puede significar lo que la gente quiera que signifique.
  2. El aprendizaje automático se trata de datos y algoritmos, pero principalmente de datos. Hay mucha emoción sobre los avances en los algoritmos de aprendizaje automático, y particularmente sobre el aprendizaje profundo. Pero los datos son el ingrediente clave que hace posible el aprendizaje automático. Puede tener aprendizaje automático sin algoritmos sofisticados, pero no sin buenos datos.
  3. A menos que tenga muchos datos, debe apegarse a modelos simples. El aprendizaje automático entrena un modelo a partir de patrones en sus datos, explorando un espacio de posibles modelos definidos por parámetros. Si su espacio de parámetros es demasiado grande, se sobreajustará a sus datos de entrenamiento y formará un modelo que no se generaliza más allá. Una explicación detallada requiere más matemática, pero, por regla general, debe mantener sus modelos lo más simples posible.
  4. El aprendizaje automático solo puede ser tan bueno como los datos que usa para entrenarlo. La frase “basura adentro, basura afuera” es anterior al aprendizaje automático, pero caracteriza adecuadamente una limitación clave del aprendizaje automático. El aprendizaje automático solo puede descubrir patrones que están presentes en sus datos de entrenamiento. Para tareas supervisadas de aprendizaje automático como la clasificación, necesitará una colección sólida de datos de entrenamiento correctamente etiquetados y con muchas funciones.
  5. El aprendizaje automático solo funciona si sus datos de entrenamiento son representativos. Al igual que un prospecto del fondo advierte que “el rendimiento pasado no es garantía de resultados futuros”, el aprendizaje automático debería advertir que solo se garantiza que funcione para los datos generados por la misma distribución que generó sus datos de capacitación. Esté atento a los sesgos entre los datos de entrenamiento y los datos de producción, y vuelva a entrenar sus modelos con frecuencia para que no se vuelvan obsoletos.
  6. La mayor parte del trabajo duro para el aprendizaje automático es la transformación de datos. Al leer el bombo publicitario sobre las nuevas técnicas de aprendizaje automático, puede pensar que el aprendizaje automático se trata principalmente de seleccionar y ajustar algoritmos. La realidad es más prosaica: la mayor parte de su tiempo y esfuerzo se dedica a la limpieza de datos y la ingeniería de características, es decir, transformar las características sin procesar en características que representan mejor la señal en sus datos.
  7. El aprendizaje profundo es un avance revolucionario, pero no es una bala mágica. El aprendizaje profundo se ha ganado su entusiasmo al ofrecer avances en una amplia gama de áreas de aplicación de aprendizaje automático. Además, el aprendizaje profundo automatiza parte del trabajo realizado tradicionalmente a través de la ingeniería de características, especialmente para datos de imagen y video. Pero el aprendizaje profundo no es una bala de plata. No puede usarlo de inmediato, y aún tendrá que invertir un esfuerzo significativo en la limpieza y transformación de datos.
  8. Los sistemas de aprendizaje automático son altamente vulnerables al error del operador. Con disculpas a la NRA, “los algoritmos de aprendizaje automático no matan a las personas; las personas matan a las personas ”. Cuando los sistemas de aprendizaje automático fallan, rara vez se debe a problemas con el algoritmo de aprendizaje automático. Lo más probable es que haya introducido un error humano en los datos de entrenamiento, creando un sesgo o algún otro error sistemático. Sea siempre escéptico y aborde el aprendizaje automático con la disciplina que aplica a la ingeniería de software.
  9. El aprendizaje automático puede crear inadvertidamente una profecía autocumplida. En muchas aplicaciones de aprendizaje automático, las decisiones que toma hoy afectan los datos de capacitación que recopilará mañana. Una vez que su sistema de aprendizaje automático incorpora sesgos en su modelo, puede continuar generando nuevos datos de entrenamiento que refuerzan esos sesgos. Y algunos prejuicios pueden arruinar la vida de las personas. Sea responsable: no cree profecías autocumplidas.
  10. La IA no se volverá consciente de sí misma, se levantará y destruirá a la humanidad. Un sorprendente número de personas (tos) parecen estar obteniendo sus ideas sobre inteligencia artificial de las películas de ciencia ficción. Deberíamos estar inspirados en la ciencia ficción, pero no tan crédulos como para confundirlos con la realidad. Hay suficientes peligros reales y actuales de los que preocuparse, desde seres humanos conscientemente malvados hasta modelos de aprendizaje automático sesgados inconscientemente. Para que pueda dejar de preocuparse por SkyNet y la “superinteligencia”.

Hay mucho más sobre el aprendizaje automático de lo que puedo explicar en una lista de los 10 principales. Pero espero que esto sirva como una introducción útil para los no expertos.

Lo primero es lo primero, todos deben saber que el aprendizaje automático [1] (ML abreviado en esta respuesta) es un campo vasto y complejo.

ML ganó una tracción significativa en los últimos años gracias a los avances de las técnicas de aprendizaje profundo [2]. De hecho, estos han mejorado últimamente gracias a la explosión de los recursos y datos computacionales disponibles y a las nuevas técnicas de ingeniería (especialmente el uso de GPU).

Toda esta mejora tuvo un gran impacto en los problemas del mundo real: el reconocimiento de imágenes y la traducción son algunas de las pocas aplicaciones que han mejorado más allá de la imaginación.

Por desgracia, (algunos de) los medios de comunicación hicieron del tema un tema sensacional y actualmente están explotando activamente el miedo de las masas a “matar a la IA”.

Esa fue la introducción general. Entremos en más detalles:

  • A pesar de la moda reciente, ML no es un campo reciente. Uno puede rastrear sus orígenes hasta el reconocimiento de patrones [3] y la teoría del aprendizaje computacional [4]. En cambio, como se indicó en la introducción, lo reciente es el éxito que está teniendo (principalmente gracias al aumento de las enormes colecciones de datos y la disponibilidad de cómputo barato).
  • En el pasado, ML experimentó períodos de “invierno” [5] donde los fondos eran escasos. Con suerte, no más inviernos por venir.
  • ML es una disciplina informática que consiste en hacer que las computadoras “aprendan” de los datos en lugar de las instrucciones de programación. Por ejemplo, imagine que tenía que implementar un software de reconocimiento de género (masculino frente a femenino). Si tuviera que implementar esto de la manera tradicional, necesitaría extraer características que lo ayudarían a decidir. Luego, escribiría una gran cantidad de código para instruir a la computadora sobre cómo usar estas funciones. Desafortunadamente, este enfoque es tedioso y no lo suficientemente robusto. Por otro lado, el enfoque de ML consiste en recolectar muchas imágenes y etiquetarlas. Luego, ejecute un algoritmo ML que aprenderá la tarea observando los datos. Por cierto, este enfoque se llama aprendizaje supervisado.
  • Los algoritmos de ML vienen en varios sabores. Una de las formas más utilizadas es el aprendizaje supervisado [6] como se discutió en el ejemplo anterior. Consiste en proporcionar a la computadora datos sobre lo que se debe aprender (esto se llama características ) y también lo que se debe aprender (esto se llama objetivo ). En el ejemplo anterior, una característica sería la altura de la persona (para algoritmos tradicionales) o los bordes de la imagen (para un modelo de aprendizaje profundo). El objetivo sería el género. Por el contrario, en el aprendizaje no supervisado [7] no se proporciona el objetivo y el algoritmo tiene que basarse en otras representaciones para aprender.
  • En el mundo del aprendizaje supervisado, existe una distinción adicional entre clasificación [8] y regresión [9]. El ejemplo de reconocimiento anterior es un problema de clasificación ya que consiste en clasificar instancias discretas (masculinas o femeninas). Un problema de regresión sería aprender cómo varían los precios de los apartamentos (un objetivo continuo ) según la ubicación.
  • El aprendizaje profundo es un subcampo de ML . Se denomina “profundo” porque utiliza estructuras de redes neuronales (artificiales) [10] con muchas capas.
  • ML es un campo en evolución y emocionante . Existen muchos trabajos y muchos más lo harán. Es la forma moderna de alfabetización [11] en nuestra sociedad tecnológica y basada en datos. Aprende sobre esto tanto como puedas.
  • Finalmente, las versiones actuales de los modelos ML no te matarán, ya que no son sensibles [12] y el camino para hacerlos de esta manera es incierto y distante. Sin embargo, ML utilizado dentro de las armas y entrenado para hacerlo podría hacerlo. Es por eso que es crucial informar a tantas personas como sea posible sobre ML, qué es (y qué no es) realmente y cómo usarlo para grandes cosas (evitando aplicaciones poco éticas).

Espero que esto ayude.

Notas al pie

[1] Aprendizaje automático – Wikipedia

[2] Aprendizaje profundo – Wikipedia

[3] Reconocimiento de patrones – Wikipedia

[4] Teoría del aprendizaje computacional – Wikipedia

[5] AI invierno – Wikipedia

[6] Aprendizaje supervisado – Wikipedia

[7] Aprendizaje no supervisado – Wikipedia

[8] Clasificación estadística – Wikipedia

[9] Análisis de regresión – Wikipedia

[10] Red neuronal artificial – Wikipedia

[11] Alfabetización – Wikipedia

[12] Sentience – Wikipedia