Cómo saber cuándo usar el aprendizaje automático y cuándo no

No puede saber cuándo usarlo o no en general porque limitará en gran medida sus posibles avances y ganancias inesperadas.

Hasta 1998, era fácil decir que usara solo la densidad de palabras clave en la búsqueda en Internet, como lo hizo Altavista. No podría haberle dicho a nadie más que usara otros métodos, ciertamente no matemáticos basados ​​en el análisis de valores propios de Álgebra lineal hasta que aparecieron Larry Page y Sergey Brin y reescribieron por completo la sabiduría convencional de qué usar en la búsqueda.

De manera similar, hasta 2012 no se le podía decir a nadie en Computer Vision que podrían producir resultados de procesamiento de imágenes de clase mundial hasta que Geoffrey Hinton apareciera y reescribiera el libro, lo que incitó un enorme aumento en el interés y la conciencia de la IA en general.

En resumen, uno puede decirle cuándo usar ML o no de acuerdo con la sabiduría convencional en este momento, pero inevitablemente correrá el riesgo de perder grandes ganancias potenciales con algunos avances completamente inesperados.

No hay una respuesta “única para todos” a esta pregunta, pero si tuviera que hacer una generalización general, sería, primero, clasificar el análisis como confirmatorio o exploratorio y elegir el enfoque o método en función de esa tarea. .

Pienso en el análisis y los modelos “confirmatorios” como el tipo de cosas que uno hace en la mayoría de los programas de doctorado en los que trabaja con un asesor en un área que posee un marco teórico bien desarrollado, un conjunto finito de características predefinidas, un diseño cuidadosamente diseño experimental, así como hipótesis cuidadosamente especificadas que su estudio pretende probar. Este es el tipo de investigación que fue el foco de la mayoría de la teoría estadística del siglo XX. La investigación “exploratoria”, por otro lado y en su mayor parte, carece de muchas de esas cualidades. De hecho, en el caso de cantidades realmente masivas de datos e información, los enfoques confirmatorios se descomponen por completo debido al gran volumen de datos. En otras palabras, simplemente no es posible establecer cuidadosamente un conjunto finito de hipótesis comprobables en presencia de cientos, mucho menos miles, y mucho menos millones de características.

Por lo tanto, y nuevamente, en términos generales, los algoritmos y enfoques de ML son los más adecuados para la modelación y clasificación predictiva exploratoria con cantidades masivas de datos y características computacionalmente complejas. Algunos afirmarán que pueden usarse en datos “pequeños”, pero ¿por qué uno lo haría cuando los métodos estadísticos clásicos y multivariados son mucho más informativos?

ML es un campo que, en gran parte, aborda cuestiones derivadas de la tecnología de la información, la informática, etc., que pueden ser problemas tanto teóricos como aplicados. Como tal, se relaciona con campos como la física, las matemáticas, la probabilidad y las estadísticas, pero ML es realmente un campo en sí mismo, un campo que no está afectado por las preocupaciones planteadas en las otras disciplinas. Como analista que se aflojó en los métodos y herramientas clásicos y estadísticos multivariados, muchas de las soluciones que los expertos y profesionales de ML presentan están dolorosamente equivocadas … pero hacen el trabajo.

Las tareas de aprendizaje automático generalmente se dividen en una de dos categorías:

  1. Aprendizaje supervisado: datos dados y “respuestas correctas”, usted entrena un modelo de aprendizaje automático para “aprender” las respuestas correctas para datos no vistos. Por ejemplo, en una tarea de clasificación, tiene imágenes diferentes. Cada uno tiene una etiqueta, por ejemplo, “gato”, “perro”, “casa”. La tarea del aprendizaje supervisado es aprender un modelo tal que cuando tenga otra imagen de un gato, un perro o una casa, lo clasifique correctamente. Otro tipo de aprendizaje supervisado es la regresión, donde su “respuesta correcta” es solo un número que puede tomar cualquier valor. Por ejemplo, dados varios datos de casas y su respectivo valor de mercado. Una tarea de regresión es aquella en la que entrena un modelo para aprender a fijar el precio de las viviendas a partir de los datos.
  2. Aprendizaje sin supervisión: las tareas aquí no requieren “respuestas correctas”; Las tareas aquí tienen que ver principalmente con la búsqueda de estructura en sus datos. Por ejemplo, si tiene algunos datos de encuestas de personas, encontrará que las personas con ingresos similares se comportan de manera similar.

Por lo tanto, si tiene una tarea que se encuentra en cualquiera de las dos anteriores, es probable que desee utilizar el aprendizaje automático.

Puede haber otras tareas que desee que haga una máquina; como, por ejemplo, tomar buenas decisiones, dado algún mecanismo de puntuación. Es posible que desee examinar una familia relacionada de algoritmos llamada Aprendizaje por refuerzo. Clásicamente, estos no caen bajo el aprendizaje automático, pero junto con el aprendizaje automático, caen bajo la Inteligencia Artificial.

Espero que ayude.

Esta respuesta tendrá que ser actualizada a medida que el conocimiento de ML se expande (y la IA se expande). En este momento se encuentra de la siguiente manera:

Si la tarea es programable => programarla

si no, pregúntese por qué no puede y vea si puede usar algún otro método para resolverlo.

si nada en los pasos anteriores funcionó, suponiendo que tenga algunos datos, intente usar ML. Sin embargo, este paso va a cambiar qué tan bien funciona dependiendo del punto en el tiempo. En el punto de este escrito, espero que tenga suficientes datos y pueda realizar una tarea supervisada y no necesite un aprendizaje profundo. Si necesita un aprendizaje profundo, entonces los requisitos de datos y cómputo han aumentado bastante.

¿Puede resolver su problema que intenta resolver aplicando el aprendizaje automático? si es así puedes seguir adelante. Tenga en cuenta que los problemas pragmáticos / deterministas, por ejemplo, la resolución de ecuaciones o el servicio de sitios web, no son adecuados para ser resueltos por el aprendizaje automático. Los problemas como el reconocimiento óptico de caracteres (OCR) o el reconocimiento de voz son adecuados para ser resueltos mediante aprendizaje automático.

Si puede codificarlo, entonces no use ML. Si no puede codificarlo, espero que ML pueda usarse para resolver cualquier problema que esté enfrentando.

Para predecir, clasificar u optimizar, puede utilizar el aprendizaje automático. Todo lo que se aprende (entrenamiento) y se realiza en consecuencia (prueba) puede usar el aprendizaje automático en general.

More Interesting

¿Es posible engañar a un automóvil autónomo para interpretar una señal de alto (como lo percibe el ojo humano) como una señal de velocidad?

¿Qué valor cree que tiene la selección de funciones en el aprendizaje automático? ¿Cuál crees que mejora más la precisión, la selección de características o la ingeniería de características?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

¿Qué es un giroscopio? ¿Como funciona?

¿Cuál es la pérdida latente en autoencoders variacionales?

¿Hay algún sitio web donde pueda encontrar ideas para mi tesis de licenciatura en Informática? (Estoy interesado en algoritmos y aprendizaje automático).

¿Qué implementaciones de la capa convolucional utiliza la biblioteca CuDNN para optimizar el rendimiento de la velocidad? Por ejemplo, ¿cambia entre implementaciones dependiendo del tamaño del filtro?

¿El aprendizaje automático es un subconjunto de la ciencia de datos?

¿Dónde puedo encontrar el conjunto de datos para un sistema de recomendación?

Cómo detectar texto / imágenes en una imagen de documento

¿Cuáles son algunos buenos tutoriales y códigos de aprendizaje profundo disponibles para problemas de clasificación binaria? ¿Es necesario tener una GPU para ejecutar el aprendizaje profundo y, de no ser así, de qué manera podemos llevarlo a cabo?

¿Cuáles son algunos de los mejores cursos de ML para una maestría en India?

¿Cuáles son los trabajos más gratificantes para quienes desean trabajar en el aprendizaje profundo?

¿Por qué son escasos los autoencoders escasos?

¿Cuáles son algunas trampas comunes al estudiar la clasificación en el aprendizaje automático?