¿Dónde no se puede aplicar el aprendizaje automático?

  1. Tamaño de datos pequeño: si el tamaño de los datos es muy pequeño (generalmente menos de 1000), es difícil incluso para el modelo de aprendizaje automático más simple. Especialmente si el número de atributos (número de columnas) es mayor que no. de puntos de datos (no. de filas).
  2. Lenguaje: la mayoría de las técnicas clásicas de PNL (procesamiento del lenguaje natural) utilizan un enfoque principalmente heurístico (basado en reglas gramaticales) para procesar el texto. Por ejemplo, la derivación y la lematización de palabras que implican convertir diferentes partes del discurso en su forma raíz (conversión lenta a lenta) no es un enfoque basado en el aprendizaje automático.

Esencialmente, el aprendizaje automático es útil cuando desea predecir una variable condicional basada en variables incondicionales. Debería analizar el problema y ver si ese es el caso con su problema. Si no es así, tal vez el aprendizaje automático no sea adecuado. Si es así, el aprendizaje automático debería ser adecuado. Sin embargo, qué enfoque y modelo de aprendizaje automático funcionará variaría mucho según el problema.

La gente piensa que ML puede aplicarse en todas partes y tiene muchas aplicaciones, pero hay muchas en las que tampoco es la herramienta adecuada. En realidad, es realmente difícil hacer que los sistemas de ML funcionen bien.

Por ejemplo, es algo divertido / humorístico resolver el desafío del fizz buzz con CNN’s, pero realmente no es la herramienta adecuada para resolver el problema. Tampoco ningún algoritmo de ML es realmente apropiado. Cosas como esa donde existe una solución perfecta y no se necesitan datos. Otro ejemplo son los caminos más cortos, etc.

Tal vez ver las dos primeras conferencias de esto podría aclarar las cosas:

En general, el aprendizaje automático no debe usarse cuando se cumple alguna de las siguientes condiciones:

Ya existe una solución “perfecta” conocida.

Hay datos limitados y / o es difícil / imposible recopilar más datos.

Los datos son propensos a reconocer correlaciones vs causalidad.

El aprendizaje automático no es muy útil para situaciones en las que no hay mucha incertidumbre.

Por ejemplo, no usaría el aprendizaje automático para predecir la trayectoria de un proyectil porque tenemos muy buenos modelos de mecánica.

Enseñar a las computadoras a hacer cosas también lleva mucho, mucho tiempo. ¿Por qué perder un montón de tiempo haciendo que una computadora aprenda que F = ma cuando ya sabemos que F = ma y podemos programarlo?