¿Qué tipo de problemas generalmente enfrentamos cuando hacemos aprendizaje automático?

  • Clasificación : los datos están etiquetados, lo que significa que se les asigna una clase, por ejemplo spam / no spam o fraude / no fraude. La decisión que se está modelando es asignar etiquetas a nuevos datos no etiquetados. Esto puede considerarse como un problema de discriminación, modelando las diferencias o similitudes entre los grupos.
  • Regresión : los datos se etiquetan con un valor real (piense en coma flotante) en lugar de una etiqueta. Ejemplos que son fáciles de entender son los datos de series temporales como el precio de una acción a lo largo del tiempo. La decisión que se está modelando es qué valor predecir para nuevos datos impredecibles.
  • Agrupación : los datos no están etiquetados, pero se pueden dividir en grupos según la similitud y otras medidas de estructura natural en los datos. Un ejemplo de la lista anterior sería organizar imágenes por caras sin nombres, donde el usuario humano tiene que asignar nombres a grupos, como iPhoto en la Mac.
  • Extracción de reglas : los datos se utilizan como base para la extracción de reglas proposicionales (antecedente / consecuente, también conocido como if-then ). Dichas reglas pueden, pero generalmente no están dirigidas, lo que significa que los métodos descubren relaciones estadísticamente compatibles entre los atributos en los datos, que no necesariamente involucran algo que se predice. Un ejemplo es el descubrimiento de la relación entre la compra de cerveza y los pañales (esto es la ley popular de minería de datos, sea cierto o no, es ilustrativo del deseo y la oportunidad).