¿Existe un modelo de juguete para el aprendizaje automático?

Un modelo de juguete puede significar cosas diferentes:

  1. Un problema simple que ilustra de qué se trata el aprendizaje automático. No creo que haya un problema de juguete que ilustre todo el aprendizaje automático, pero si desea tener una idea de qué tipo de técnicas se utilizan, eche un vistazo a la regresión lineal, la regresión logística, el clasificador Naive Bayes o, como Ricky Kwok menciona en un comentario, perceptrones.
  2. Si desea ver ML en su generalidad, es decir, no le interesan las técnicas específicas pero el objetivo general del área, las garantías, etc., es posible que desee ver la Desigualdad de Hoeffding y la noción de dimensión VC. No se vincula a Wikipedia para estos, ya que las entradas de Wikipedia no son exactamente inspiradoras, pero recomendaría esta serie de conferencias: Aprendiendo de los datos – Curso en línea (MOOC)

Si está interesado en el lado de la aplicación, una búsqueda en Google puede llevarlo a muchos artículos. Además, este libro es ideal para una vista orientada a aplicaciones: Amazon.com: Programación de Inteligencia Colectiva: Creación de Aplicaciones Inteligentes Web 2.0 eBook: Toby Segaran: Tienda Kindle. Sin embargo, no lo recomendaré para un estudio serio de ML.

Para un vistazo rápido a una aplicación, puede consultar esto: Predicción del comportamiento en línea por Abhishek Ghose, Data Sciences Group [24] 7 Inc. (Descargo de responsabilidad: escribí esto para mi lugar de trabajo actual).

EDITAR:
Después de que Felipe L. Antunes mencionara el modelo de Ising, recordé este esquema (de Learning From Data – Online Course (MOOC)).


Para empezar, tiene algunos ejemplos de entrenamiento, que son generados por una función objetivo desconocida. La función de destino son los fenómenos desconocidos que realmente desea modelar, pero se manifiesta solo como los datos que genera.

Para modelarlo, eliges un conjunto de hipótesis, que corresponde aproximadamente a una familia de funciones que crees que pueden aproximarse a la función objetivo f . Digamos que está trabajando en un problema de regresión y cree que la regresión lineal sería suficiente. Su conjunto de hipótesis H , se convierte en el conjunto de todas las líneas posibles en el espacio de entrada. Lo que falta – necesita elegir la línea que mejor se aproxima f .

Aquí es donde entra en juego el algoritmo de aprendizaje. Mira los datos e intenta encontrar una función en H que tenga la mayor probabilidad de generar los datos. Esta función es gy se aproxima a f .

Tenga en cuenta que esta es una representación muy simplificada de ML 🙂