El aprendizaje inductivo es el aprendizaje supervisado tradicional. Aprendemos un modelo a partir de ejemplos etiquetados e intentamos predecir las etiquetas de ejemplos que no hemos visto o que no conocemos.
El aprendizaje transductivo es menos ambicioso. Aprendemos sobre muchos ejemplos, pero solo tratamos de predecir sobre un conjunto conocido (prueba) de ejemplos sin etiquetar.
Puede pensar en esto como tratar de aprender las etiquetas en un conjunto de entrenamiento, mientras que, simultáneamente, tratar de adivinar las mejores etiquetas en el conjunto de prueba.
- ¿Debo abandonar mi programa de doctorado CS para estudiar por mi cuenta?
- ¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?
- ¿Cómo debo saber que estoy interesado en el aprendizaje automático?
- ¿Cómo se puede utilizar el aprendizaje automático para mejorar el software de gestión de proyectos?
- Sistemas de recomendación: ¿Cuál es la diferencia entre el filtrado colaborativo de elemento a elemento y el filtrado basado en contenido?
Aprendizaje automático con etiquetas faltantes: SVM transductoras
El aprendizaje inductivo es más general, y presumiblemente más difícil, que el aprendizaje transductivo. El aprendizaje transductivo supone que aunque no tengamos las etiquetas del conjunto de pruebas, tenemos otra información que podemos aprovechar.
En particular, en una SVM transductiva, esta información adicional es saber cuántas muestras de prueba están etiquetadas positivamente y cuántas están etiquetadas negativamente, aunque no sepamos cuáles son cuáles.
Si conocemos las etiquetas de fracción (+/- 0) en el conjunto de prueba, y bajo ciertas circunstancias, muy afortunadas, la SVM transductiva es realmente convexa
Relajaciones convexas del aprendizaje transductivo
Debido a que el problema de transducción puede ser más fácil que el aprendizaje inductivo, esto ha llevado al dicho coloquial
“Uno no debería tratar de resolver un problema [adivinando las etiquetas en el conjunto de prueba] planteando un problema intermedio que es más difícil de resolver [haciendo un modelo totalmente generalizable]”