En términos generales, es posible obtener un modelo de aprendizaje automático para hacer cualquier cosa si puede
- especifique la tarea lo suficientemente bien
- proporcionar suficientes datos de entrenamiento
Como resultado, esas son a menudo las dos cosas que terminan siendo las más difíciles.
En su caso, (1) es sencillo. Este es un caso especial de aprendizaje de secuencia a secuencia. Desea proporcionar un pasaje de texto como entrada y recibir, digamos, diez secuencias de texto como salida. Los modelos de aprendizaje profundo para traducir texto, resumir artículos y responder preguntas se implementan como modelos de secuencia a secuencia. Si está interesado, vea Graves 2013 o Sutskever, Vinyals, Le 2014.
- ¿Cuál es el problema que nos traerá la IA?
- ¿De dónde viene la idea de IA peligrosa?
- ¿Qué sonidos vocales se deben grabar para crear una funcionalidad similar a SIRI de habla inglesa?
- ¿Cuáles son las ventajas y desventajas cuando comparamos la red neuronal convolucional y la red neuronal recursiva para el procesamiento del lenguaje natural?
- ¿Deberíamos hacer inteligencia artificial para robots? Si es así, ¿hasta dónde debemos llegar?
El requisito (2) es mucho más complicado. Necesitaría una muestra masiva de artículos o libros, así como preguntas generadas por los humanos. Puede comenzar con las antiguas pruebas estandarizadas como un conjunto de entrenamiento decente.
Cuantos menos datos tenga, más trabajo necesita hacer. Si su conjunto de datos es pequeño, sería mejor escribir manualmente extractores de características para los datos de entrada para facilitar el modelo de aprendizaje de secuencia. Si su conjunto de datos es lo suficientemente grande, en teoría, el modelo podría aprender todo lo que necesita sin ninguna orientación.