Los algoritmos de aprendizaje automático (ML) actualmente no son buenos para el tipo de reconocimiento de patrones al que se refiere:
It9s = Es
You9ll = Vas a
- ¿Las inteligencias artificiales tendrán sentido del humor?
- ¿En qué se diferencian profundamente las redes de creencias profundas de la agrupación?
- ¿Están China y Estados Unidos en una carrera por la supremacía de la IA?
- ¿Cuáles son algunos temas comunes que deben enseñarse en un curso de inteligencia artificial, pero que se omiten en la mayoría de los cursos de IA?
- ¿Los métodos de aprendizaje automático solo son adecuados para fines de clasificación?
Don9t =?
Esto parece requerir razonamiento y no solo mapeo de un espacio vectorial a otro. Los modelos ML actuales son excelentes para mapear vectores de entrada a vectores de salida, pero no razonan. Por lo tanto, para resolver este problema, necesitamos una forma de razonamiento en las máquinas y muchos de esos datos de entrenamiento.
Por lo tanto, el modelo cercano a lo que estamos buscando es una red de memoria que es básicamente una red neuronal típica (NN) conectada a un bloque de memoria para el almacenamiento de datos. Las redes de memoria pueden razonar hasta cierto punto y una de las versiones más interesantes de NN aumentadas de memoria es la computadora neural diferenciable (DNC). Estos sistemas pueden aprender a descubrir algunos hechos y patrones que de otro modo serían difíciles de descubrir para un modelo de ML de mapeo.
Las redes neuronales recurrentes (RNN) también se están completando. Por lo tanto, pueden aprender ese patrón cuando se les proporcionen suficientes ejemplos. De hecho, la memoria a corto y largo plazo (LSTM) es un tipo de red de memoria y, por lo tanto, de alguna manera puede razonar, bueno, un poco. Turing completo significa poder evaluar cualquier función computacional.
Por lo tanto, el siguiente es el enfoque que puede utilizar para construir dicho modelo de ML.
- Use incrustaciones de palabras usando word2vec como la primera etapa de procesamiento. Las palabras se pueden representar de manera compacta de esa manera en lugar de usar un vector largo codificado en caliente.
- Utilice una red de memoria, como la máquina de tural neural (NTM) o el DNC. Estos sistemas se están completando y pueden descubrir patrones interesantes en los datos. También pueden aprender un método para resolver problemas como los acertijos. Por lo tanto, es más probable que resuelvan este.
- O use un RNN, especialmente aquellos que no tienen problemas de dependencia a largo plazo, como el LSTM y las redes de unidad recurrente cerrada (GRU). Al estar también completa, estas redes también pueden resolver el problema.
Pero no estoy seguro de cómo tal modelo puede funcionar en ese problema anterior. La única forma de saberlo es compilarlo y probarlo con los datos.
Espero que esto ayude.