¿Cómo se puede aplicar el aprendizaje profundo a la clasificación de palabras?

Word2vec, un método implementado típicamente sin modelos profundos, es bastante bueno en la clasificación de palabras. Incrusta palabras en un espacio vectorial, y las palabras incrustadas en espacios cercanos deben ser (y generalmente son) similares.

Sin embargo, las intuiciones detrás de word2vec podrían aplicarse a un modelo más profundo, potencialmente obteniendo mejores resultados. Word2vec se basa en la idea de que dos palabras que ocurren conjuntamente en contextos similares son similares. Por ejemplo, dadas dos oraciones “el perro [se escapó]” y el “el perro [se alejó]”, el sistema inferiría que “corrió” y “caminó” son similares. Las implementaciones típicas de word2vec usan un ‘contexto’ de varias palabras, o algunas palabras antes y después.

Si estuviera tan inclinado, podría usar un RNN, por ejemplo, LSTM, para crear contextos más ricos. En lugar de simplemente recordar varias palabras antes y después para crear un contexto, el RNN podría recordar muchas palabras antes y después, y combinarlas en formas complejas y no lineales (el punto del aprendizaje profundo) para encontrar un contexto mucho más rico. Luego predeciría la palabra dado el contexto más rico: las palabras que es muy probable que se encuentren en un determinado contexto son probablemente similares.

Tenga en cuenta que dicha implementación sería mucho más lenta de entrenar y requeriría muchos más datos que las implementaciones de word2vec superficiales. Sin embargo, si crea incrustaciones de palabras más precisas, estas incrustaciones podrían usarse para encontrar clasificaciones de palabras más precisas.

More Interesting

¿Cuáles son los beneficios del filtrado colaborativo?

¿Qué necesitas para hacer aprendizaje automático?

¿Cómo determinaría si el error de cuando ejecuta su algoritmo de aprendizaje automático es de alto sesgo o alta varianza (también conocido como corte o sobreajuste)?

¿Dónde puedo encontrar modelos de temas previamente capacitados para MALLET?

¿Qué son los SVM?

Cómo usar tanto algoritmos genéticos como redes neuronales artificiales en una simulación de vida artificial

Tengo una entrevista telefónica técnica para una pasantía la próxima semana con el aprendizaje automático y el equipo de fraude de Uber. ¿Debo esperar DS y algoritmos generales o algo más?

¿Por qué el 'modelo neuronal McCulloch-Pitts' también se conoce como puerta umbral lineal?

¿Dónde está el mejor lugar para trabajar en investigaciones de IA?

¿Crees que Robot puede realizar todas las tareas humanas con Deep Learning?

¿Es fácil entrenar un modelo de red neuronal profunda desde cero usando Keras?

¿Un pequeño porcentaje de datos incorrectos (digamos entre 1% y 5%) en el conjunto de datos de entrenamiento impacta significativamente la efectividad del entrenamiento de una red neuronal?

¿Cuáles son algunos desafíos calificados de aprendizaje automático que se inician cada año?

¿Cuáles son las ventajas y desventajas de usar R vs. C ++ para el aprendizaje automático?

¿Cómo puede alguien usar el verano para hacer un gran progreso en su conocimiento en los campos de redes neuronales artificiales y aprendizaje profundo?