Abhinav ya ha dado la respuesta general, solo quiero agregar un poco de perspectiva. Word2vec no puede considerarse aprendizaje profundo, pero ¿podría ser aprendizaje profundo?
Conocí a Tomas Mikolov hace varios meses en Moscú en un evento local relacionado con el aprendizaje automático y le hice muchas preguntas sobre arquitecturas profundas y su aplicación en PNL en particular. La mejor idea sobre el experimento relacionado con word2vec provino del resultado de que el modelo más simple dio los resultados más robustos e inesperadamente sensibles. Han probado muchas arquitecturas diferentes, desde la simple alimentación hacia adelante con pocas capas hasta modelos profundos computacionalmente pesados, y la que fue útil y factible fue la más simple.
No hace falta decir que estábamos sacudiendo nuestras cabezas tratando de comprender eso. Su conferencia “Una hoja de ruta hacia la inteligencia artificial” lo llevó aún más lejos, planteando las preguntas de si las arquitecturas aún más profundas son realmente la dirección correcta para avanzar.
- ¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?
- ¿Cuáles son los buenos algoritmos para la extracción de características para grandes conjuntos de datos?
- ¿Qué se entiende por agrupamiento jerárquico aglomerativo?
- ¿Qué técnicas utilizadas en el procesamiento del lenguaje natural son aplicables a otras áreas del aprendizaje automático?
- ¿Qué algoritmos son buenos para usar en el procesamiento del lenguaje natural?