¿Cómo aprendió Ajit Rajasekharan tanta PNL?

Gracias por un cumplido tan generoso, Conner, aunque mi comprensión se limita a los modelos que he descargado y probado hasta ahora, que en su mayoría son modelos sin supervisión para generar incrustaciones y su utilidad para resolver ciertas tareas.

Me falta la intuición matemática profunda que aquellos como usted están dotados naturalmente ( y muy evidente en sus escritos ), para captar modelos simplemente leyendo documentos. Así que compenso mirando el código junto con el documento para obtener una comprensión funcional. Eso compensa la deficiencia hasta cierto punto.

Dado que los documentos son la única forma en que parece que podemos mantener el ritmo y aprovechar el progreso en este campo, la falta de buena intuición matemática ha sido un gran inconveniente porque los documentos sin código fuente publicado a veces son difíciles de manejar ( hay este sitio gitxiv … que recientemente encontré a través de un colega que es muy útil – enumera documentos con enlaces de código fuente abierto – no es exhaustivo pero sigue siendo un recurso muy valioso ).

  • En algunos casos, las videoconferencias ( por ejemplo, las de Stanford, una serie reciente de procesamiento de lenguaje natural con aprendizaje profundo en abril de 2017 con Chris Manning y Richard Socher ) han ayudado mucho a compensar la ausencia de código descargable (los autores a veces hablan de sus artículos). en seminarios y publicar en Youtube que son muy útiles ).
  • Por otro lado, hay un consejo valioso que Chris menciona en una de las últimas conferencias de la serie de conferencias anterior: para cualquier tarea de PNL en la que nos embarquemos, es muy probable que exista un modelo de red neuronal cuyo rendimiento será mejor que el de un anterior modelo de red no neuronal, incluso si el rendimiento del modelo de red neuronal tiene mucho margen de mejora.

Gracias de nuevo por tu cumplido .

More Interesting

¿Cuál es la diferencia entre un ingenuo clasificador Bayes y una red bayesiana?

La pérdida (entropía cruzada) está disminuyendo, pero la precisión sigue siendo la misma durante el entrenamiento de redes neuronales convolucionales. Como puede suceder

¿Por qué los modelos gráficos probabilísticos tienen un rendimiento inferior en las tareas de clasificación en comparación con las redes neuronales o las máquinas de vectores de soporte?

¿Vale la pena obtener un doctorado en aprendizaje automático y procesamiento del lenguaje natural?

Cómo comprender mejor las funciones de activación en el aprendizaje automático, especialmente las matemáticas detrás de ellas

¿Cuáles son las formas en que puede aplicar la máquina o el aprendizaje profundo al pirateo?

¿Cuáles son los modelos actuales de análisis de sentimiento de arte independientemente de la efectividad?

¿Podría el aprendizaje automático haber evitado la crisis financiera?

¿Cuáles son algunas aplicaciones de los modelos gráficos probabilísticos?

¿Se utiliza R en la minería de datos a gran escala en grandes compañías de software como Facebook y LinkedIn?

¿Realizar el blanqueamiento de datos antes del entrenamiento mejora la capacidad de generalización de un SVM?

Cómo eliminar una fila completa de un conjunto de datos si encuentro entradas faltantes en R

¿Cuáles son algunas aplicaciones de PageRank que no sean motores de búsqueda?

Cómo usar big integer en C ++

¿Cuál es la diferencia entre la regresión logística y Naive Bayes?