¿Cuál es la diferencia entre estos documentos de Collobert y Weston: Una arquitectura unificada para PNL (2008) vs. Aprender PNL desde cero (2011)?

Por lo que entiendo, Collobert et al. 2011 parece una reescritura más precisa del trabajo de Collobert y Weston 2008.

En el segundo artículo, hay puntos de referencia reales y comparaciones con (entonces) enfoques de vanguardia para las tareas que investigan (fragmentación, SRL, POS, etc.).

El segundo artículo utiliza un conjunto de datos sin etiqueta más grande para la tarea sin supervisión (852 millones frente a 631 millones de palabras).

El segundo documento también menciona que han utilizado dos enfoques diferentes para las capas de salida: uno llamado probabilidad de registro a nivel de palabra (que no tiene en cuenta la dependencia entre etiquetas posteriores, por ejemplo, no es probable que una etiqueta V de SRL siga a otra etiqueta V ) y otra estrategia llamada probabilidad de registro a nivel de oración, que tiene en cuenta las dependencias de la etiqueta (como el algoritmo de Viterbi, por ejemplo).

Sin embargo, la Sección 6 del segundo documento contiene algunas cosas que no se mencionaron en el primer documento: a) realizaron experimentos adicionales para tratar de obtener mejores resultados: agregaron características de ingeniería regulares a los modelos anteriores b) construimos conjuntos de los modelos anteriores para ver si mejoraban los resultados c) han realizado experimentos agregando características de árbol de análisis a los modelos anteriores.

También han creado un sistema que reúne todo lo que han hecho hasta ahora. Se llama SENNA.

Puede que me equivoque aquí (no soy un experto), pero parece que el segundo documento era una versión extendida (más detallada) del primero, con más resultados de experimentos y una teoría más cuidadosamente presentada.

El primer artículo ni siquiera está referenciado por el segundo, que es otra pista de que el segundo documento no es en modo alguno una “continuación” del primero.

More Interesting

¿Qué campo de la informática es menos explorado?

¿Dónde se debe comenzar en la visión por computadora?

¿Qué pasa si Google toma el trabajo de investigación que estoy haciendo? ¿Qué tengo que hacer?

¿Cuáles son algunos temas nuevos de investigación en redes?

¿Qué programa universitario de ciencias de la computación hace que sus estudiantes escriban más código?

¿Cuáles son algunos de los resultados de investigación más inútiles en informática?

¿Qué necesito saber para hacer un software que pueda leer y hacer un resumen de cualquier información?

Cómo publicar una investigación de inteligencia artificial si actualmente no estoy en la academia o en un entorno de investigación de la industria

¿Se puede usar Matlab Computer vision para productos a gran escala?

¿Qué es la ingeniería del conocimiento? ¿Quién puede proporcionar más detalles sobre sus sucursales, sus aplicaciones, su futuro?

¿Fue la sofisticación de los algoritmos o los límites del poder computacional lo que limitó la investigación de IA en los años 70 y 80?

¿Le preocupa la investigación en NN y el aprendizaje profundo, ya que los resultados se basan en demasiados resultados sin respaldarlos con una explicación teórica sólida?

¿Cuáles son los pasos necesarios para escribir trabajos de investigación?

¿Cuál es el mejor lenguaje de programación para usar al escribir un compilador, por ejemplo, ML, Lisp, Java, C ++, Python, etc.

¿Cuáles son los mejores campos de investigación en informática recientemente?