¿Qué herramientas están disponibles para extraer PCFG lexicalizados de un corpus analizado?

Estas herramientas se llaman analizadores probabilísticos . Por lo general, vienen con un modelo previamente entrenado, pero usted es libre de proporcionar su propio cuerpo analizado (banco de árboles) y entrenar su propio modelo, que es esencialmente un PCFG. No estoy seguro de cuán legibles para los humanos sean los modelos entrenados, o si esto es importante para usted.

Aquí se explica cómo hacer esto con el analizador Stanford: .
Dan Bikel ha desarrollado aún más el analizador de Michael Collins. Incluso hay una guía del usuario: .
O pruebe el analizador Charniak
o LoPar .

Solo para completar, aquí hay algunas herramientas para la inducción gramatical no supervisada (operan en texto plano, por lo que no se requiere anotación):

ABL
ADIOS
EMILE (solía estar disponible, no puedo encontrar la URL ahora)

Related Content

¿Qué es mejor en términos de ROI: MS en informática o MS en análisis de datos / ciencia de datos en EE. UU.?

¿Qué son las máquinas complejas?

Estoy muy interesado en el aprendizaje automático y quiero trabajar en algunos proyectos de código abierto. ¿Qué proyectos puedes sugerir?

¿Recomendaría un MBA de una escuela superior o un doctorado en Aprendizaje automático de una escuela superior?

¿Qué algoritmo sería bueno para asignar una probabilidad a la coincidencia de dos nombres (John Doe = Mr. Jonathan M Doe II)?

¿Cuáles son los puntos importantes de comparación entre Mahout y otras bibliotecas Java ML como Lingpipe o Weka?

¿Qué deben saber todos sobre el uso de internet, correo electrónico y Facebook?

Puede probar svm-cfg (Máquina de vectores de soporte para gramáticas sin contexto).
Svm cfg usa el algoritmo svm para aprender gramática libre de contexto ponderado.

Yuval Feinstein

More Interesting

¿Cuáles son los mejores solucionadores de programas cuadráticos?

Redes neuronales artificiales: ¿Qué determina si un problema de clasificación no trivial para el aprendizaje profundo se puede dividir en capas convolucionales en lugar de capas completamente conectadas?

¿Cuáles son algunos ejemplos de empresas no tecnológicas que crean valor a través del uso de Big Data y qué tecnologías específicas están utilizando, por ejemplo, Hadoop, sistemas dedicados, SAP en formas novedosas, piratas informáticos, etc.

¿Cómo detectar el idioma de un texto escrito en inglés? ¿Hay una API disponible donde podamos dar el texto como entrada?

Cómo demostrar que minimizar la suma residual de cuadrados es equivalente a maximizar la función de log-verosimilitud

¿Qué es el algoritmo de descenso de gradiente?

¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong? La función de modificación de peso se basa en el error (l * e * o [1, 2]), por lo que los valores de error altos dan modificaciones de peso drásticas.

¿Cuáles son las aplicaciones de aprendizaje profundo que consideras sin explotar?

En un juego de billar, ¿puede el mejor robot (diseñado específicamente para esta tarea) derrotar al campeón mundial humano?

¿La mayoría de los algoritmos de aprendizaje automático se ejecutan en lotes, o se ejecutan cada vez que obtienen un nuevo bit de datos?

¿Qué tan difícil sería implementar el aprendizaje por refuerzo para un juego de mesa?

¿Cuál crees que es la razón detrás de la asociación de Microsoft y Amazon en la tecnología de red neuronal llamada 'Gluon'?

¿Qué es la regresión no lineal vs regresión lineal?

¿Debería considerarse un experto en aprendizaje automático después de completar la clase de ML del profesor Andrew en Coursera?

¿Necesita ser un buen ingeniero de software para trabajar en cosas como visión por computadora, reconocimiento de voz, gráficos por computadora, aprendizaje automático?

Web Analytics