Estas herramientas se llaman analizadores probabilísticos . Por lo general, vienen con un modelo previamente entrenado, pero usted es libre de proporcionar su propio cuerpo analizado (banco de árboles) y entrenar su propio modelo, que es esencialmente un PCFG. No estoy seguro de cuán legibles para los humanos sean los modelos entrenados, o si esto es importante para usted.
- Aquí se explica cómo hacer esto con el analizador Stanford: .
- Dan Bikel ha desarrollado aún más el analizador de Michael Collins. Incluso hay una guía del usuario: .
- O pruebe el analizador Charniak
- o LoPar .
Solo para completar, aquí hay algunas herramientas para la inducción gramatical no supervisada (operan en texto plano, por lo que no se requiere anotación):
- ABL
- ADIOS
- EMILE (solía estar disponible, no puedo encontrar la URL ahora)
- ¿Cómo lidiamos con conjuntos de datos muy grandes que no caben en la RAM?
- Ahora mismo estoy aprendiendo desarrollo web, pero no creo que me sea muy útil. ¿Debo aprender el aprendizaje automático o el desarrollo de software?
- ¿Cuál es el método de detección de objetos de última generación para la identificación de objetos dentro de la imagen?
- ¿Cómo se puede comparar Big data con Machine Learning?
- ¿Cuál es la mejor red neuronal o SVM para la clasificación de texto de etiquetas múltiples?