A2A.
Python definitivamente ganaría aquí.
Se están realizando muchas investigaciones en PNL utilizando python.
- ¿Qué es la validación cruzada?
- ¿Qué tan similares son los problemas en los diversos campos del análisis de datos (aprendizaje automático, estadísticas, procesamiento de señales, optimización, teoría de la información, etc.)?
- ¿En qué se diferencia la teoría del "cuello de botella de información" del aprendizaje profundo del ejemplo conocido de tener una capa oculta de dimensión reducida en un codificador automático?
- ¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?
- ¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?
En primer lugar, no conozco otros idiomas, pero hay una serie de herramientas para realizar su trabajo, como NLP suit (stanford), solr, Apache OpenNLP, Apache UIMA y, finalmente, la biblioteca king NLTK de python.
Python Natural Language Toolkit es un gran módulo de procesamiento de lenguaje natural con muchas opciones y muchas cosas que hacer desde su gran corpus. NLTK tiene más de 50 corpus y léxicos, 9 stemmers y docenas de algoritmos para elegir. También es popular tanto para investigación como para educación.
Luego está spaCy – Procesamiento de lenguaje natural con potencia industrial en Python.
Es el módulo NLP más rápido en python y se centra en la potencia y la optimización y, a diferencia de nltk, te inunda de opciones.
TextBlob: procesamiento de texto simplificado Este también es uno de los más populares y fáciles de usar. Por supuesto, también está en Python. Simplifica el procesamiento de texto al proporcionar una interfaz intuitiva para NLTK. Es una adición bienvenida a una línea ya sólida de bibliotecas Python NLP porque tiene una curva de aprendizaje suave y cuenta con una sorprendente cantidad de funcionalidad.
Luego hay otras bibliotecas como Stanford CoreNLP y gensim.
Python tiene todas las herramientas necesarias para PNL y mucho más. Así que adelante.