Proyectos para el procesamiento del lenguaje natural y herramientas de lenguaje para un lenguaje índico

Resumen: cree anotaciones y conjuntos de datos para su idioma y publíquelos. Además, acérquese a las personas que realizan tareas compartidas (como un MT o una competencia de análisis) y pídales que incluyan su idioma en la tarea, con el acuerdo de que proporcionará los datos de entrenamiento y prueba.

Si realmente desea crear un impacto, lo mejor que puede hacer es crear anotaciones y conjuntos de datos para su idioma.

Si tuviera que anotar oraciones en un análisis de dependencia, entonces los analizadores de dependencia existentes podrían recibir capacitación en su idioma.

Aún mejor, si tuviera que traducir oraciones en este idioma al inglés, la gente podría entrenar un sistema MT para su idioma. Puedes intentar entrenar tu propio sistema de MT con Joshua.

Pero tendrá un impacto más amplio si sienta las bases para que otros investigadores trabajen con su idioma. Así que asóciese con una tarea compartida existente y también publique datos para trabajar en su idioma.

Evitaría usar NLTK. No se usa ampliamente en la investigación académica, y la investigación académica es lo que impulsará el progreso en PNL en este idioma INDIC. (Las herramientas NLTK a veces están muy lejos del estado de la técnica).

Related Content

¿Cuál es el trabajo de investigación sobre aprendizaje automático más emocionante que Yoshua Bengio leyó en 2015?

¿Se puede solicitar un doctorado en aprendizaje automático sin conocimientos y habilidades de CompSci? ¿Se puede aprender en el trabajo?

¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Cuáles son algunas de las ventajas de usar modelos de proceso gaussianos frente a SVM?

Sistemas móviles: ¿Qué empresas / organizaciones de investigación están trabajando en el área de análisis de comportamiento / sistemas colaborativos basados en dispositivos móviles?

¿Cuáles son las buenas maneras de escribir una página Acerca de perfecta?

More Interesting

¿Qué campos de la robótica tienen mucho espacio para la investigación (mucho antes de la madurez)?

¿Cuál es la diferencia entre un vector de pensamiento y un vector de omisión de pensamiento?

¿Qué es la regresión de cresta?

¿Cuál es la mejor opción, Machine Learning o codificación?

¿Cuál es la diferencia entre aprendizaje automático, minería de datos y recuperación de información?

¿Cómo se compara Caffe 2 con TensorFlow?

Cómo encontrar el contexto de una conversación usando técnicas de aprendizaje automático / aprendizaje profundo / PNL

¿Se pueden utilizar bosques aleatorios para la selección de variables? De ser así, ¿cómo?

¿Hay alguien aquí que pueda darme una lib correcta para R-Tree en Java?

¿Qué funciona mejor, un ANN con miles de unidades por capa pero solo docenas de capas o uno con docenas de unidades por capa, pero cientos de capas?

¿Cuál es la intuición detrás de la propagación hacia atrás?

¿Cuáles son las suposiciones hechas por los modelos ocultos de Markov?

Cómo usar mel-spectrogram como entrada de una CNN

¿Qué industria utiliza una máquina de granallado?

¿Necesito almacenar los pesos en los pasos de tiempo anteriores además de las activaciones cuando uso la propagación hacia atrás a través del tiempo en redes neuronales recurrentes?

Web Analytics