La progresión de los contenidos de las redes sociales, similares a los mensajes de Twitter y Facebook y la publicación de blog, ha creado muchas nuevas oportunidades para la tecnología del lenguaje. Los contenidos generados por el usuario, como los tweets y los blogs en la mayoría de los idiomas, se escriben con escritura romana debido a la cultura y la tecnología social. Algunos de ellos usan un lenguaje propio y un script mixto. Los principales desafíos en el proceso del mensaje corto es identificar idiomas. Por lo tanto, la identificación del idioma no está restringida a un idioma sino también a varios idiomas. La tarea consiste en etiquetar las palabras con las siguientes categorías L1, L2, Entidades nombradas, Mixto, Puntuación y otros Etiquetado de palabras de consulta en la identificación del idioma de cada palabra en el texto, Entidades nombradas, Mixto, Puntuación y otros que utilizan el etiquetado de consulta de nivel de secuencia con Máquinas de vectores soporte.
En este proyecto utilicé nueve idiomas indios.
http://irlab.daiict.ac.in/FIRE20…
- Cómo medir la incertidumbre o dar medidas de intervalo de confianza junto con un modelo de red neuronal existente
- Cómo detectar texto / imágenes en una imagen de documento
- Durante la limpieza de datos cuando tiene un número decimal que representa el número de personas, ¿debe redondear hacia arriba o hacia abajo? Además, ¿qué sucede si el número total de todos los números redondeados no coincide con el número total de personas, es un error?
- ¿Cuál es la mejor computadora portátil que puedo obtener para aprender el aprendizaje profundo con CUDA?
- ¿Cuál es el significado / interpretación de la varianza de validación cruzada?