¿Cuáles son los fundamentos programáticos del procesamiento del lenguaje natural?

Una aplicación común específica de PNL es cada vez que utiliza una herramienta de conversión de idiomas . Las técnicas utilizadas para convertir con precisión el texto de un idioma a otro están muy comprendidas en el “procesamiento del lenguaje natural”. (¡Aka, traductor de google!)

Otra aplicación es el Análisis de sentimientos . El análisis de sentimientos implica construir un sistema para recopilar y determinar el tono emocional detrás de las palabras. Esto es importante porque le permite comprender las actitudes, opiniones y emociones de las personas en sus datos.

A un alto nivel, el análisis de sentimientos implica el procesamiento del lenguaje natural y la inteligencia artificial al tomar el elemento de texto real, transformarlo en un formato que una máquina pueda leer y usar estadísticas para determinar el sentimiento real. Esto podría significar tomar una oración o un tweet como “¡El gato es lindo!” Y clasificarlo como “positivo” en lugar de “negativo”.

Luego está la extracción de información , que es el proceso de adquirir significado del texto de manera computacional. En otras palabras, la extracción de información es el medio por el cual adquiere datos estructurados de un conjunto de datos no estructurado dado. Hay varias maneras en que esto se puede hacer, pero en general, la extracción de información consiste en buscar tipos específicos de entidades y relaciones entre esas entidades.

Un ejemplo es el siguiente texto:

Martin recibió un 98% en su examen de matemáticas, mientras que Jacob recibió un 84%. Eli, quien también tomó el mismo examen, recibió un 89%. Por último, Ojas recibió un 72%.

Esto está claramente desestructurado. Requiere lectura para extraer cualquier relación lógica. Sin embargo, mediante el uso de técnicas de extracción de información, podríamos generar datos estructurados como los siguientes:

Nombre Grado
Martin 98
Jacob 84
Eli 89
Ojas 72

More Interesting

¿Cuál es la mejor manera de normalizar los datos implícitos para un sistema de recomendación de música mediante el filtrado colaborativo?

¿Realizar el blanqueamiento de datos antes del entrenamiento mejora la capacidad de generalización de un SVM?

¿Cuál es la diferencia entre embolsado y bootstrapping en ML / estadísticas?

¿Qué tipos de carreras hay para los ingenieros informáticos que se concentran en la inteligencia artificial y la máquina?

Si enseñamos a un programa de aprendizaje automático cómo hacer operaciones aritméticas, ¿sería más rápido o más lento que los humanos?

¿Mejor ejecución de trabajos de Machine Learning directamente desde Pyspark o integración de scikit-learn en, a través del método de paralelización SparkContext?

¿Cuáles son los temas candentes / nuevos en el aprendizaje estadístico?

¿Qué es una explicación simplificada y una prueba del lema de Johnson-Lindenstrauss?

¿Qué tensiones tienen entre sí el diseño de productos y el aprendizaje automático?

¿Por qué no se debe hacer AI?

¿Cómo usa Apple el aprendizaje profundo?

¿Es posible hacer una selección de características para las tareas de regresión por XGBoost?

¿Cuál es el nuevo enfoque o idea en la tecnología de Vicarious Systems?

¿Tiene sentido entrenar clasificador para cada clase?

Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?