¿Cómo reconocen los programas el nombre usando el procesamiento del lenguaje natural?

Existen diferentes técnicas para hacer esto.

El más simple (y probablemente el más común) está utilizando un enfoque basado en el diccionario. La mayoría de los primeros nombres, al menos para el público occidental, están catalogados internamente por muchas bibliotecas.
Utilice un enfoque basado en NER (reconocimiento de entidad con nombre) que entienda los nombres al dividir primero el texto en diferentes partes del discurso. Y luego identificar cuándo se usa un nombre basado en reglas gramaticales. De nuevo incorporado por muchas bibliotecas de PNL.

Recomendaría usar NLTK (7. Extracción de información del texto) para un modelo más simple. Y si lo quieres listo (es decir, sin necesidad de modificar mucho), recomendaría Alchemy (Impulsando la nueva economía de IA). También mire el etiquetador NER de Stanford. Esta es la versión del navegador (http://nlp.stanford.edu:8080/ner/).

Related Content

Cómo calcular la correlación de cada fila en una matriz 2D con una matriz 1D de la misma longitud

¿Cómo describirías el algoritmo de Quora usando una ecuación?

¿Qué número de puntos cruzados será el mejor para mi algoritmo genético?

¿Cuál es el algoritmo más eficiente para encontrar el késimo elemento más pequeño en una matriz que tiene n elementos desordenados?

¿Cómo podemos encontrar eficientemente la segunda caminata más corta entre dos vértices de un gráfico?

¿Por qué las personas usan mid = low + (high-low) / 2 en lugar de (low + high) / 2?

Cómo calcular el número 50 usando números binarios

Enfoque ingenuo: utilice una gaceta (es decir, una lista) de ‘nombres’. Busque sustantivos en oraciones -> encuentre una secuencia de sustantivos en mayúscula -> busque el primer sustantivo en la gaceta.
Un enfoque basado en reglas solo para PNL: cree un conjunto de reglas que se combinen para usar características como una secuencia de sustantivos en mayúscula, algo que es sujeto de una oración y se usa con verbos como “preguntado”, “dicho” etc.
Use un reconocedor de entidad con nombre capacitado para descubrir nombres. Luego escoja la primera palabra en cada entidad marcada como ‘nombre’
Agregue capacitación supervisada en un conjunto de datos marcado

Lalit Patel

Se utiliza el reconocimiento de entidad con nombre.

Definición de Wiki: el reconocimiento de entidad con nombre (NER) (también conocido como identificación de entidad , fragmentación de entidad y extracción de entidad ) es una subtarea de extracción de información que busca ubicar y clasificar entidades nombradas en el texto en categorías predefinidas, como los nombres de personas , organizaciones, ubicaciones, expresiones de tiempos, cantidades, valores monetarios, porcentajes, etc.

Existen diferentes algoritmos que se pueden usar para implementar NER, como Maxent, CRF, etc.

Mallet, OpenNLP, Stanford NER son algunas de las bibliotecas basadas en Java que proporcionan una implementación.

Para python NLTK puede usar used.

Lalit Patel

El código o biblioteca de PNL puede detectar nombres propios a través de sus ubicaciones en la oración (como creador de acción o acción tomada) y mediante la capitalización de primer carácter y también en función del conjunto de datos de entrenamiento.

Esto no debería ser muy difícil si es necesario.

Lalit Patel

More Interesting

¿Hay algún problema para el cual se pruebe que no existe un algoritmo óptimo?

¿Cómo se debe decidir sobre un clasificador / algoritmo óptimo para usar en un conjunto de datos en particular?

¿Qué algoritmos usa Quora para restringir que el contenido de ciertos escritores se transmita tanto como otros?

¿Cómo se ve una imagen después de que se somete repetidamente a un algoritmo de compresión con pérdida hasta que ya no se puede comprimir?

¿Cuál es la nueva actualización del algoritmo de Google?

¿Cuál es la mejor manera de leer y comprender la Introducción a los algoritmos?

Cómo inicializar una matriz

Cómo implementar un algoritmo usando la recursividad para encontrar el módulo de esta serie

¿Cuál es el algoritmo más complicado por el que has pasado?

¿Por qué el método de ordenación Javascript organiza los números de una matriz en orden ascendente con [código] (a - b) [/ código] y descendente con [código] (b - a) [/ código]?

¿Por qué las computadoras se crean de tal manera que entiendan 0s y 1s?

¿Qué algoritmo usas para la clasificación binaria?

¿Cuáles son los mejores proyectos de estructura de datos para los estudiantes?

¿Cómo funciona la función Rolling Hash utilizada en el algoritmo Rabin Karp?

Cómo diseñar una nueva función heurística admisible para un algoritmo A * para resolver el problema del mosaico deslizante

Web Analytics