¿Cuáles son las soluciones de producción efectivas para el reconocimiento de entidades nombradas?

Los tres métodos comunes para abordar la extracción de entidades (modelos estadísticos, listas de entidades y expresiones regulares) no han cambiado, pero la forma en que creamos el modelo estadístico está cambiando (más abajo). Sin embargo, para responder a su pregunta, el mejor método depende del perfil de la entidad que está buscando. Más específicamente:

a) Use expresiones regulares cuando la entidad puede ser definida por un patrón. Por ejemplo, los números de tarjetas de crédito son 16 dígitos que comienzan con un 4 (Visa), 5 (Mastercard), 6 (Discover) o 15 números que comienzan con un 34 o 37 (American Express). Las expresiones regulares pueden encontrar de manera confiable estas entidades.

b) Use listas de entidades cuando la lista de entidades sea conocida y finita (por ejemplo, una lista de tenistas profesionales de 2013-2014). Estas entidades se prestan a las listas de entidades, pero son inflexibles ya que la ortografía debe ser una coincidencia exacta. Utilice listas de entidades cuando la lista de entidades no sea ambigua. Una lista de medicamentos de venta libre de marca (Robitussin, Tylenol, Nyquil) es bastante inequívoca y se presta a las listas de entidades.

c) Utilice el modelado estadístico (aprendizaje automático) para entidades que no puede enumerar exhaustivamente o que se superponen demasiado con las no entidades, el modelado estadístico (también conocido como aprendizaje automático) es mejor ya que es sensible al contexto. Por ejemplo, una lista de nombres de ciudades, incluyendo Independence (of Missouri), que también es un nombre común, y Paris, que también es el nombre de una persona, generará demasiados falsos positivos.

En la categoría de modelado estadístico, los enfoques tradicionales de aprendizaje automático para NER son máquinas de vectores de soporte estructurado (SVM), campos aleatorios condicionales y perceptrón estructurado. Los enfoques más recientes utilizan variantes de uso de redes neuronales recurrentes (RNN) y redes neuronales convolucionales (CNN).

Si está buscando probar estos métodos, puede obtener una evaluación de software de Rosette cuyo SDK le permite al usuario agregar o modificar las listas de entidades y expresiones regulares y un kit de capacitación de campo para (1) entrenar modelos (para extraer personas, ubicaciones, organizaciones) o (2) optimizar la precisión de Rosette en conjuntos de datos particulares o (3) agregar nuevos tipos de entidades estadísticas. Tenga en cuenta que Rosette también viene como una API web que genera resultados utilizando estos tres métodos, pero no puede cambiar el comportamiento.

[Descargo de responsabilidad, trabajo para Basis Technology que produce Rosette SDK y Rosette API.]

* Yo trabajo en Lexalytics. Hacemos análisis de texto / minería, procesamiento de lenguaje natural, aprendizaje automático e inteligencia artificial centrada en palabras.

La mayoría de las respuestas anteriores han sido sobre cómo puede implementar el reconocimiento de entidad con nombre (NER) usted mismo. Ciertamente existen buenas herramientas de código abierto para capacitar a los reconocedores de entidades con nombre. Estos incluyen paquetes de software como Stanford’s NLP y Natural Language Toolkit. También hay una serie de sistemas comerciales que proporcionan reconocimiento de entidades con nombre. Estos incluyen nuestro sistema en Lexalytics y sistemas como los de Basis Technology, Aylien y muchos otros.

Consulte el documento de la encuesta sobre algoritmos y tecnología de reconocimiento de entidades con nombre ( http://nlp.cs.nyu.edu/sekine/pap …). Tanto GATE ANNIE como Standford NER utilizan técnicas supervisadas para el reconocimiento de entidades con nombre. El documento de la encuesta explica el estado del arte del reconocimiento de entidades con nombre y también habla de enfoques semi supervisados ​​y sin supervisión para el reconocimiento de entidades con nombre.

More Interesting

¿Es posible crear un filtro adaptativo usando una red neuronal para que después del entrenamiento pueda filtrar la señal ruidosa y dar la salida deseada?

¿Los modelos de aprendizaje automático en automóviles sin conductor utilizan aprendizaje supervisado, no supervisado o de refuerzo?

¿Qué biblioteca / framework AI es el mejor, OpenAI, OpenNN o TensorFlow?

Como estudiante de pregrado de CS interesado en el aprendizaje automático, ¿cómo puedo saber si me gustaría la economía / computación financiera?

Cómo escribir un buen artículo sobre aprendizaje profundo o reforzar el aprendizaje sin la ayuda de un supervisor profesional

Hipotéticamente, ¿sería posible cultivar tejido cerebral usando células madre y luego usarlo como un procesador distribuido para tareas de aprendizaje complejas?

¿Los principales profesionales de aprendizaje profundo a menudo tienen grandes lagunas de conocimiento debido a lo rápido que se mueve el campo?

¿Cómo se relaciona el error cuadrático medio (RMSE) y la clasificación?

¿Cuáles son algunos de los beneficios y desventajas de los modelos discriminativos y generativos?

¿Qué significa la siguiente declaración: las redes neuronales son generalmente paramétricas y optimizadas para producir una estimación puntual?

¿Es un 'predictor de la siguiente palabra' que hice el aprendizaje automático o el procesamiento del lenguaje natural?

¿Cuál es un ejemplo de un espacio de Hilbert que no es un espacio de reproducción del núcleo de Hilbert?

¿Qué es la optimización submodular?

¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?

¿Cómo debo proceder para implementar un analizador probabilístico de lenguaje natural?