¿Existe alguna herramienta o API capacitada en datos de tweets para la extracción de entidades con nombre?

Una herramienta de extracción de entidades que está capacitada en tweets es definitivamente superior a una que fue capacitada en artículos de noticias (y la mayoría de los extractores de entidades lo son), pero aún así podría no ser suficiente si está buscando una alta precisión.

Los tweets son desafiantes ya que la mayoría de los extractores de entidades utilizan el aprendizaje automático que se basa en el contexto para encontrar entidades como personas y lugares, y 140 o menos caracteres es un contexto muy valioso. Los tweets también son “ruidosos” debido a la ortografía y gramática no estándar, abreviaturas, hashtags, es decir, todo lo que no es un artículo de noticias.

Rosette API está capacitado en tweets y realiza extracciones y enlaces de entidades, lo que significa que encuentra una mención de entidad y la compara con el nombre en Wikipedia, lo que aumenta la precisión.

[Descargo de responsabilidad, trabajo para Basis Technology que produce Rosette API, que puedes probar gratis.]

> github.com/aritter/ twitter_nlp

Las “Herramientas de PNL de Twitter” de Alan Ritter parecen incluir el reconocimiento de entidad nombrada.

Vea también mi página web rápida y sucia:

  • TweetNLP | Meta-Guide.com

Gracias por A2A.

No está capacitado, pero se puede adaptar a cualquier estilo, incluido Twitter. LinguaSys GlobalNLP (descargo de responsabilidad: soy el CTO de esta empresa) – 22 idiomas y sigue creciendo.

No que yo sepa. He utilizado soluciones de análisis de texto para Big Data y Home | OpenCalais en el pasado, los cuales parecían funcionar bien con los tweets.

More Interesting

¿Qué se sabe sobre la detección de incertidumbre o vacilación en el texto en lenguaje natural (no en el habla)?

¿Cuál es la mejor base de datos para almacenar vectores de características de gran tamaño para su posterior recuperación y calcular las mediciones de distancia para la coincidencia de similitudes?

¿Cuáles son los pasos necesarios para el análisis de sentimientos de las redes sociales?

¿Es posible usar el servicio de reconocimiento facial de Facebook desde su API?

¿Cómo implementa una red neuronal de retroalimentación la propagación inversa?

¿Cuáles son algunos de los usos del aprendizaje automático en los motores de búsqueda?

¿Cuántas imágenes necesita un buen sistema de aprendizaje automático para aprender un nuevo concepto?

¿Cómo se compara Python con R para el análisis de datos y el aprendizaje automático?

¿Es el sesgo entre las mejores universidades frente a otras universidades en los Estados Unidos tan malo como el sesgo de IIT frente al resto de la India?

¿Qué tan efectivamente se pueden usar las redes neuronales en la regresión? ¿Es posible alguna configuración que prediga un número que no se ve en los datos de entrenamiento?

Cómo combinar salidas del sistema de recomendación (matriz de elementos de usuario) a través de un conjunto

Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?

¿Es posible que AI / ML aprenda el patrón subyacente en los siguientes problemas y prediga la respuesta?

Investigadores de aprendizaje automático, ¿algún día los robots nos matarán a todos?

¿Cómo se usa el aprendizaje automático para los datos de EEG?