Una herramienta de extracción de entidades que está capacitada en tweets es definitivamente superior a una que fue capacitada en artículos de noticias (y la mayoría de los extractores de entidades lo son), pero aún así podría no ser suficiente si está buscando una alta precisión.
Los tweets son desafiantes ya que la mayoría de los extractores de entidades utilizan el aprendizaje automático que se basa en el contexto para encontrar entidades como personas y lugares, y 140 o menos caracteres es un contexto muy valioso. Los tweets también son “ruidosos” debido a la ortografía y gramática no estándar, abreviaturas, hashtags, es decir, todo lo que no es un artículo de noticias.
Rosette API está capacitado en tweets y realiza extracciones y enlaces de entidades, lo que significa que encuentra una mención de entidad y la compara con el nombre en Wikipedia, lo que aumenta la precisión.
- ¿Puedo hacer IA y aprendizaje automático sin matemáticas?
- Cómo llegar a un problema de aprendizaje automático para un proyecto personal
- ¿Cuáles son los algoritmos de aprendizaje automático adecuados para Big Data o análisis en tiempo real?
- ¿De qué sirve el aprendizaje automático en la predicción de resultados de cricket?
- Aprendizaje automático: ¿cómo se puede saber cuándo combinar diferentes características sería útil?
[Descargo de responsabilidad, trabajo para Basis Technology que produce Rosette API, que puedes probar gratis.]