- Twitter NLP (http://code.google.com/p/ark-twe…): – El paquete Twitter NLP se puede utilizar para tokenizar e identificar el etiquetado POS para el tweet.
- Twitter NER (https://github.com/aritter/twitt…): se llama sistema de reconocimiento de entidades capacitado en datos de Twitter. En general, el caso Camel y el caso de la palabra Capital se consideran una característica muy importante para la entidad con nombre. Pero en el tweet, el usuario usa palabras mayúsculas para dar más énfasis. Por lo tanto, el sistema general de reconocimiento de entidades con nombre identifica muchos de los casos de palabras capitales como entidad con nombre en los datos de Twitter. Pero dado que esta herramienta está entrenada en datos de Twitter, es bastante precisa e ignora estos casos.
- Implementación de LDA para tweeter: consulte la implementación de LDA específica de Twitter (www2012.wwwconference.org/proceedings/companion/p1035.pdf) y (http://sewm.pku.edu.cn/TianwangL…)
- Normalización de Twitter: Twitter tiene una restricción de 140 caracteres. Por lo tanto, los tweets generalmente tienen variaciones de palabras, símiles, formas cortas y ruidos. Por lo tanto, es necesario convertir el tweet a una oración en inglés adecuada, antes de usarlo para la aplicación nlp. El investigador tiene herramientas de traducción automática para traducir el tweet a la oración correcta en inglés. revise la respuesta de quora para obtener más detalles. (Procesamiento de lenguaje natural: ¿cómo haría una API que convierta cualquier tweet en una oración en inglés?
¿Hay algún paquete de código abierto para aplicar ML a las publicaciones de Twitter?
Related Content
¿Cuáles son las principales razones contra el uso de apilamiento cuando tenemos redes neuronales?
¿Cuál es el artículo o recurso web más informativo sobre el modelado similar?
¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?
Actualmente estamos agregando esta función al rastreador de la nube
rastreador de nubes
para trabajar en twitter, instagran, vine, etc.
Si hay algún interés en participar, comuníquese
No es específicamente el aprendizaje automático per se, pero mi grupo de investigación tiene una parte de Twitter de código abierto de etiquetado de discurso (pos) http://www.ark.cs.cmu.edu/TweetNLP/
More Interesting
¿Cuál es la diferencia entre IA, aprendizaje automático y aprendizaje profundo?
¿Una máquina aprende una ciencia o un arte?
¿Qué requisitos previos debe tener para aprender la teoría de las redes neuronales artificiales?
¿Existen métodos de aprendizaje automático además de los que requieren redes neuronales?
¿Cuál es un buen tutorial sobre el uso de Weka con Big Data?
¿Cuáles son algunas reglas de clasificación de pulgares?
¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?