¿Cuáles son buenas métricas para la polarización política en las redes sociales?

Una herramienta natural y muy simple es un clasificador de sentimientos.

Si tiene un gran corpus de textos con, por ejemplo, cinco clases: “altamente democrático”, “algo democrático”, “neutral”, “algo republicano”, “altamente republicano”, puede entrenar un modelo superficial muy simple que le dará Tiene una distribución de probabilidad sobre estas clases.

Obtener una buena métrica es otra historia. No puede confiar en el supuesto de que su clasificador no dará su texto 0.5 en “altamente democrático” y 0.5 en “altamente republicano” al mismo tiempo. Por supuesto, la función logloss intenta ocuparse de eso durante el entrenamiento, pero no es tan bueno en la práctica y no tenemos nada mejor que eso.

Entonces, esta es una oportunidad para experimentar. Trataría de llegar a una fórmula simple que penalice la distribución “uniforme” de los puntajes, si le da un buen resultado de inmediato, felicidades. Si no, apilar los clasificadores y reducir el número de clases gradualmente, acercándose así a la polaridad en cuestión, debería brindarle mejores resultados.

Ciencia de datosEstrategia deMarketing enRedesRedes sociales en líneasociales

Related Content

¿Cuál puede ser un buen comienzo para una persona que no es de TI como yo en el campo de los datos?

¿Cuáles son los lenguajes utilizados en ciencia de datos en India?

En AWS, ¿qué es mejor para el análisis y modelado de datos: instancias optimizadas para memoria o computación?

¿Cómo mejorar mi perfil para obtener una admisión para MS en Data Science de GA TECH?

¿Cuáles son las habilidades clave necesarias para ser un desarrollador de Big Data?

Cómo ver la pista de big data relacionada con su carrera objetivo

¿La salida de codificación de word2vec de ‘cómo estás’ y su salida de codificación de ‘cómo estás’ son iguales?

More Interesting

¿Cuáles son los mejores libros sobre ciencia de datos?

¿Cómo se automatiza la minería de datos?

En análisis en línea, ¿cómo se prueban 'miles de puntos de datos'?

¿Tengo la oportunidad de trabajar en San Francisco como científico de datos?

¿Cómo se sienten los estudiantes de doctorado en aprendizaje automático después del reciente aumento del aprendizaje profundo? ¿Creen que gran parte de su arduo trabajo se desperdiciará?

¿Qué es la "ciencia" en ciencia de datos? ¿Se trata exclusivamente de la ciencia de monetizar grandes datos, o también hay un aspecto de no negocios?

¿Qué opinas sobre la plataforma de ciencia de datos de Domino?

¿Por qué no se puede usar el porcentaje (%) para la normalización de datos en estadísticas?

¿Qué tipo de habilidades necesita desarrollar un programador científico durante la transición a un desarrollador de software industrial?

¿Cuáles son las compañías de análisis / ciencia de datos que pagan mucho en Bangalore?

¿Qué hace la combinación de datos y el software de análisis avanzado?

¿Cómo logra Coffee Meets Bagel tener éxito sin ningún científico de datos?

¿Qué opinas de Numerai?

Estoy interesado en una carrera en Big Data. Cómo y por dónde empiezo.

¿Hay alguna empresa rentable de minería de datos en la India?

Web Analytics