¿El uso de Big Data no pudo predecir las elecciones de 2016?

No, no fallaron.

En realidad, las principales empresas de encuestas fracasaron. Las personas talentosas como Sam Wang de Princeton lo entendieron bien. Si usted es un estadístico, busque su sitio web para encontrar sus métodos estadísticos e investigación.

Las razones por las que los resultados de las encuestas fueron inexactos son en realidad 3:

  1. La mayoría de las encuestas fueron parciales porque estaban a favor de Hilary Clinton. Estas encuestas fueron realizadas por medios sesgados y, por lo tanto, los resultados sesgados fueron inevitables. También tenga en cuenta que a estos medios no les importa difundir encuestas falsas, no son compañías de encuestas en sí mismas y, en consecuencia, su reputación no sufrirá un impacto.
  2. Sin embargo, muchas compañías de encuestas confiaron en extraer información de encuestas publicadas en redes sociales como Facebook, Twitter, etc. Es ampliamente conocido que las redes sociales están inundadas de información falsa.
  3. Esta elección fue una decisión difícil. Se requieren habilidades y perspicacia para hacer predicciones correctas. Los buenos estadísticos también deben modelar el sesgo y el ruido externo.

Mi consejo:

La próxima vez que desee buscar predicciones, no tenga demasiado en cuenta las empresas de encuestas que están controladas. En su lugar, busque investigaciones realizadas en universidades (como el equipo de Sam Wang), que no solo dan resultados imparciales, sino que también tienen prestigio académico.

No.

Big data no falló. Los medios fallaron. Eso es lo que sucede con los modelos estadísticos: obtienes lo que pones.

Una encuesta del Washington Post decidió que había una ventaja de 8 puntos para Clinton.

Antes de llegar a conclusiones, mire el tamaño de la muestra:

Un 10% menos de republicanos participaron en esta encuesta que los demócratas.

Bueno, sin duda, Hillary Clinton salió en la cima de la encuesta, cualquier dingbat podría decir que eso iba a suceder. De hecho, puede encontrar que casi todos los principales medios de comunicación hacen exactamente lo mismo *. Cuando cada encuesta es esencialmente “¿cómo obtuvo el tamaño de su muestra?” “Oh, caminamos por las calles de un campus universitario de California y preguntamos a las primeras 4 mujeres negras que vimos”, ¿qué puede esperar de los datos?

Como libertario y científico de datos, me alegro de que Trump haya ganado. Solo para pegarlo a los piratas informáticos que se esforzaron tanto por manipular al público a través de datos objetivamente falsos. Cuando necesitamos confiar en 4Chan para nuestro periodismo de investigación, sabes que algo no está bien …

* Fox se ha sentado más o menos. Son anti-Hillary, pero tampoco son pro-triunfo.

Por lo que puedo decir, sí, y fallaron horriblemente. Hillary ganó el voto popular por alrededor de 1 millón, pero todas las predicciones que vi hicieron que Hillary ganara fácilmente (90% más o menos). Esto se debió a que los datos analizados eran demasiado vagos y sesgados. El software ni siquiera está cerca de predecir lo que los humanos están pensando (especialmente con una información tan limitada que se analiza) y este es un ejemplo de eso.

More Interesting

¿En qué se diferencia el desarrollo de software de aprendizaje automático industrial orientado a productos de la investigación académica de aprendizaje automático o el desarrollo de prototipos de investigación industrial?

En la selección de características, ¿debemos eliminar siempre todas las características que tienen una alta covarianza entre ellas?

¿Cuál es la configuración necesaria para comenzar la ciencia de datos con R en mi computadora portátil?

¿Cómo aprendes la programación de Python para la ciencia de datos?

¿Qué es mejor: zipfian o información para el campo de entrenamiento de ciencia de datos?

¿Vale la pena hacer ciencia de datos?

¿Hay personas de Física y Química Computacional que realizan Ciencia de Datos en la industria?

¿Cómo se ve la arquitectura de datos de una red publicitaria?

¿Hay algún lugar en Gurgaon donde pueda enseñar Data Science gratis?

¿Cuál es la mejor manera de encajar los equipos de ciencia de datos en una estructura organizacional de desarrollo de productos?

¿Cómo explicaría al público la importancia de generar ideas a partir de los datos?

¿Cuáles son las mejores compañías de big data en INDIA para un desarrollador de software?

¿Cuál es la diferencia entre ingeniería de datos y minería de datos?

¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?

¿Cuál es la diferencia entre un científico de datos y un analista de inteligencia de negocios?