¿El uso de Big Data no pudo predecir las elecciones de 2016?

No, no fallaron.

En realidad, las principales empresas de encuestas fracasaron. Las personas talentosas como Sam Wang de Princeton lo entendieron bien. Si usted es un estadístico, busque su sitio web para encontrar sus métodos estadísticos e investigación.

Las razones por las que los resultados de las encuestas fueron inexactos son en realidad 3:

¿Qué información buscará un científico de datos en un conjunto de datos de un procesador de pagos en línea que consta de transacciones, información comercial y otra información sobre negocios comerciales?
¿Qué es el metanálisis y cómo se usa (si lo hay) en ciencia de datos?
¿Cuáles son los grandes proyectos de datos en torno a craigslist?
¿Hay alguna capacitación en el aula dirigida por un instructor en Pune para el aprendizaje automático y la ciencia de datos para un principiante completo?
¿Por qué no tenemos un sistema de transacción de datos que transfiera datos en forma de sistemas decimales en lugar de binarios (0 y 1) en las computadoras? ¿Cuál es la viabilidad de tener ese tipo de transacción de datos?

La mayoría de las encuestas fueron parciales porque estaban a favor de Hilary Clinton. Estas encuestas fueron realizadas por medios sesgados y, por lo tanto, los resultados sesgados fueron inevitables. También tenga en cuenta que a estos medios no les importa difundir encuestas falsas, no son compañías de encuestas en sí mismas y, en consecuencia, su reputación no sufrirá un impacto.
Sin embargo, muchas compañías de encuestas confiaron en extraer información de encuestas publicadas en redes sociales como Facebook, Twitter, etc. Es ampliamente conocido que las redes sociales están inundadas de información falsa.
Esta elección fue una decisión difícil. Se requieren habilidades y perspicacia para hacer predicciones correctas. Los buenos estadísticos también deben modelar el sesgo y el ruido externo.

Mi consejo:

La próxima vez que desee buscar predicciones, no tenga demasiado en cuenta las empresas de encuestas que están controladas. En su lugar, busque investigaciones realizadas en universidades (como el equipo de Sam Wang), que no solo dan resultados imparciales, sino que también tienen prestigio académico.

Big DataBig Data AnalysisData AnalysisData Science

Related Content

¿Qué ventajas ofrece un doctorado en bioestadística / bioinformática al aplicar un trabajo de científico de datos?

¿Cuál es el límite de tamaño de archivo en una carga a Slack?

¿Qué es la dependencia de datos?

¿Cuál es la diferencia entre el algoritmo K-Nearest Neighbours y el modelo de suavizado exponencial simple en un problema de serie temporal?

¿Mi experiencia en Java cuenta para Big Data?

¿Por qué las personas almacenan grandes datos utilizando buffers de protocolo (o equivalente)?

¿Cuál es la diferencia entre un ingeniero y un científico, y cuál es más divertido?

No.

Big data no falló. Los medios fallaron. Eso es lo que sucede con los modelos estadísticos: obtienes lo que pones.

Una encuesta del Washington Post decidió que había una ventaja de 8 puntos para Clinton.

Antes de llegar a conclusiones, mire el tamaño de la muestra:

Un 10% menos de republicanos participaron en esta encuesta que los demócratas.

Bueno, sin duda, Hillary Clinton salió en la cima de la encuesta, cualquier dingbat podría decir que eso iba a suceder. De hecho, puede encontrar que casi todos los principales medios de comunicación hacen exactamente lo mismo *. Cuando cada encuesta es esencialmente “¿cómo obtuvo el tamaño de su muestra?” “Oh, caminamos por las calles de un campus universitario de California y preguntamos a las primeras 4 mujeres negras que vimos”, ¿qué puede esperar de los datos?

Como libertario y científico de datos, me alegro de que Trump haya ganado. Solo para pegarlo a los piratas informáticos que se esforzaron tanto por manipular al público a través de datos objetivamente falsos. Cuando necesitamos confiar en 4Chan para nuestro periodismo de investigación, sabes que algo no está bien …

* Fox se ha sentado más o menos. Son anti-Hillary, pero tampoco son pro-triunfo.

Nikos Kafritsas

Por lo que puedo decir, sí, y fallaron horriblemente. Hillary ganó el voto popular por alrededor de 1 millón, pero todas las predicciones que vi hicieron que Hillary ganara fácilmente (90% más o menos). Esto se debió a que los datos analizados eran demasiado vagos y sesgados. El software ni siquiera está cerca de predecir lo que los humanos están pensando (especialmente con una información tan limitada que se analiza) y este es un ejemplo de eso.

Nikos Kafritsas

More Interesting

¿En qué se diferencia el desarrollo de software de aprendizaje automático industrial orientado a productos de la investigación académica de aprendizaje automático o el desarrollo de prototipos de investigación industrial?

En la selección de características, ¿debemos eliminar siempre todas las características que tienen una alta covarianza entre ellas?

¿Cuál es la configuración necesaria para comenzar la ciencia de datos con R en mi computadora portátil?

¿Cómo aprendes la programación de Python para la ciencia de datos?

¿Qué es mejor: zipfian o información para el campo de entrenamiento de ciencia de datos?

¿Vale la pena hacer ciencia de datos?

¿Hay personas de Física y Química Computacional que realizan Ciencia de Datos en la industria?

¿Cómo se ve la arquitectura de datos de una red publicitaria?

¿Hay algún lugar en Gurgaon donde pueda enseñar Data Science gratis?

¿Cuál es la mejor manera de encajar los equipos de ciencia de datos en una estructura organizacional de desarrollo de productos?

¿Cómo explicaría al público la importancia de generar ideas a partir de los datos?

¿Cuáles son las mejores compañías de big data en INDIA para un desarrollador de software?

¿Cuál es la diferencia entre ingeniería de datos y minería de datos?

¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?

¿Cuál es la diferencia entre un científico de datos y un analista de inteligencia de negocios?

Web Analytics