De hecho, discutimos esto ayer en mi clase de estadísticas, centrándonos principalmente en los problemas con muchas de las encuestas realizadas.
Todos llegamos a la conclusión de que realmente se debió a un sesgo. Diferentes tipos de sesgo en realidad, como:
Sesgo de no respuesta : los que tienden a responder a las encuestas tienden a ser personas con un nivel de educación superior, mientras que las personas menos educadas contribuyen mucho menos a la mayoría de las encuestas. Eso significa que estamos obteniendo respuestas principalmente de un grupo de individuos cuyas opiniones probablemente se alinearán. Esto pasa por alto los puntos de vista de aquellos que no respondieron, que probablemente difieran de aquellos que sí participaron en la encuesta.
- ¿Existe una lista de conferencias de minería de datos / aprendizaje automático organizadas en los Estados Unidos?
- ¿Hay algún ejemplo de código de agrupación de documentos utilizando PCA o Autoencoder o algún otro algoritmo de agrupación?
- ¿Pueden las redes neuronales convolucionales entrenarse para jugar al ajedrez realmente bien?
- ¿Cómo debo elegir entre convertirme en un desarrollador de JavaScript de pila completa o un ingeniero de aprendizaje automático?
- ¿Qué significa el siguiente pasaje de un documento de aprendizaje profundo sobre aprendizaje automático sobre representaciones distribuidas frente a representaciones no distribuidas?
Sesgo de respuesta : ¿Cómo redactaron / formularon estas encuestas sus preguntas? Es posible que hayan redactado sus encuestas de una manera que haga más favores para elegir a Clinton sobre Trump. Simplemente diciendo el nombre de un candidato antes que el otro crea algún grado de sesgo de respuesta.
Cobertura insuficiente : con muchas de las personas que responden a las encuestas con una buena educación, deja de lado a aquellos que no tienen tanta educación. También existe la posibilidad de que estas encuestas se enfocaran en las respuestas de individuos en áreas más urbanas y votantes subrepresentados del medio oeste / rurales (que constituían una gran parte de los partidarios de Trump).
También con esta elección hubo muchas personas que se avergonzaron de declarar abiertamente su apoyo a Trump. Esta es la razón por la cual las encuestas de salida son mucho más precisas ya que cuando la “acción está hecha”, las personas tienen más probabilidades de confesar y admitir por quién votaron.
Los republicanos también tienden a tener un mayor número de votantes y están mucho más dispuestos a soportar largas filas de votación que sus homólogos democráticos. Es posible que estas encuestas no hayan tenido en cuenta este factor.
También está el movimiento “Bernie or Bust” y las personas que pueden haber creído que Clinton fue un zapato para la presidencia que a pesar de que votaron por un tercero o por Trump.