¿Qué tan confiables son las estadísticas oficiales del gobierno en los Estados Unidos?

En situaciones en las que una persona con considerable experiencia, autoridad y reputación aborda una pregunta aquí en Quora en un área en la que tengo un interés meramente aficionado, como el ex Director de CBO y OMB que considera esta pregunta (y lo hace con un bastante preocupante): mi inclinación es dejar que el asunto permanezca. Dado que la mencionada persona autorizada me ha pedido que intervenga, tengo algunas cosas, después de un momento de “Wayne & Garth a Alice Cooper”, que creo que valen la pena agregar.

En mi vida profesional utilizo regularmente Census.gov, la Oficina de Estadísticas Laborales de EE. UU. Y NVSS – Datos de nacimiento de los CDC como base para la evaluación del tamaño del mercado y la oportunidad. (Gran parte de mi carrera se ha relacionado con productos para niños, por lo que los datos de nacimiento son muy pertinentes para pronosticar). En general, he preferido los datos del censo decenal para cosas como el desglose de ingresos y educación simplemente porque hay menos inferencia, pero no he experimentado cualquier problema notable con los datos de ACS o CPS, principalmente porque no estoy seguro con qué me compararía. Diferentes empresas de investigación de mercado recopilarán diferentes datos sobre los dólares gastados y las unidades vendidas y el comportamiento del consumidor, de modo que se puedan resolver las discrepancias y se puedan emitir juicios. Nadie, excepto la oficina del censo, hasta donde yo sé, realmente está evaluando a toda la población de los Estados Unidos.

En mi vida recreativa como un colaborador activo de Quora que escribe algunas piezas que analizan la política, la política y la economía y lo hace por pura diversión (todos obtenemos nuestras patadas de diferentes maneras), he aprovechado todo lo anterior a veces más información del Departamento del Tesoro de los EE. UU., la Junta de Gobernadores del Sistema de la Reserva Federal, el Banco de la Reserva Federal de St. Louis, la Oficina de Administración y Presupuesto, los Centros de Servicios de Medicare y Medicaid, las Estadísticas de Delitos, The World Factbook y Data.gov . Como nunca me he ocupado de los problemas de la recopilación de datos, realmente no tengo nada que decir allí. En términos de contexto, presentación e interpretación, que es realmente importante para la discusión pública informada, tengo varias quejas importantes:

Distinciones en los informes de presupuesto y gasto entre gasto “discrecional” y gasto “obligatorio”. Esto generalmente surge en conversaciones donde las personas, muchas de las cuales participo en una coalición política, cuestionan los gastos de defensa frente a los gastos federales en programas sociales, pero no tienen en cuenta el Seguro Social, Medicare y Medicaid.
Falta de reconocimiento del gasto estatal y local en estadísticas federales. No creo que corresponda al gobierno federal informar los datos estatales y locales, pero hay varias áreas de política, principalmente Educación, sobre las que escribo bastante, donde hay un asterisco en el que los fondos federales suelen ser complementarios la mayoría ayudaría a los ciudadanos a navegar con mayor eficacia las grandes preguntas. Esto también se aplica a las conversaciones sobre política fiscal.
Datos salariales que no tienen en cuenta, o al menos no reconocen, el costo total de la compensación, que generalmente incluye las contribuciones del empleador a las primas de atención médica. Las conversaciones sobre el estancamiento salarial desde la década de 1970 son increíblemente engañosas cuando no reflejan lo que los empleadores realmente gastan en los empleados.
Datos de desempleo que no reflejan el subempleo o los trabajadores desanimados. Cuando los medios informativos informan sobre el desempeño del mercado de valores, generalmente hablamos del Dow, el Nasdaq Composite y el S&P 500, por lo que seguramente el público puede manejar múltiples estadísticas en este frente.

Podría continuar, pero luego comenzaré a lidiar con cosas como dólares constantes frente a dólares actuales en gráficos estadísticos o exactamente lo que se incluye para evaluar el IPC, y luego tendría que comenzar a distinguir realmente entre los datos y los informes en sí y varios actores en política y medios de comunicación que usan esos datos para defender sus propios fines. Los miembros del público en general también tienen la responsabilidad de hacer más preguntas y buscar respuestas, pero luego nos encontramos con el dilema de cuán bien equipados están los diversos miembros del público en general para hacer las preguntas. Ese es su propio desafío, pero creo sinceramente que puede hacerse más fácil y más accesible.

Terminé confiando en recursos como usgovernmentspending.com, el Instituto de Impuestos y Política Económica (ITEP) y Cálculos políticos para obtener información más útil. Si bien la investigación y la investigación independientes son críticas (y tener datos brutos confiables para respaldar estos esfuerzos aún más), creo que es muy problemático que terminemos teniendo conversaciones de política nacional con un lente casi exclusivamente federal, y que las métricas clave que usamos comúnmente para evaluar colectivamente el estado de nuestra economía se presentan de manera extremadamente limitada. Para que las estadísticas sean confiables, también deben ser relevantes y significativas. Si bien existen varias razones para considerar piezas más estrechas de conjuntos grandes, creo que corresponde tanto a los funcionarios de la agencia como a los formuladores de políticas esforzarse por proporcionar un mejor contexto en cualquier presentación de información estadística.

Ciencia de datosdatosEncuestasestadísticasEstados Unidos de AméricaGobiernoGobierno en los Estados Unidos de América

Si se le da una opción entre el aprendizaje automático y el big data como electivo, ¿cuál es el mejor para elegir teniendo en cuenta el alcance?

¿Se considera que R no es adecuado para Big Data en comparación con Python?

¿Por qué funciona la ciencia de datos?

¿Cuál es la diferencia entre una maestría en análisis de negocios y big data y una maestría en ciencia de datos? ¿Qué habilidades necesitas dominar para cada uno?

¿Cuál es la diferencia (en términos de conocimiento adquirido, práctico) en el uso de la base de datos basada en la nube (por ejemplo, el servicio web de Amazon) y la base de datos típica de Oracle en el proyecto del curso de pregrado?

Quiero comprar una computadora portátil que pueda manejar juegos pesados como Assassin’s Creed Unity o Rogue. Entonces, ¿cuál debo comprar?

El mismo fenómeno que ha provocado que las tasas de respuesta a las encuestas de opinión pública disminuyan a menos del 10 por ciento está obstaculizando las encuestas utilizadas para muchas estadísticas oficiales del gobierno. Estos incluyen, entre otros, la Encuesta de población actual, la Encuesta de ingresos y participación en el programa y la Encuesta sobre la comunidad estadounidense, que generan estadísticas importantes sobre el desempleo, la cobertura del seguro médico, la inflación y la pobreza.

Un artículo en el último número del Journal of Economic Perspectives subraya la disminución alarmante en la calidad de los datos de estas encuestas, comprometiendo la precisión de las estadísticas oficiales.

Como se detalla en mi reciente columna Bloomberg View, han surgido varios problemas con las encuestas:

Baja tasa de respuesta: las tasas de respuesta de los hogares están disminuyendo rápidamente. Por ejemplo, la tasa de falta de respuesta de la Encuesta de Gastos del Consumidor aumentó del 15 por ciento a mediados y finales de la década de 1980 a más del 33 por ciento en 2013. Las tasas de falta de respuesta probablemente estén aumentando porque las encuestas se consideran lentas, molestas y lentas. intrusivo de la privacidad.

Faltan respuestas: Junto con la escasa participación en la encuesta en sí, simplemente faltan muchas respuestas entre quienes participan. Las agencias estadísticas del gobierno a menudo imputan una respuesta, mediante el uso de técnicas estadísticas para adivinar en qué se habría basado la respuesta en las respuestas de otras familias similares. Por ejemplo, en la Encuesta de población actual (utilizada para muchos propósitos, incluido un indicador del ingreso familiar y la pobreza):

Más de un tercio del dinero registrado como recibido por los hogares del Seguro Social se imputa
Aproximadamente una cuarta parte del dinero registrado para asistencia social se estima de manera similar

Imputaciones poco confiables: las tasas de imputación generalmente han aumentado con el tiempo y, a menudo, no son muy confiables. Cuando los autores del artículo del Journal of Economic Perspectives compararon los dólares reportados en las encuestas con los datos administrativos sobre la cantidad de programas que realmente se enviaron a los hogares, encontraron un sesgo significativo:

Para TANF, las estimaciones sugieren que la mitad o menos de los beneficios proporcionados se capturan en encuestas oficiales
Para los cupones de alimentos, los dólares a menudo se subestiman en un 30% o más
Para la Seguridad Social, el sesgo es menor, pero aún puede variar del 5 al 30 por ciento en las principales encuestas.

Estos errores han ido aumentando con el tiempo a medida que la calidad de la encuesta se ha deteriorado. Y su impacto es grande. Según los autores, el ajuste para estas brechas podría:

Reducir la tasa de pobreza general en más de 2 puntos porcentuales.
Reducir y la tasa de pobreza para madres solteras en más de 10 puntos porcentuales

Eso, a su vez, sugiere que los formuladores de políticas basan sus decisiones en datos que son significativamente diferentes de lo que sucede en el mundo real.

¿Lo que se debe hacer? Tres pasos serían útiles:

Vincular más rápidamente los registros administrativos con los datos de la encuesta, para ayudar a corregir el sesgo en este último
Explorar nuevas formas de combinar las bases de datos masivas que se recopilan en el sector privado con datos oficiales.
Protección de fondos para encuestas oficiales, para permitir más esfuerzos para reducir el error de medición. (Por ejemplo, la administración de Barack Obama ha buscado dinero para reanudar el seguimiento de los datos que los encuestados dejaron incompletos en la Encuesta sobre la Comunidad Estadounidense. Cuando se eliminó la financiación para ese seguimiento, la tasa de datos faltantes aumentó del 5,5 por ciento al 8,5 por ciento. )

Peter Orszag

Todo lo que me han dicho y leído parece indicar que las estadísticas gubernamentales de los siguientes departamentos son tan precisas como humanamente posible. En estas áreas, los estadounidenses pueden estar orgullosos.

El World Factbook de la CIA
La OMB – Oficina de Gestión y Presupuesto
La CBO – Oficina de presupuesto del Congreso
La oficina del censo

A menos que comiencen a usar Muestreo

La Oficina de Estadísticas Laborales

Servicio Nacional de Estadística Agropecuaria

Oficina de Estadísticas de Justicia

El IRS – Servicio de Impuestos Internos

Yo también los odio pero no mienten muy a menudo.

En su mayor parte, estas organizaciones están llenas de hombres y mujeres inteligentes que solo intentan dar lo mejor de sí mismos.

Por otro lado, cualquier estadística gubernamental que tenga que ver con el empleo, el PIB, la inflación y el déficit y la deuda debe tomarse con un gran grano de sal.

Básicamente, las estadísticas del gobierno de los Estados Unidos son honestas cuando no hay razón para que sean deshonestas, pero si hay un incentivo para ser deshonesto, lo serán.

Toma lo que dice la FED y tíralo al río. Se mienten todo el tiempo. Los miembros de la FED tienen un incentivo monetario para mentir sobre la realidad, ya que han trabajado o volverán a trabajar para los grandes bancos que regulan y recompensan.

Joe Blitzstein

More Interesting

¿Cómo han fomentado los grandes datos la ciencia? ¿Existen ejemplos en los que el análisis de big data ha llevado a una mejora significativa en cualquier campo científico que no se podría hacer mediante el análisis tradicional?

¿Cuáles son algunos de los análisis de datos más interesantes que se hayan hecho?

¿Existe algún servicio web asequible para importar datos de un CSV, conectarlos, limpiarlos y analizarlos?

¿Por qué hay tantos científicos de datos falsos e ingenieros de aprendizaje automático?

¿Prefieres usar Mesos o Kubernetes para la arquitectura de big data? ¿Por qué?

¿Cómo se convierte uno en científico?

¿Cómo es útil Python en análisis de datos? ¿Qué características le dan una ventaja sobre otras herramientas de ciencia de datos?

¿La capacitación y la certificación de Big Data ayudarán a impulsar mi carrera como desarrollador de Java?

¿Cómo es ser un científico de datos en IBM?

¿Un tipo de ciencia de datos de corte de cookies captaría el impulso suficiente de las compañías no tecnológicas que no quieren invertir dinero ni siquiera en un equipo de ciencia de datos de un solo hombre?