En situaciones en las que una persona con considerable experiencia, autoridad y reputación aborda una pregunta aquí en Quora en un área en la que tengo un interés meramente aficionado, como el ex Director de CBO y OMB que considera esta pregunta (y lo hace con un bastante preocupante): mi inclinación es dejar que el asunto permanezca. Dado que la mencionada persona autorizada me ha pedido que intervenga, tengo algunas cosas, después de un momento de “Wayne & Garth a Alice Cooper”, que creo que valen la pena agregar.
En mi vida profesional utilizo regularmente Census.gov, la Oficina de Estadísticas Laborales de EE. UU. Y NVSS – Datos de nacimiento de los CDC como base para la evaluación del tamaño del mercado y la oportunidad. (Gran parte de mi carrera se ha relacionado con productos para niños, por lo que los datos de nacimiento son muy pertinentes para pronosticar). En general, he preferido los datos del censo decenal para cosas como el desglose de ingresos y educación simplemente porque hay menos inferencia, pero no he experimentado cualquier problema notable con los datos de ACS o CPS, principalmente porque no estoy seguro con qué me compararía. Diferentes empresas de investigación de mercado recopilarán diferentes datos sobre los dólares gastados y las unidades vendidas y el comportamiento del consumidor, de modo que se puedan resolver las discrepancias y se puedan emitir juicios. Nadie, excepto la oficina del censo, hasta donde yo sé, realmente está evaluando a toda la población de los Estados Unidos.
En mi vida recreativa como un colaborador activo de Quora que escribe algunas piezas que analizan la política, la política y la economía y lo hace por pura diversión (todos obtenemos nuestras patadas de diferentes maneras), he aprovechado todo lo anterior a veces más información del Departamento del Tesoro de los EE. UU., la Junta de Gobernadores del Sistema de la Reserva Federal, el Banco de la Reserva Federal de St. Louis, la Oficina de Administración y Presupuesto, los Centros de Servicios de Medicare y Medicaid, las Estadísticas de Delitos, The World Factbook y Data.gov . Como nunca me he ocupado de los problemas de la recopilación de datos, realmente no tengo nada que decir allí. En términos de contexto, presentación e interpretación, que es realmente importante para la discusión pública informada, tengo varias quejas importantes:
- ¿Todavía vale la pena hacer MS en aprendizaje automático clásico o minería de datos sin un módulo en profundidad sobre aprendizaje profundo que está en tendencia?
- ¿Cómo es una implementación de ciencia de datos de producción?
- ¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?
- ¿Cuál es la diferencia entre ciencia de datos, análisis de datos, minería de datos y big data?
- ¿Qué son los datos internos?
- Distinciones en los informes de presupuesto y gasto entre gasto “discrecional” y gasto “obligatorio”. Esto generalmente surge en conversaciones donde las personas, muchas de las cuales participo en una coalición política, cuestionan los gastos de defensa frente a los gastos federales en programas sociales, pero no tienen en cuenta el Seguro Social, Medicare y Medicaid.
- Falta de reconocimiento del gasto estatal y local en estadísticas federales. No creo que corresponda al gobierno federal informar los datos estatales y locales, pero hay varias áreas de política, principalmente Educación, sobre las que escribo bastante, donde hay un asterisco en el que los fondos federales suelen ser complementarios la mayoría ayudaría a los ciudadanos a navegar con mayor eficacia las grandes preguntas. Esto también se aplica a las conversaciones sobre política fiscal.
- Datos salariales que no tienen en cuenta, o al menos no reconocen, el costo total de la compensación, que generalmente incluye las contribuciones del empleador a las primas de atención médica. Las conversaciones sobre el estancamiento salarial desde la década de 1970 son increíblemente engañosas cuando no reflejan lo que los empleadores realmente gastan en los empleados.
- Datos de desempleo que no reflejan el subempleo o los trabajadores desanimados. Cuando los medios informativos informan sobre el desempeño del mercado de valores, generalmente hablamos del Dow, el Nasdaq Composite y el S&P 500, por lo que seguramente el público puede manejar múltiples estadísticas en este frente.
Podría continuar, pero luego comenzaré a lidiar con cosas como dólares constantes frente a dólares actuales en gráficos estadísticos o exactamente lo que se incluye para evaluar el IPC, y luego tendría que comenzar a distinguir realmente entre los datos y los informes en sí y varios actores en política y medios de comunicación que usan esos datos para defender sus propios fines. Los miembros del público en general también tienen la responsabilidad de hacer más preguntas y buscar respuestas, pero luego nos encontramos con el dilema de cuán bien equipados están los diversos miembros del público en general para hacer las preguntas. Ese es su propio desafío, pero creo sinceramente que puede hacerse más fácil y más accesible.
Terminé confiando en recursos como usgovernmentspending.com, el Instituto de Impuestos y Política Económica (ITEP) y Cálculos políticos para obtener información más útil. Si bien la investigación y la investigación independientes son críticas (y tener datos brutos confiables para respaldar estos esfuerzos aún más), creo que es muy problemático que terminemos teniendo conversaciones de política nacional con un lente casi exclusivamente federal, y que las métricas clave que usamos comúnmente para evaluar colectivamente el estado de nuestra economía se presentan de manera extremadamente limitada. Para que las estadísticas sean confiables, también deben ser relevantes y significativas. Si bien existen varias razones para considerar piezas más estrechas de conjuntos grandes, creo que corresponde tanto a los funcionarios de la agencia como a los formuladores de políticas esforzarse por proporcionar un mejor contexto en cualquier presentación de información estadística.