¿Es el libro ‘Excel 2007 Data Analysis for Dummies’ un buen sustituto del libro ‘Excel Data Analysis for Dummies’?

Veo un mensaje que sugiere que Excel no se puede usar para el análisis de datos, lo cual no es del todo cierto. Sin embargo, es necesario que haya un equilibrio. Todo depende de cuál sea su fuente y qué salida final se requiere. En mi caso, mis “clientes” eran directores y contadores calificados que querían cosas como un libro de trabajo que contenía hojas para unos 40 o más departamentos, con hojas de resumen a nivel de Área y Grupo. Eran básicamente profesionales con poco conocimiento o deseo de conocimiento de Excel. Espero que esto ayude.

Francamente, descubrí que el uso de tablas Pivot y un poco de VBA generalmente era todo lo que necesitaba. Excel es capaz de hacer mucho trabajo, rápido.

Trabajé para grandes empresas de telecomunicaciones del Reino Unido durante 2 años en el Departamento de Finanzas haciendo informes financieros que implican millones de registros y millones de libras. Automaticé la producción de estos informes usando VBA. Un requisito importante era la necesidad de poder reestructurar los datos como resultado de numerosas adquisiciones y reorganizaciones que cambiaron la estructura de la empresa, como a nivel de Grupo, Áreas, Regiones y Directores. Los datos mensuales anteriores tuvieron que volver a emitirse en la nueva estructura para Year To Date. Aunque “no calificado”, mis habilidades me permitieron sobrevivir a muchas situaciones de redundancia, a veces a intervalos de 6 meses.

En mi día estaba limitado por las 65.536 filas de Excel. Así que usé MS Access para mayores cantidades de datos. Hoy en día, una hoja de trabajo probablemente podría manejar cualquier cosa que necesite. Una gran ventaja fue la capacidad de acceder a las bases de datos corporativas y usar cosas como Essbase e Hyperion Pillar para extraer subconjuntos de datos. Más tarde, mis consultas se automatizaron centralmente. No necesitaba descargar todos los campos de cada registro.

Un requisito principal era tener la facilidad de “Profundizar” para encontrar registros individuales que formaran un total particular haciendo doble clic en él. Por lo tanto, tuve que ocultar los datos sin procesar en el libro de trabajo, y usé Tablas dinámicas ocultas para analizar los datos. Usé macros para hacer eso. Podría haberlo hecho de otra manera, pero eso funcionó muy bien. En ese nivel, Excel es muy rápido. Por lo general, podía proporcionar los informes del mes anterior el primer día del mes siguiente. Estos no fueron reparados en ese momento. Hubo un proceso durante varios días en el que los números fueron “ajustados”, y se requirieron más informes actualizados. (Si le pide a un contador que elabore un informe, él / ella le dirá “¿Qué quiere que muestre?”)

Verá que se requería una gran flexibilidad que no siempre se puede lograr a nivel de datos corporativos, que cubre más de un departamento. También hubo la necesidad de un alto nivel de urgencia y “labor” durante los primeros días de cada mes.

Como ejemplo de lo que se puede hacer en Excel, una vez que alguien más me dio un trabajo que no podía comenzar hasta el último día de un mes a las 5:30 p.m. cuando los “libros” estaban cerrados. Se requería calcular un diario de Excel para cargarlo en la base de datos principal. El primer mes no me fui a casa hasta las 10 de la noche. Poco a poco, durante un par de meses, lo automaticé para poder salir a las 6:15. La mayor parte del tiempo se tardó en descargar los datos de la base de datos corporativa de Oracle. Tuve que usar MS Access para comenzar este, y luego resumir más en Excel, debido al volumen de datos. Fácil.

No lo sé hoy en día, pero un gran problema solía ser que las descargas a menudo tenían registros corruptos y eran básicamente texto (incluso los números que tenían que convertirse).

Usar Excel para el análisis de datos es simplemente incorrecto.

Este ha sido mi motivo favorito durante muchos años. Los “usuarios talentosos” (que tienen algunas habilidades pero no son desarrolladores profesionales) crean hojas de cálculo de Excel elaboradas o bases de datos de Access para procesar sus datos de manera personalizada.

Aquí están los problemas:

Obtener los datos sin procesar suele ser una actividad intensiva en mano de obra y propensa a errores.

¿Qué sucede con la hoja de cálculo / base de datos si solo existe en el disco duro de la persona y los bloqueos duros?

¿Qué sucede si la persona decide retirarse, ser despedida u obtener otro trabajo? ¿Quién va a hacer el apoyo?

Cuando dos o más personas cargan sus datos en bruto en sus aplicaciones y las aplicaciones tienen diferentes macros para procesar los datos, se producen problemas. Hemos tenido reuniones en las que los primeros 15 minutos de cada reunión se dedicaron a averiguar qué datos eran los más correctos.

Los datos procesados ​​están disponibles para un grupo limitado. Cualquier persona fuera del grupo inmediato tiene que hacer su propio procesamiento para usar esos datos para otro propósito o informe.

Solución:

Centralice los datos en una base de datos SQL. Los datos en bruto probablemente ya estén allí de todos modos. Realice todo el procesamiento y los informes de la única fuente. De esa manera solo hay una versión de los datos.

He hecho muchos de estos. Te puedo dar pistas adicionales si lo necesitas.

More Interesting

¿Todos los científicos necesitarán saber ciencia de datos?

¿Qué habilidades necesito para construir un sitio web basado en big data?

¿Por qué hay una diferencia tan grande en cuanto a costos ...?

Cómo prepararse para una maestría en informática en aprendizaje automático / ciencia de datos como una persona sin mucha experiencia en el campo de la informática

¿Debo aprender Hadoop o Python si quiero entrar en big data?

¿Qué tan grandes son los componentes necesarios para acceder a los datos desde Wi-Fi?

Si escribo una disertación sobre el impacto de Big Data en una industria específica, ¿necesito aprender Análisis de datos?

¿Qué se necesita para clasificar dentro del # 10 en Kaggle? ¿Cuál es el camino de aprendizaje ideal para un principiante en ciencia de datos? ¿Qué todas las tecnologías y habilidades necesita adquirir y en qué orden? ¿Cuánto tiempo se tarda?

Cómo empezar si quiero aprender ciencia de datos como un nuevo aprendiz

¿Cómo es útil Python en análisis de datos? ¿Qué características le dan una ventaja sobre otras herramientas de ciencia de datos?

¿Cuáles son las oportunidades para un ingeniero de ciencia de datos / aprendizaje profundo en el futuro?

¿Elige escalar su DW / DB o implementar Hadoop cuando la cantidad de datos o la concurrencia se vuelve muy grande?

¿Es legal que una compañía SaaS use datos de clientes para negociar acciones?

¿Qué es la "ciencia" en ciencia de datos? ¿Se trata exclusivamente de la ciencia de monetizar grandes datos, o también hay un aspecto de no negocios?

¿Cuáles son las diversas formas en que Data Science puede convertirlo en un emprendedor exitoso?