¿Por qué Excel es una herramienta tan infravalorada para el análisis de datos?

No está infravalorado; en todo caso, está sobrevalorado. Para agregar a las ya excelentes respuestas aquí, un inconveniente importante de usar Excel para el análisis de datos es la coordinación, tanto en términos de diseño de datos como de obtención de resultados.

Dado que Excel funciona en fórmulas, todo lo que se necesita es que una celda de datos esté fuera de lugar para que los cálculos cambien por completo. Por lo tanto, dependiendo del tipo de análisis que esté ejecutando, Excel no podrá decirle dónde se están utilizando datos incorrectos o incompletos. Además, si desea cambiar el diseño de su tabla de datos, hacerlo puede ser bastante engorroso y lento.

Sin embargo, si utiliza un entorno estadístico como R, la plantilla de código permite una flexibilidad mucho mayor en la manipulación de datos a través de marcos de datos, vectores, etc. Además, R está mejor equipado para manejar grandes cantidades de datos (significativamente más cuando se combina con un lenguaje de bajo nivel como C ++), por lo que esta es una solución mucho más eficiente para tratar con datos que simplemente causarían que Excel se congelara.

“¿Por qué Excel es una herramienta tan infravalorada para el análisis de datos?”

Debido a que las personas lo comparan con herramientas altamente especializadas, descubra que esas herramientas altamente especializadas son mejores para los fines previstos que un caballo de batalla general como Excel, y concluye que Excel es inútil.

Es como decir que, dado que una minivan no es tan buena para el transporte de carga a gran escala como un Freightliner, y dado que una minivan no es tan buena para las carreras de Fórmula 1 como un auto de carreras de Fórmula 1, las minivans son inútiles.

Es como decir que dado que un Shopsmith no es la herramienta adecuada para construir un rascacielos o un avión, los Shopmith son inútiles y no deberían usarse para nada.

Y eso, dado que las personas que tienen las necesidades más avanzadas en tornos, sierras de mesa, lijadoras de disco, prensas de taladro verticales, máquinas perforadoras horizontales, enrutadores sobre mesa, máquinas formadoras debajo de la mesa, etc., etc., compran herramientas excelentes independientes y por separado. vuelvan sus narices en Shopsmiths, nadie debería usar Shopsmiths para nada.

Es un argumento idiota, hecho por personas muy inteligentes que deberían saber mejor.

Como herramienta general para crear rápidamente una gran variedad de herramientas de flujo de trabajo altamente especializadas que ahorran tiempo, no he encontrado nada mejor que Excel y Excel VBA, por mucho que me gustaría. Sí, hay mejores herramientas para el análisis estadístico avanzado. Sí, hay mejores herramientas para el tablero de instrumentos. Si necesita una base de datos relacional, no lo haga en Excel, aunque Excel y VBA pueden ser una herramienta front-end excelente y versátil para bases de datos. Si puede encontrar una herramienta especializada para hacer el tipo de trabajo que desea hacer, y es buena, probablemente sea mejor en esa tarea especializada que Excel. Pero eso no significa que no sirva para un excelente caballo de batalla general como Excel.

Excel también es ideal para un análisis general rápido y ad-hoc. Puede entrar, salir y tener su respuesta mientras un excelente programador de R recién comienza. Claro, para un gran proyecto estadístico de big data, R es mejor. Pero eso no significa que R sea mejor para todo. Al igual que esos Freightliners y los autos de carreras de Fórmula 1 no son las mejores herramientas para una carrera de comestibles, o para ir a buscar ese gran televisor en el que obtuviste una gran oferta.

Considere esto: puede hacer exactamente los mismos tipos de argumentos falaces contra el uso de MS Word y otros procesadores de texto. Porque si tiene un trabajo avanzado y especializado relacionado con el texto, probablemente pueda encontrar una herramienta especializada más adecuada para esa tarea que un procesador de texto general. Pero si alguien le dijera que esto significa que nunca debe usar procesadores de texto generales para nada, inmediatamente reconocería ese argumento como completamente estúpido. Y tendrías razón.

Excel es una herramienta fenomenal para el análisis de datos, y casi todos lo usan. Para todo. Es realmente accesible para las personas que se centran en los datos y el análisis, en lugar de la codificación.

Sin embargo, tiene sus límites:

  • Es realmente fácil cometer errores, por ejemplo, en fórmulas. Y es muy difícil rastrear esos errores.
  • Es muy difícil para la siguiente persona descubrir cómo se construye una hoja de cálculo complicada (por ejemplo, para depurarla, modificarla o extenderla). Para el caso, es bastante difícil para el escritor original recordar cómo lo construyeron. (Y cómo diablos incluso comentas o documentas una hoja de cálculo).
  • Se queda sin vapor en grandes conjuntos de datos. (Sin embargo, casar Excel con una base de datos SQL pone mucha capacidad en nuestras manos).

Por lo que vale, cuando la gente me pregunta “qué idioma debo aprender para entrar en la ciencia de datos”, generalmente les digo: Primero, aprendan matemáticas, particularmente estadísticas. Luego, aprenda a construir y extender hojas de cálculo (incluido el aprendizaje de SQL y cómo absorber datos). Entonces aprende MATLAB. Luego pase a R. Y luego comience a aprender sobre prácticas de diseño de software (estructuración, prueba, control de versiones, documentación, etc.), y sobre bases de datos NoSQL, MapReduce y similares. Excel es una gran herramienta de nivel de entrada para el análisis de datos.

No es seguro. Probablemente porque se han encontrado mejores herramientas que son mejores en partes específicas del análisis de datos (por ejemplo, SAS / R / Python para predictivo, Tableau / Spotfire para exploración). Además, ¡Excel ha existido durante tanto tiempo que la gente parece querer criticarlo!

Sin embargo, generalmente si una organización usa Excel, generalmente se usa en TODA la compañía. Gran ventaja Eso significa que en una gran empresa, miles de analistas pueden hablar el mismo idioma y compartir ideas, incluso al mismo tiempo. Diferentes niveles incluidos; desde el reportero básico hasta el usuario sofisticado de datos. Muy pocas herramientas pueden reclamar esa cantidad de alcance entre varios niveles de usuarios en toda la empresa.

Si bien la interfaz es simple, se puede ampliar a través de complementos para escala (PowerBI), funcionalidad (StatTools para mejores estadísticas), visualización (tablero de instrumentos, PowerBI, Plotly, minigráficos y automatización (Autohotkey) etc. Muchos de los complementos- Los complementos son de código abierto.

Creo que definitivamente está subestimado como una herramienta de análisis. Pero eso no significa que siempre sea la herramienta adecuada para todos los problemas analíticos. A pesar de las desventajas habituales, todavía ofrece mucha funcionalidad y es rentable con una interfaz GUI muy útil.

Pero sí, el análisis predictivo definitivamente deja mucho que desear, si eso es lo que está buscando, busque en otro lado. Pero incluso para eso, tengo un excelente análisis de datos realizado con Excel, y Excel generalmente puede interactuar bien con la mayoría de las otras herramientas de análisis.

Excel no está realmente infravalorado y todavía es ampliamente utilizado por la mayoría de las personas que realizan análisis de datos.

Es un software muy eficiente como todo el mundo lo sabe, aunque pocas personas lo usan en su máxima capacidad, pero tiene muchos defectos que la gente ya señaló en este hilo: es fácil cometer un error que pasa totalmente desapercibido, puede No maneje una gran cantidad de datos (a nivel de un millón de filas), y la visualización de datos sigue siendo muy básica.

En cambio, el aumento de las herramientas de BI de autoservicio abrió muchas nuevas posibilidades en términos de análisis de datos, como la facilidad para realizar análisis de bases de datos cruzadas, ya que reúnen todas sus fuentes en un punto central. Pero lo que también proporcionan a los usuarios con hojas de cálculo estáticas como las de Excel no es el gran nivel de interactividad.

Atrás quedaron los días en los que tiene que esperar días o semanas para obtener un informe que de todos modos está desactualizado. Los paneles le permitirán a usted y a su audiencia participar rápidamente, con una experiencia intuitiva, visuales atractivos y la posibilidad de profundizar datos e interactuar con ellos para comprenderlos mejor. También le permiten trabajar con una gran cantidad de datos, que le permiten ver tendencias y patrones irreconocibles de lo contrario.

Un software de tablero tiene muchas características interactivas que Excel no tiene, y puede leer algunas de sus ventajas aquí: 5 Características del tablero interactivo de tableros de negocios

Excel no está infravalorado como herramienta para el análisis estadístico. En todo caso, está sobrevaluado como tal herramienta. No confiaría en el análisis realizado en Excel a menos que estuviera muy seguro del analista (y los analistas de los que estoy seguro no usan Excel). ¿Por qué?

  • Al menos la forma en que la mayoría de la gente lo usa, es apuntar y hacer clic. Esa es una mala forma de hacer análisis estadísticos porque dificulta la replicación y hace que la detección de errores sea casi imposible.
  • Tiene muchas menos opciones que los programas dedicados como R, SAS, etc.
  • Hace que sea más difícil que otros programas verificar los supuestos
  • Si bien es posible hacer buenos gráficos en Excel, los gráficos predeterminados son horribles y hacerlos buenos es complicado.
  • Es muy fácil de usar. Sí, muy fácil Porque una herramienta fácil de usar es fácil de usar mal. Excel para estadísticas les da a las personas la idea de que pueden hacer análisis. A menudo, están equivocados al respecto. Hacer estadísticas bien requiere entrenamiento.
  • Como otros señalan, no puede manejar grandes datos. (Esto en realidad no me molesta, no trato con big data).
  • Es demasiado fácil, incluso para una persona con experiencia, equivocarse por completo. La referencia de celda y la referencia de fila / columna es excelente para hojas de cálculo, pero no para estadísticas. Y puede salir completamente mal sin errores, advertencias o lo que sea.

Las herramientas de código abierto para el análisis de datos (R, Python, Julia …) son más eficientes que Excel en:
1.Manipulación de datos (limpieza de datos, munging) [funciones fáciles de usar, métodos más completos]
2.Reporductibilidad: si usa un script, puede ejecutarlo sobre otras tareas similares, y la posibilidad de compartirlo lo adapta a la situación.
3. Paquetes !!: Lo mejor de las soluciones de código abierto mencionadas anteriormente es la capacidad de desarrollar nuevos métodos, algoritmos, capacidades y compartirlos en forma de paquete. (ya que no puede codificar desde cero cada vez que utilice su algoritmo / método).
Como conclusión, hay muchas mejores herramientas de análisis de datos que superan a Excel en posiblemente todos los aspectos del análisis de datos. En mi opinión, esas son las razones que hacen de Excel una herramienta infravalorada.

En el mundo de hoy, hay una nueva herramienta que sale todos los días y todos quieren mantenerse al día con la última tecnología. Una razón para esto podría ser que debido a que Excel tiene tantas funciones y características, es un poco abrumador, así que lo que sucede es que la gente divide partes de Excel en diferentes aplicaciones. Sin embargo, Excel ha existido durante años y años y sigue siendo la mejor herramienta todo en uno para la limpieza y la disputa de datos.

Además, el usuario promedio de Excel no comprende la gran cantidad de funciones y apenas rasca la superficie cuando opera Excel. El primer día de mi primera pasantía pensé que conocía los entresijos de Excel, pero en breve me di cuenta de que había tantas características avanzadas de las que nunca había oído hablar, que ahora, al mirar hacia atrás, ni siquiera eran tan avanzadas.

Si le pregunta a alguien que realmente comprende las características avanzadas de Excel, verá que en realidad no está tan infravalorado como podría pensar.

Tenemos un dicho en el mundo de la bioinformática y la bioestadística: Excel es donde los buenos datos van a morir.

La aplicación ciertamente ha recorrido un largo camino desde los días de Apple II, pero es básicamente una interfaz de usuario simple para tablas con estadísticas muy básicas y funcionalidad de tabla de búsqueda. A veces puede ser útil como visor de datos, pero tiene una utilidad marginal para los métodos modernos de análisis de datos, tiene capacidades de visualización de datos deficientes y realmente no hace mucho con los datos no tabulares.

En todo caso, Excel se usa con demasiada frecuencia y de manera inapropiada para el trabajo de análisis de datos.

¡No, no está infravalorado!

Excel es una herramienta tradicional y antigua. Su existencia es más antigua que el comienzo del dominio analítico. Todavía es una herramienta ampliamente utilizada para el análisis.

Pero, en algún contexto, Excel no es la mejor opción para muchos analistas debido a algunas razones:

  • Opciones menores que Python, R, SAS, etc.
  • Los gráficos predeterminados en Excel no son fáciles de usar.
  • Incapaz de manejar gran cantidad de datos.

Pero dado que Python & R requiere experiencia en estos lenguajes de programación, y si usted no tiene experiencia técnica, puede considerar Excel para el análisis de datos.

¿Interesado en aprender estas habilidades? Puede tomar cursos en línea para mejorar sus habilidades. Están disponibles gratuitamente y cursos de certificación como Data Analytics Course usando Excel y Power BI ofrecidos por Digital Vidya.

MS Excel es una herramienta muy versátil y efectiva para el modelado y análisis de datos. Su potencial y funcionalidad para manejar los datos es enorme. Microsoft sigue agregando características en MS Office y, por lo tanto, en MS Excel, para que sea mejor que nunca y también una de las cosas más interesantes de MS Excel es que es una herramienta fácil de usar y altamente interactiva para el análisis de datos.

Soy analista de datos y entusiasta del aprendizaje automático. Me emociona presentarles mi nuevo canal de Youtube: “ ANALYTICS MANTRA ”: un destino completo para todos los tutoriales sobre análisis de datos no solo en Excel, sino que les presentaremos los tutoriales en casi todas las herramientas de ciencia de datos.

  • Actualmente, hemos subido una serie de tutoriales en Excel avanzado (que queda con algunos tutoriales próximos) y ahora estamos trabajando en tutoriales en R y Python para Análisis de datos y Aprendizaje automático que se cargarán pronto.

Entonces, vaya al enlace y explore los tutoriales.

¡¡¡¡¡Disfruta aprendiendo!!!!!

Por favor, no olvide dar me gusta y suscribirse y nunca se pierda ninguna actualización de ” ANALYTICS MANTRA “.

Enlace: Mantra de análisis

Si bien Excel no puede manejar nada más de un millón de filas (e incluso entonces, dependiendo de la plataforma en la que se está ejecutando, las cosas comienzan a ponerse un poco inciertas), realmente depende de para qué quiere usarlo. Creo que algunas de las respuestas aquí están bastante abajo en Excel. Sin embargo, no estoy realmente en desacuerdo con las otras respuestas, Excel probablemente está un poco sobreutilizado en los círculos donde no está destinado a ser utilizado, pero en algunos círculos, está completamente infrautilizado y no se utiliza en ningún lugar cercano a su potencial máximo.

El análisis de datos es un tema bastante vago y amplio. ¿Puede Excel manejar clustering y machine learning? En realidad no, es un poco torpe para los cálculos repetitivos y no tiene la funcionalidad incorporada para manejar dicho análisis. Pero estas (entre toneladas de otras técnicas de análisis) no son el todo para el análisis. Si necesita un análisis rápido en un pequeño conjunto de datos, es muy fácil iniciar Excel para resumir lo que está sucediendo. Correlación simple? No hay problema. Regresión básica, agregación, ¡claro! Estoy empezando a incursionar en R (sin aprendizaje formal, así que no juzgues con demasiada dureza), pero la capacidad de crear un resumen simple en Excel a veces es todo lo que se necesita, y hacer esto en R parece difícil y complicado ( Estoy seguro de que hay una manera simple, simplemente no la he encontrado todavía, ¿tal vez un paquete específico?). También es muy fácil crear libros de trabajo que se conecten a bases de datos Access y SQL (sé que otros programas pueden hacer esto) y actualizar estos datos para crear un análisis actualizado.

Estoy de acuerdo en que Excel tal vez no sea la forma más rápida de hacer algunas de estas cosas, pero definitivamente es la más fácil de aprender. Y otra parte del beneficio de Excel es que muchas personas pueden entenderlo. Puedo ejecutar algunos números a través de Excel y enviar el libro de trabajo a un colega, sin que tengan que pasar por nada complejo de lo que quizás no se den cuenta y puedan entenderlo. Por supuesto, puede aumentar la complejidad de lo que está haciendo si lo necesita.

En definitiva, son las herramientas adecuadas para el trabajo correcto.

Cómo hacer análisis de datos con Excel. Explore los tutoriales en YouTube.

Somos un canal novato de YouTube, no olvides SUSCRIBIRTE.

Su apoyo nos motiva.

Tutoriales avanzados de Excel – YouTube

Infravalorado? Creo que podría tirar una piedra en cualquier área industrial y golpear a alguien que esté usando Excel para ‘análisis de datos’.

Uno puede ir a la universidad, obtener un título avanzado en Estadística y descubrir que no hay trabajos para el “análisis de datos”, acorde con ese logro académico, porque todos están usando Excel y alguien que “descubrió algo sobre estadísticas”.

Un poco ‘pre-excel’ … trabajé para una compañía donde todos los físicos usaron Lotus 1-2-3 para su ‘análisis de datos’ … en lugar de encender la computadora y escribir algún programa FORTRASH … Luego pasaron a la imagen análisis en 1-2-3 …

R tiene básicamente un gran conjunto de herramientas de procesamiento de estadísticas estándar, y un gran grupo de contribución de apoyo … y lo que es más … Es GRATUITO … y se ejecuta en Mac, Windows y Linux, así como varios derivados de Unix / BSD.

En otras palabras, la cobertura de R es mucho mayor en los círculos de análisis de datos / científicos que Excel.

Esto no es para menospreciar al autodidacta que ha adquirido algunas habilidades de análisis de datos a través de Excel … pero no debería detenerse allí.

No creo que esté infravalorado. Para las pequeñas empresas es una gran herramienta para el análisis de datos e incluso la inteligencia empresarial. Cuando se trata de grandes empresas, es mejor pensar en otro tablero como este
¿Hemos perdido el verdadero significado y propósito de Business Intelligence?

Depende de su industria y la cantidad de datos que tiene que analizar, será ineficiente, uso MATLAB en el trabajo porque estamos trabajando con miles de puntos de datos, así que supongo que puede decir que debe calcular la potencia de procesamiento de su sistema, luego cuántos datos tiene, entonces tendrá una mejor idea de qué herramienta usar.

Excel no es tan flexible como R, por ejemplo. Pero es lo suficientemente bueno para las tareas diarias.

Excel sigue siendo una herramienta excelente, pero para los datos masivos no es una herramienta perfecta, ¡hoy hay complementos para hacer el cálculo en una herramienta externa e importar el resultado!