¿Está Microsoft Excel fuera de moda y menospreciado por los profesionales de la ciencia de datos?

Sí, es despreciado, a menudo por personas que no saben cómo usarlo muy bien. En mi opinión, Excel es bastante útil para explorar y conocer pequeños conjuntos de datos, y mucho más conveniente para ciertos tipos de tareas que las herramientas más modernas. Doy algunos ejemplos aquí en esta antigua respuesta:

La respuesta de Michael Hochster a ¿Hay tareas que R no pueda realizar tan rápido como Excel?

Excel tiene algunos inconvenientes importantes, de los que se queja en detalle en las respuestas a: ¿Qué es lo más frustrante de usar Microsoft Excel?

Los dos más grandes en mi opinión son:

  • Problemas con la importación incorrecta de datos (por ejemplo, fechas) que pasan desapercibidos y son difíciles de solucionar
  • En general, es muy fácil cometer errores en las fórmulas de la hoja de cálculo (por ejemplo, con una copia / pegado incorrecta) y es muy difícil encontrarlos y depurarlos.

Excel es terrible para la ciencia de datos, y recomendaría a cualquiera que lo use regularmente que cambie a otra cosa.

Digo esto como alguien a quien le encanta Excel y lo usó durante varios años, y se volvió muy bueno (por ejemplo, hasta el punto de escribir macros). El problema con Excel es que nada de lo que hace es reproducible: de forma predeterminada, Excel no registra ningún acciones, por lo que es difícil ejecutar un análisis de datos nuevos o investigar y depurar el análisis de otra persona.

Esto ha llevado a enormes errores, los países han establecido literalmente una política monetaria basada en problemas de Excel: Error de hoja de cálculo de Excel, ¡ja, ja! Lecciones de la controversia Reinhart-Rogoff

Si está utilizando Excel para otra cosa que no sea un análisis exploratorio puro, aprenda R o Python.

¿Está Microsoft Excel fuera de moda? No. ¿Es Microsoft Excel la mejor herramienta de análisis de datos? No. Definitivamente tiene su lugar en la caja de herramientas del científico o analista. Lo uso al mirar los datos antes de importarlos en R o Stata. Después de ejecutar tablas o modelos utilizando los paquetes estadísticos, a veces formateo las tablas de salida en Microsoft Excel de acuerdo con las necesidades de los clientes.

No creo que esté pasado de moda. Para las pequeñas empresas es una gran herramienta para el análisis de datos e incluso la inteligencia empresarial. Cuando se trata de grandes empresas, es mejor pensar en otro tablero como este
¿Hemos perdido el verdadero significado y propósito de Business Intelligence?
No solo tiene la mejor visualización de datos ad-hoc, sino también el mejor editor de paneles de estilo libre.

Tiene conectores para todas las bases de datos y además con HTTP get / post puedes conectar cualquier métrica de redes sociales

Todo está basado en un navegador, por lo que, a diferencia de otras herramientas, no es necesario comprar licencias de escritorio adicionales.

Algunas muestras

Excel no es realmente una herramienta de ciencia de datos.

Es una herramienta para las personas de finanzas y contabilidad, que a menudo se usa incorrectamente como herramienta de análisis de datos.

Y ni siquiera todas las personas de finanzas lo usan.

La mayoría de las personas de ciencia de datos con las que estoy familiarizado usan alguna combinación de R y Python o Stata, etc.

Aquí hay una discusión imparcial (sorprendentemente, dada la fuente) sobre el uso de Excel para la ciencia de datos: http: //datascience.stackexchange

La Sra. Excel siempre tendrá un lugar especial en mi corazón. Me encantó jugar con las líneas de regresión para diagramas de dispersión en Excel. Transformé x e y a escala logarítmica y vi cómo cambió la línea. Intenté ajustar ajustes lineales, exponenciales, de ley de potencia, log y polinomiales a cualquier dato que pudiera obtener en MS Excel. Cambiar el orden polinómico con solo un clic fue increíble. Observé ese valor mágico r ^ 2 con cada cambio que hice a los datos o al ajuste. Ese fue el comienzo de la ciencia de datos para mí.

Ahora rara vez uso Excel en el trabajo. Los datos van a la base de datos. El procesamiento de datos se realiza con R. Las interfaces para las aplicaciones basadas en datos se realizan con otros lenguajes de programación. Excel no es tan útil aquí.

No menosprecio a Excel, fue mi primer maestro en el mundo de los datos. Siempre que tengo la oportunidad de volcar algunos datos pequeños allí y jugar, todavía lo hago.

Fuera de moda – no.

Despreciado, sí.