1. Capacidad para manejar al menos 2 millones de columnas y 20 millones de filas. Más sería mejor, pero 2M / 20M sería una gran mejora y permitiría a Excel ser una buena herramienta para limpiar conjuntos de datos razonablemente grandes.
2. Cumplimiento con los estándares de doble precisión IEEE. Por ejemplo, Excel no sale al dígito especificado después del punto decimal, y se redondea en lugar de truncarse como lo especifica el estándar. Este comportamiento no parece estar documentado en ningún lado y es muy difícil de diagnosticar.
3. Arregle el error que trunca la forma en que se ven los números después de un cierto número de puntos decimales, y no mostrará la precisión completa incluso cuando la columna se amplíe manualmente (es difícil calcular cuándo ocurrirá esto y cuándo ganó ” t). Excel todavía usa la precisión completa del número en las fórmulas, pero bajo ciertas circunstancias desconocidas, Excel se trunca al formato visto al guardar el formato de Excel en CSV.
- ¿Qué son la función de descenso de gradiente y costo en la regresión logística?
- ¿Cómo hace su empresa para que sus herramientas de 'big data' sean fáciles de usar?
- ¿Cuál es la diferencia entre la minería de datos y el desguace web?
- ¿Qué herramientas usan los periodistas de datos para crear visualizaciones de datos? ¿Qué características les gustan más?
- ¿La ciencia de datos necesita estadísticas?
4. Una superposición de color opcional que resalta anomalías como celdas faltantes, espacios o datos de texto en celdas que deberían ser numéricas, etc.