Sugiero que “ver y seleccionar” significa la capacidad de realizar consultas ad-hoc a los datos CSV. En la mayoría de los casos, la forma más sencilla de lograr eso es importar archivos CSV a la base de datos SQL:
- para archivos CSV pequeños y medianos (digamos, hasta varios Gb en común) puede usar SQLite DB y sqlite3.exe (Command Line Shell For SQLite) para importar CSV (comando .import)
- para archivos CSV grandes puede usar MySQL (cargar datos con
Comando LOAD DATA INFILE) u otro DB popular: la mayoría de ellos admiten la carga rápida de datos desde archivos CSV / TSV - para archivos CSV enormes (cientos de Gb en común), recomiendo usar un almacén de datos basado en la nube como Amazon Redshift
Tenga en cuenta que si la razón principal para ver y seleccionar es la agregación de datos CSV, puede usar herramientas especializadas como:
- La utilidad de línea de comandos PivotData puede cargar datos directamente desde un archivo CSV, realizar agregaciones en memoria, filtrar datos, producir resultados en CSV o bonitas tablas dinámicas HTML
- seektable.com es una herramienta gratuita de BI web donde puede cargar archivos CSV y realizar análisis ad-hoc con tablas dinámicas
- ¿Cómo ingresa un estudiante de física en el campo de la ciencia de datos?
- La base de los grandes datos es que se está rastreando toda su actividad en Internet. ¿No es eso un poco aterrador?
- ¿Cómo son las estadísticas generadas por los canales en los partidos de la Copa Mundial de la CCI que dicen: "India ha ganado todos sus partidos si batean primero y suman más de 270 +" / "India ha ganado todos sus partidos donde Kohli anotó> 100"?
- ¿Existen aplicaciones para el aprendizaje automático / ciencia de datos en el campo de los vuelos espaciales?
- En este mundo de análisis de datos de autoservicio, ¿cuál es el papel del profesional de datos de TI?