El análisis de estadísticas y datos necesita datos.
Todas las organizaciones recopilan sus datos en sus bases de datos.
- ¿Cuál es el equivalente R de los ** kwargs de Python?
- ¿Cómo puede ayudar el big data a construir una carrera financiera?
- ¿Cómo será utilizada la ciencia de datos por las empresas de realidad virtual y AR?
- ¿Dónde podemos postular a un empleo después de aprender ciencia de datos y big data?
- ¿Hay personas de Física y Química Computacional que realizan Ciencia de Datos en la industria?
por supuesto, algunos de los datos estarán allí en sobres y blocs de notas y en otros sistemas de almacenamiento, pero eso ya pasó.
SQL es un lenguaje estándar para consultar los datos.
Y las bases de datos están optimizadas para procesar un gran conjunto de datos.
Para su análisis estadístico o de datos, necesita hacer muchos datos de limpieza / munging, lo cual es muy costoso si lo hace en herramientas estadísticas como R o Python.
Prefiero que todas las operaciones de datos se realicen en bases de datos y el resultado final se almacene en una tabla y ese resultado se recupere en un software estadístico para realizar el análisis final.
Para estas operaciones intermitentes de limpieza y procesamiento de datos, SQL es muy necesario.