¿Cuáles son los componentes de software comunes de un kit de herramientas de almacenamiento de datos?

Un sistema de almacenamiento de datos de sopas a nueces incluye un componente ETL, el propio almacén e interfaces para interactuar con los datos en el almacén.

Comenzando con ETL: Existen muchos otros productos como Datastage (componente ETL de IBM), por ejemplo, Talend, Pentaho e Informatica. El componente ETL es responsable de extraer los datos de los sistemas donde vive, masajeándolos para limpiarlos, normalizarlos y prepararlos para el análisis, y finalmente cargarlos en el almacén. Si desea construir el componente ETL usted mismo, necesitaría sondear todas las fuentes de datos relevantes, identificar datos nuevos o modificados, realizar el procesamiento posterior y cargar esos datos en el almacén. La parte difícil es resolver todos estos problemas para grandes conjuntos de datos que están cambiando rápidamente y requieren un procesamiento posterior complicado.

El almacén en sí es típicamente un RDBMS que admite SQL. Cada vez más, las plataformas de bases de datos diseñadas específicamente para análisis, como Redshift o Vertica, se están volviendo de uso común.

Las opciones de interfaz vienen en una amplia variedad, y la mayoría se ubicará sobre cualquier base de datos que interactúe con ODBC o JDBC. Los ejemplos incluyen Tableau, Looker y R. Tampoco es raro complementar esas herramientas con informes personalizados que extraen datos directamente del almacén.

Armar todo este sistema de almacenamiento de datos puede ser costoso y llevar mucho tiempo, y hay muchas razones por las cuales los proyectos de almacenamiento de datos fallan . En RJMetrics , creamos y mantenemos cada parte del sistema de almacenamiento de datos para usted. Gestionamos la canalización de ETL, personalizada para sus fuentes de datos y sus reglas comerciales, y almacenamos los datos en un almacén masivo impulsado por Amazon RedShift. Podemos tomar cualquier información de cualquier fuente, y podemos cambiar fácilmente cualquier aspecto de su almacén con unos pocos clics. Nuestra interfaz fácil de usar le permite usar sus datos para obtener rápidamente la información que necesita para hacer crecer su negocio.

More Interesting

¿Vale la pena cambiar de carrera de ciencia de datos a actuario?

¿Cuál es el mejor hardware de computadora para juegos y análisis de datos?

¿Cuál es el alcance del análisis de big data?

He realizado mi pasantía en una empresa B2B y he realizado algunos análisis de datos como el porcentaje de daños, el retorno al origen y algunos otros. ¿Qué más puedo hacer con estos datos?

¿Cómo hacer un SOP para MS en Data Science? ¿Dónde encuentro una muestra para ello?

En un análisis de datos que ha realizado, ¿qué técnicas funcionaron y cuáles no?

¿Cómo va a medir la similitud de dos voces utilizando la ciencia de datos?

¿Habilidades para el autoaprendizaje de la ciencia / análisis de datos o las estadísticas de EM?

¿Hadoop está saliendo? ¿Se avecina una tecnología que pueda reemplazar toda la forma en que MapReduce consulta en un grupo de máquinas? ¿No puede simplemente automatizar la forma en que ejecuta estas consultas? ¿Es esto lo que Blaze está tratando de lograr?

¿En qué organización es mejor trabajar para un puesto de pasantía en ciencia de datos, Analytics Vidhya o Sigmaway?

En el aprendizaje automático, si no sé mucho sobre la corrección de lo anterior, ¿puedo tratar de corregir el modelo a través de grandes cantidades de datos de entrenamiento?

¿Cuál es el estado actual de Julia, el lenguaje de programación?

¿Cuál es la diferencia entre las notaciones big oh, big omega y big theta?

¿Cuál es la diferencia entre un título en Business Analytics y un título en Data Science?

Quiero tener una carrera en análisis de datos, sin embargo, no tengo habilidades de codificación informática. ¿Puedo sobrevivir con Microsoft Excel, Tableau y conocimiento estadístico?