¿Qué uso como formato de base de datos \ archivo para la canalización de datos de ciencia de datos?

Para el procesamiento que he realizado, generalmente tuve otras preocupaciones:

  • Serialización, procesamiento en tiempo real
  • Corrección / detección de errores
  • Tolerancia a fallos
  • Requisitos de anotación

El idioma, la API, la facilidad de uso no son, por lo general, consideraciones serias, y todas las que se enumeran no deberían darle problemas en ninguna plataforma razonable. Las soluciones rápidas deberían estar comúnmente disponibles en bibliotecas abiertas, o fácilmente escritas para casos simples.

Preguntas: ¿cuáles son los requisitos de retraso en tiempo real o reacción? ¿Cómo se accede al índice de datos? Formato fijo o datos estructurados, o los datos están anotados con eventos? estructurado como XML o JSON, por ejemplo, o ¿hay borrones o referencias que incluyen tipos de datos no canónicos? Hay muchos requisitos que pueden impulsar su elección.

More Interesting

¿Puedo usar el agrupamiento (técnicas de minería de datos) para la detección de cuentas falsas en las redes sociales?

¿Cuál es el mejor instituto en Mumbai para hacer ciencia de datos y certificación de big data?

¿Qué tan básicos son los datos en Uber?

¿Cuáles son las mejores universidades de minería en Estados Unidos?

Cómo aprender y probar la tecnología de big data utilizando GitHub

¿Cuál es su título preferido para las personas que desarrollan información del producto con datos: científico de datos o analista?

Estoy interesado en el aseguramiento de la calidad del software. Necesito entrar en el análisis de big data. ¿Cuáles son los cursos y certificaciones que necesito tomar?

¿Cuál es el escenario actual / las perspectivas futuras de la ciencia de datos en la India en comparación con Silicon Valley?

¿Cuál es el mejor instituto para aprender el programa del aula del curso de análisis de big data en Bangalore?

¿Cuán estrechamente está relacionada la analítica de big data con el aprendizaje automático?

¿Es útil la programación competitiva para aprender ciencia de datos, o es solo una pérdida de tiempo?

¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?

¿Es la ciencia de datos un tema extremadamente aburrido?

¿Entrar en Big Data es una buena opción ahora?

¿Cuál debería ser el contenido del curso 'Introducción al aprendizaje automático' para estudiantes de 6to semestre de CS sin conocimiento previo de ciencias de datos?