¿Cuáles son las ventajas de ‘Big Data’ sobre las técnicas estándar?

Desde el punto de vista estadístico, algunos métodos simplemente no son posibles con grandes cantidades de datos. No puedo gestionar una clasificación jerárquica en el conjunto de datos en el que trabajo. Necesariamente tendré que usar un algoritmo más nuevo, a menudo etiquetado como “Big Data”. Pero a diferencia de @Andrew Hansen, esos nuevos algoritmos también pueden ser más interesantes que los anteriores.

EDITAR:

David Stokar hizo un comentario muy interesante: ¿por qué no probar y usar el método tradicional?

Esto es realmente lo que hago la mayor parte del tiempo. Por lo tanto, mi respuesta no fue inteligente y es necesario editarla.

Big Data aún no se ha definido. Por ahora, creo que está más relacionado con la forma en que se generan los datos: datos no estructurados, a menudo producidos como un subproducto de una actividad en lugar de un proceso de recopilación de estructuras. Por ejemplo: registros de sitios web, datos de sensores, datos de “Internet de las cosas”. Estos son más difíciles de evaluar con métodos tradicionales, ya que debe pensar en cómo recopilar, estructurar, usar y actualizar los datos.

David Stokar, ¡me alegraría escuchar tu punto de vista desarrollado sobre todo esto!

Lo único que viene a la mente es que las técnicas de Big Data funcionan en grandes cantidades de datos cuando los métodos tradicionales no lo hacen. Para mí, el requisito de usar la palabra Big Data es que su espacio problemático tiene tantos datos que los métodos tradicionales no funcionan de manera factible.

Había una vez un Oracle DB que amaba. Después de una enorme cantidad de trabajo pude estabilizarme a 280k escrituras de transacciones por segundo (tps). El problema era que mis picos actuales ocasionalmente superaban los 300k y seguían creciendo. Oracle ya no era factible a esa escala. Especialmente por el momento. Ni siquiera entrando en los aspectos de HA / DR.

Por un precio mucho más bajo y con mucha menos energía, pude usar una solución de Big Data para administrar solo las escrituras y soportar fácilmente> 600k tps de escrituras. Tengo HA / DR gratis. Todavía utilicé una implementación de Oracle del tamaño correcto para responder mis preguntas estratégicas, pero tenía un precio muy diferente.

No tengo ninguna razón para usar herramientas de Big Data en pequeñas cantidades de datos. Hay algunas excepciones como DynamoDB de AWS. Una aplicación pequeña con un bajo tps puede querer usar dynamoDB como una conveniencia o preferencia de operación. Esto no es tanto una ventaja como una elección.

More Interesting

¿Cómo impactan los informes de Big Data y Analytics en la productividad de una empresa?

¿Qué tipo de pruebas ejecuta para validar la calidad de sus datos?

¿Cómo debe medirse el rendimiento de un equipo de ciencia de datos como una unidad? Por ejemplo, si lideraba el equipo de ciencia de datos de LinkedIn, ¿cómo debería evaluar mi desempeño el CEO?

¿Cuáles son algunos pasatiempos que a los científicos de datos les gustan?

¿Algunos físicos usan Excel para el análisis de datos?

¿Cuál es el futuro de la ciencia de datos en los próximos años? ¿Cómo es el mercado laboral en ciencia de datos para los graduados de nivel de entrada? ¿Es fácil de aprender, o necesitamos hacer más y más trabajo duro para conseguir un trabajo de nivel de entrada?

¿Cuál es su definición personal para big data?

¿Cuál es el futuro de Big Data e IOT para tomarlo como una carrera futura después de algunos años de experiencia en la industria india de TI?

¿Cómo es una entrevista de científico de datos en Yelp?

¿Cuál es la diferencia entre la tabla de clasificación pública y privada en Kaggle?

¿Qué tan relevante es el análisis de Big Data para la economía global actual?

¿Cuáles son los mejores cursos de ciencia de datos en Mumbai con un instructor fuera de línea?

¿Cuáles son los requisitos previos para una maestría en ciencia de datos?

¿Qué nivel de preguntas de codificación del algoritmo Python le pedirían para una entrevista de ciencia de datos (nivel interno)?

¿Qué tan difícil es para un chico experimentado de 5 años cambiar a la carrera de ciencia de datos en India?