No. Cada pregunta requiere solo una cantidad “suficiente” de datos para responderla. Más allá de eso, la respuesta es la misma, sin importar la cantidad de datos que agregue. Además, agregar demasiados datos puede ser una responsabilidad.
Un ejemplo. Desea saber la altura de su césped. Entonces, usted toma muestras del césped, midiendo la altura de 1000 briznas de hierba de todo su patio. ¿Cambiará apreciablemente este valor si prueba un millón de cuchillas? Mil millones? No. En el mejor de los casos, su métrica será más precisa. ¿Derecho? Bueno no. Ni siquiera entonces.
De hecho, para cuando haya medido mil millones de briznas de hierba, la hierba habrá crecido y sus mediciones anteriores serán incorrectas, incomparables con sus mediciones nuevas. Lo mismo puede decirse de medir el césped en condiciones cambiantes: antes o después de una tormenta, en un día soleado o sombrío, en sequía o no, en verano o invierno, o según lo medido por una persona o por otra persona. En la práctica, hay tantos factores que pueden afectar la medición de objetos del mundo real que agregar más datos a un análisis a menudo empeora los resultados.
- ¿Cuál es la diferencia entre análisis de datos, ingeniería de datos y científicos de datos?
- ¿Cómo se aplican los grandes datos al comercio minorista?
- ¿Cuál es la diferencia entre el científico de datos y el científico de investigación en Google?
- ¿Cuál es la mejor manera de probar los motores de recomendación en los datos históricos del usuario?
- ¿Es la estadística aplicada una buena especialidad para la ciencia de datos?