¿Son las preguntas el verdadero punto de partida del análisis de Big Data?

Las preguntas son el punto de partida de cualquier análisis: pequeño, grande o intermedio. Sin una pregunta que lo guíe, no encontrará nada significativo en sus datos.

Si está recopilando datos por el bien de los datos, entonces el proceso de adquisición es ciertamente interesante, pero no obtiene mucho de él. Muchas personas y empresas están interesadas en los grandes datos simplemente porque el atractivo de reunir la mayor cantidad posible, sin imponer necesariamente una estructura en los datos, es muy poderoso. Pero sostengo que la recopilación de datos por el bien de los datos, si bien es interesante, no conduce automáticamente a ideas útiles.

Y realmente, cuando se trata de eso, las ideas son por qué queremos todos esos datos. Hasta donde recuerdo, cuando estás haciendo algún tipo de ciencia, la pregunta guía el experimento, no al revés.

Big data simplemente nos permite examinar las respuestas a nuestras preguntas a una escala que nunca hemos podido hacer en el pasado; pero incluso con big data hay límites. A medida que aumenta la potencia informática y los algoritmos se vuelven más sofisticados, ampliaremos esos límites.

Ponme firmemente en el campo “las preguntas son siempre el punto de partida”. Sus datos pueden generar más preguntas, pero responder a las preguntas es la parte divertida de todos modos.

More Interesting

¿Cuál es un buen caso de uso práctico para el modelado de temas y LDA?

¿Cuáles son las aplicaciones más interesantes del aprendizaje automático en espacios inesperados?

Cómo probar un conjunto de datos no se puede clasificar

¿Cuáles son todas las diferencias entre el aprendizaje en línea y el aprendizaje fuera de línea con backpropagation?

¿Cómo debo aprender el aprendizaje automático? ¿Puede proporcionar una hoja de ruta específica desde un principiante hasta un experto?

¿La normalización de lotes hará la diferencia al entrenar con tamaño de lote = 1?

Andrew Ng: ¿Qué opinas sobre la memoria?

Cómo explicar claramente el aprendizaje profundo a alguien con antecedentes matemáticos limitados

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Existe una conexión entre la ciencia de datos y el aprendizaje automático?

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

¿Es una red neuronal completamente conectada igual a una red neuronal de retroalimentación?

Si pudiera construir una plataforma de contenido (piense en la entrega de noticias) desde cero con el objetivo de escalar a millones de usuarios, ¿qué infraestructura utilizaría?

¿Qué es la mente profunda de Google?

¿Por qué el aprendizaje por refuerzo no era popular antes de que el aprendizaje profundo apareciera en escena?