Las preguntas son el punto de partida de cualquier análisis: pequeño, grande o intermedio. Sin una pregunta que lo guíe, no encontrará nada significativo en sus datos.
Si está recopilando datos por el bien de los datos, entonces el proceso de adquisición es ciertamente interesante, pero no obtiene mucho de él. Muchas personas y empresas están interesadas en los grandes datos simplemente porque el atractivo de reunir la mayor cantidad posible, sin imponer necesariamente una estructura en los datos, es muy poderoso. Pero sostengo que la recopilación de datos por el bien de los datos, si bien es interesante, no conduce automáticamente a ideas útiles.
Y realmente, cuando se trata de eso, las ideas son por qué queremos todos esos datos. Hasta donde recuerdo, cuando estás haciendo algún tipo de ciencia, la pregunta guía el experimento, no al revés.
- ¿Qué son los espacios latentes en el aprendizaje de representación?
- ¿Por qué hay una compensación entre exploración y explotación en el aprendizaje por refuerzo?
- ¿Cuál es la diferencia entre perceptrón y maximización de expectativas?
- ¿Cuáles son las ventajas de la regresión logística?
- ¿NVIDIA GTX 1050 Ti 4GB es suficiente para Deep Learning?
Big data simplemente nos permite examinar las respuestas a nuestras preguntas a una escala que nunca hemos podido hacer en el pasado; pero incluso con big data hay límites. A medida que aumenta la potencia informática y los algoritmos se vuelven más sofisticados, ampliaremos esos límites.
Ponme firmemente en el campo “las preguntas son siempre el punto de partida”. Sus datos pueden generar más preguntas, pero responder a las preguntas es la parte divertida de todos modos.