Creo que debería leer mi respuesta: ¿Cuál es el significado de los derivados de datos en el contexto de big data?
Además, te daré un ejemplo. Tuve un problema similar mientras trabajaba en un conjunto de datos de Aerolíneas y tuve que predecir los retrasos de un vuelo en particular.
El conjunto de datos consta de varias etiquetas de datos que incluyen: hora de llegada, hora de salida, código del aeropuerto, distancia recorrida, clima, incluida la presión del aire, precipitación y temperatura, etc.
- ¿Tiene 36 años para emprender una carrera en ciencia de datos?
- ¿Hive se usa principalmente para tablas externas (por ejemplo, datos existentes en HDFS)?
- ¿Esperas que Apple Swift gane impulso en el dominio de aprendizaje automático?
- ¿Qué tipo de análisis puede hacer para bienes raíces?
- Cómo convertirse en ingeniero de aprendizaje automático si tengo experiencia en ciencia de datos / ingeniería no ML
Entonces, en este caso, si aplico directamente el algoritmo de aprendizaje automático en los datos, obtendré resultados vagos porque debería saber si eso puede ser bastante impredecible. Esto también se puede determinar mirando las diferentes columnas. Las columnas que producen los valores más variables deben ser rechazadas.
De esta manera, la inteligencia humana y el sentido común deben aplicarse. Los modelos Big Data en sí mismos no pueden predecir resultados precisos.