La frase lo dice todo.
Intenta clasificar los datos en varias clases.
¿Qué clases puedes pedir?
- ¿Qué es la "ciencia" en ciencia de datos? ¿Se trata exclusivamente de la ciencia de monetizar grandes datos, o también hay un aspecto de no negocios?
- ¿Cuáles son las métricas que debo usar al analizar las redes sociales de una marca? ¿Cómo interpreto los resultados?
- ¿Cuáles son los temas candentes y / o importantes en la gestión de datos en la nube y en la investigación de la computación en la nube? Recientemente comencé mis estudios de doctorado y actualmente estoy buscando un problema en la computación en la nube.
- ¿Cómo se puede utilizar la ciencia de datos para reducir las tasas de criminalidad?
- ¿Cuáles son algunos proyectos de ciencia de datos de código abierto en Python?
Eso depende de ti y de los datos. Supongamos que tiene el conjunto de datos de una población. Para cada persona que se le da, digamos su altura , peso , temperatura corporal y el hecho de si están enfermos o no . Entonces tienes estos 4 detalles sobre una persona.
A partir del conjunto de datos que tiene, ha aprendido que cualquier persona que tenga una temperatura corporal superior o inferior al rango normal está enferma. Entonces, cuando una nueva persona que viene a ti y te dice su temperatura corporal, puedes clasificarla fácilmente como Enferma o No Enferma .
Con el tiempo, también puede aprender que algunas personas que tienen temperatura normal también están enfermas porque su IMC ( calculado usando Altura y Peso) está fuera de rango. Entonces, la próxima vez que ingrese una nueva persona con su altura, peso y temperatura, podrá clasificarlo con mayor precisión como enfermo o no enfermo .
Este es un ejemplo básico de lo que puede significar la clasificación de datos.
Del mismo modo, puede tener muchas características con respecto a una muestra y clasificarlas como algo basado en lo que esas características le dicen. Dado que será muy tedioso hacer esto para muchas características y ejemplos (es decir, un gran conjunto de datos), ahí es donde entran las máquinas y aprovechamos el concepto de Machine Learning.
Espero eso ayude.