¿Qué son los datos estructurados en el contexto del aprendizaje automático?

Los datos estructurados consisten en campos con tipos de datos predefinidos, como en una hoja de cálculo o una base de datos. Por ejemplo, los campos pueden ser: Nombre, Edad, Sexo, Ocupación, etc. Las respuestas a una encuesta con opciones de opción múltiple también pueden estructurarse.

Los datos no estructurados son texto de forma libre, como las respuestas a las preguntas de la encuesta que le permiten escribir oraciones completas, o notas del médico, o tal vez tweets o publicaciones de blog. Creo que las imágenes, las grabaciones de sonido y los videos también pueden considerarse desestructurados.

La mayoría de los algoritmos tradicionales de aprendizaje automático funcionan con datos estructurados.

Los datos no estructurados generalmente se procesan previamente para extraer información estructurada de ellos, antes de que los modelos tradicionales se puedan construir sobre ellos.

Su pregunta es un poco vaga … pero de lo que puedo inferir: los datos estructurados son datos que tienen ejemplos de patrones o provienen de alguna distribución conocida.