Los datos estructurados consisten en campos con tipos de datos predefinidos, como en una hoja de cálculo o una base de datos. Por ejemplo, los campos pueden ser: Nombre, Edad, Sexo, Ocupación, etc. Las respuestas a una encuesta con opciones de opción múltiple también pueden estructurarse.
Los datos no estructurados son texto de forma libre, como las respuestas a las preguntas de la encuesta que le permiten escribir oraciones completas, o notas del médico, o tal vez tweets o publicaciones de blog. Creo que las imágenes, las grabaciones de sonido y los videos también pueden considerarse desestructurados.
La mayoría de los algoritmos tradicionales de aprendizaje automático funcionan con datos estructurados.
- ¿Qué recomendarías, Machine Learning o DevOps?
- ¿Cómo se siente la comunidad de aprendizaje automático sobre Kaggle?
- ¿Cuál es la diferencia entre un modelo paramétrico y un modelo no paramétrico?
- ¿Qué quieres decir con optimización?
- Cómo crear un algoritmo de clasificación eficiente y preciso tan rápido como pueda
Los datos no estructurados generalmente se procesan previamente para extraer información estructurada de ellos, antes de que los modelos tradicionales se puedan construir sobre ellos.