Depende de tu objetivo.
Como mencionó George, las técnicas de aprendizaje automático no supervisadas básicamente agrupan datos en un espacio n-dimensional. Bastante trippy, y no totalmente intuitivo. Básicamente, debe regresar y mirar sus grupos y considerar lo que le dicen los datos: ¿Cuál es la observación ‘promedio’ en cada grupo? ¿Cuáles son las dimensiones más significativas? ¿Qué te dice esto sobre tus datos?
Probablemente porque soy economista y consultor estratégico en capacitación, generalmente empiezo simplemente volcando mis datos en Excel y ejecutando un montón de tablas dinámicas y gráficos básicos de líneas / barras / dispersión de cortes interesantes. Si los datos son realmente grandes, entonces podría tomar un subconjunto de datos para graficar. Esto puede construir algunas intuiciones sobre lo que realmente está mirando y ayudar a guiar las técnicas de ML más intensas como la agrupación o lo que sea.
- ¿Cuáles son los mejores usos de Deep Learning para la clasificación de relevancia de búsqueda?
- ¿Qué tan perspicaz es el artículo de arXiV: [1504.00641] Una teoría probabilística del aprendizaje profundo? ¿Extiende nuestra comprensión del aprendizaje profundo y presenta un marco unificador?
- ¿Cuáles son los tipos de máquina?
- ¿Cómo calcularía el ROI del uso de Big Data y el aprendizaje automático en los productos de la compañía?
- ¿Hay algunos trabajos relacionados con el aprendizaje por refuerzo?