Gracias por el A2A.
¡Ciertamente puedes! Un enfoque sería configurarlo como un problema de autoencoder y aprender una buena representación de características para los datos. Luego puede usar las características de capa oculta en el ANN como entradas para el algoritmo K-means para aprender los grupos. La idea es que si su autoencoder había aprendido una representación de características útil, las entradas deberían ser fáciles de separar en grupos distintos. En este caso, el uso de una función de activación basada en ReLu debería ayudar a aprender representaciones dispersas para las entradas, lo que a su vez podría proporcionarle “mejores” grupos para sus datos.
Sin embargo, solo porque puedes hacer esto no significa que debas hacerlo. En muchas aplicaciones de clustering, es más apropiado seguir con algo como un modelo de mezcla gaussiana, a menos que tenga una muy buena razón para no hacerlo. Estos modelos tienden a proporcionar grupos que se ajustan mejor a los datos junto con estimaciones de probabilidad más precisas del ajuste. En lugar de usar un ANN para aprender los grupos, lo que la gente hace es usar un ANN para predecir a qué grupo pertenece un punto de datos. Esto es algo que se ha hecho con gran éxito en el reconocimiento de voz.
- ¿Python es más lento que MATLAB para la ciencia de datos y el aprendizaje automático?
- ¿Alguien ha encontrado un análisis matemáticamente riguroso de la unidad LSTM?
- ¿Qué tan rápido es Theano en comparación con otras implementaciones de DBN? ¿Cómo se compara con otras implementaciones de GPU (potencialmente no públicas) para la velocidad de entrenamiento en grandes conjuntos de datos?
- ¿Existe algún método de aprendizaje profundo aplicado a la economía?
- ¿Cuál es una buena definición de big data?