Aprendizaje profundo: ¿Qué técnica de preprocesamiento es necesaria para los parches de imágenes para obtener características relevantes?

Blanquear sus datos siempre es una buena idea. Más allá de eso, sin embargo, es probable que el problema radique en la configuración de parámetros que ha elegido para su autoencoder.

Esta es una crítica común de los algoritmos de aprendizaje profundo existentes: dependen de la configuración de varios parámetros de aprendizaje de formas complejas y no lineales. Seleccionar buenos parámetros es crítico para el rendimiento del algoritmo de aprendizaje, pero es en gran medida un arte negro.

Su mejor opción es elegir un montón de configuraciones para cada parámetro y hacer una búsqueda en la cuadrícula. (Es decir, entrene un modelo para cada combinación de configuraciones). Otro enfoque común es muestrear al azar en ese espacio de parámetros en lugar de entrenar en toda la cuadrícula.

Comenzaría con la escasez y luego comenzaría a jugar con todos los demás parámetros.

Related Content

¿Cuál es la diferencia entre los datos de entrenamiento y los datos de prueba?

¿Cuáles son las mejores conferencias sobre aprendizaje automático para el procesamiento de imágenes médicas en 2016?

¿Qué es un proceso gaussiano?

¿Cuánto del aprendizaje automático es en realidad solo optimización?

¿Cuáles son los algoritmos utilizados en los sistemas de preguntas y respuestas en PNL?

¿Cuál es la diferencia entre redes neuronales y de creencias?

¿Cuál sería un enfoque razonable para optimizar los ingresos publicitarios del sitio web utilizando datos de GA y aprendizaje automático?

Tal vez ya haya visto esto: Ejercicio: Autoencoder disperso
Lo curioso es que muchos de estos filtros que muestra aquí tienen pequeñas regiones rectangulares que tienen una estructura perceptible. ¿Podría describir los parámetros, los pesos iniciales, la tasa de aprendizaje y la cantidad de datos de entrenamiento que está utilizando?

Aniket Singh

More Interesting

¿Cuáles son algunos buenos ejemplos donde el agrupamiento se usa como método para la extracción de características?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

¿Cómo calcula Gensim.Word2vec la probabilidad de texto usando una puntuación de modelo?

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.

Las entidades biológicas inconscientes que simplemente reaccionan automáticamente a su entorno han evolucionado y se han vuelto autoconscientes. ¿Qué impide que AI lo haga?

¿El libro "Aprendizaje automático: una perspectiva algorítmica" aborda la implementación en profundidad?

¿Qué cursos deben tomar los antecedentes de EE para el aprendizaje profundo?

¿Es cierto que una vez que tenemos grandes conjuntos de datos, la selección del clasificador ML no tiene mucho efecto? ¿Qué significa 'grande' aquí?

¿Cuáles son algunos de los desafíos y oportunidades sobresalientes en el análisis predictivo con respecto a la privacidad y la propiedad de los datos, el análisis de los datos del usuario, el escalado de algoritmos y los ecosistemas e intercambios de datos emergentes?

¿Cuáles son las ventajas de la distancia euclidiana y la distancia coseno, respectivamente?

¿Se puede utilizar el aprendizaje automático para mejorar la situación de los agricultores en los países en desarrollo? En caso afirmativo, ¿cuál sería su enfoque?

¿Cuál es el análisis de opinión en el caso de TripAdvisor? ¿Como funciona?

La temperatura de la GPU lee 88 C cuando se entrena un LSTM en TensorFlow. ¿Es esto normal (y seguro)?

¿Puedo usar videos de YouTube para hacer aprendizaje automático comercial?

¿Por qué el aprendizaje en estructuras de datos complejas (gráficos, árboles, etc.) está tan poco representado en el aprendizaje automático?

Web Analytics