¿Se puede usar una máquina de Boltzmann profunda para la clasificación de imágenes en una base de datos que tiene solo mil imágenes y tiene características de imagen de valor real como unidades de entrada (en lugar de unidades de píxeles binarios)?

Creo que entrenar un DBM convolucional sería su mejor opción dada la falta de ejemplos de entrenamiento y la aplicación de visión artificial. Dado que las entradas de visión artificial tienden a tener una buena localización de las características en el espacio, las redes convolucionales se centrarán en subespacios locales más pequeños de la entrada, que se repiten regularmente en el espacio. Si se repiten pequeñas características en el espacio y sus muestras, esto esencialmente aumentará el tamaño de su muestra.

Aún así, todo depende de su aplicación. ¿Qué tan específicas son las características que está buscando? ¿Es el modelo generativo o discriminatorio (o ambos)? Un bajo número de muestras tiende a funcionar mejor con modelos generativos.

En cuanto a las entradas de valor real, busque unidades lineales restringidas, que son básicamente un grupo de unidades binarias que comparten los mismos pesos. Puede modelar una función más o menos lineal, que es lo que necesitará. Sin embargo, ten en cuenta que pueden ser un poco más difíciles de entrenar. Debe prestar más atención a sus hiperparámetros, ya que las tasas de aprendizaje que funcionan en RBM binarios pueden divergir un RBM con RLU.

Recomiendo los tutoriales de aprendizaje profundo en Deep Learning para obtener más información. Los laboratorios de Geoffrey Hinton y Yoshua Bengio también tienen excelentes documentos que tratan sobre todo tipo de RBM y DBM discrminativos. Personalmente, me familiarizaría con los RBM antes de pasar a los DBM, ya que será difícil entrenar a este último sin una buena comprensión de los fundamentos.

More Interesting

¿Cuál es la mejor manera de distribuir una aplicación de iOS para un proyecto de investigación?

Soy Editor de Adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?

Estamos viendo el comienzo de las máquinas que pueden codificar. ¿Aprender un lenguaje de programación aún sería útil en la carrera de ML?

¿Cuál es la diferencia entre alineación y deformación en visión artificial?

¿Cómo se puede utilizar el aprendizaje automático para la transcriptómica?

¿Me podría recomendar un curso abierto de aprendizaje automático?

¿Cuál es el algoritmo de búsqueda de patrones (o reconocimiento de patrones) más avanzado? ¿Como funciona?

¿Cuál es mejor? ¿AI o machine learning nanodegree por Udacity?

¿Qué tema es adecuado para un taller de aprendizaje automático para estudiantes de secundaria típicos?

Proyectos para el procesamiento del lenguaje natural y herramientas de lenguaje para un lenguaje índico

¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?

¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?

Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?

¿Cuáles son las mejores marcas de CPU y GPU para el aprendizaje automático?

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?