¿Se puede usar una máquina de Boltzmann profunda para la clasificación de imágenes en una base de datos que tiene solo mil imágenes y tiene características de imagen de valor real como unidades de entrada (en lugar de unidades de píxeles binarios)?

Creo que entrenar un DBM convolucional sería su mejor opción dada la falta de ejemplos de entrenamiento y la aplicación de visión artificial. Dado que las entradas de visión artificial tienden a tener una buena localización de las características en el espacio, las redes convolucionales se centrarán en subespacios locales más pequeños de la entrada, que se repiten regularmente en el espacio. Si se repiten pequeñas características en el espacio y sus muestras, esto esencialmente aumentará el tamaño de su muestra.

Aún así, todo depende de su aplicación. ¿Qué tan específicas son las características que está buscando? ¿Es el modelo generativo o discriminatorio (o ambos)? Un bajo número de muestras tiende a funcionar mejor con modelos generativos.

En cuanto a las entradas de valor real, busque unidades lineales restringidas, que son básicamente un grupo de unidades binarias que comparten los mismos pesos. Puede modelar una función más o menos lineal, que es lo que necesitará. Sin embargo, ten en cuenta que pueden ser un poco más difíciles de entrenar. Debe prestar más atención a sus hiperparámetros, ya que las tasas de aprendizaje que funcionan en RBM binarios pueden divergir un RBM con RLU.

Recomiendo los tutoriales de aprendizaje profundo en Deep Learning para obtener más información. Los laboratorios de Geoffrey Hinton y Yoshua Bengio también tienen excelentes documentos que tratan sobre todo tipo de RBM y DBM discrminativos. Personalmente, me familiarizaría con los RBM antes de pasar a los DBM, ya que será difícil entrenar a este último sin una buena comprensión de los fundamentos.

Aprendizaje automáticoAprendizaje profundoClasificación deImágenesProcesamiento de imágenesvisión artificial