¿Qué es lo importante de un algoritmo de aprendizaje profundo exitoso?

Hay un par de cosas que mencionaste que son ciertas:

  • Funciona solo en grandes conjuntos de datos. Si tiene un conjunto de datos pequeño, adáptelo con un conjunto de datos similarmente grande y vuelva a entrenarlo en el conjunto de datos especificado para obtener la salida correcta.
  • Funciona increíblemente bien en el reconocimiento de patrones. (Se ha realizado un trabajo inmenso en el reconocimiento de dígitos escritos a mano. Microsoft está trabajando en el Proyecto Adam Microsoft desafía el Cerebro Artificial de Google con ‘Proyecto Adam’ | WIRED, que es para el reconocimiento de imágenes. Todavía se desconoce por qué funciona solo en el reconocimiento de patrones. menos para mí).

Agregaré algo más para mostrar, lo que es importante sobre la arquitectura de aprendizaje profundo (Red neuronal convolucional- CNN):

No existe un “mejor” algoritmo de aprendizaje automático. Las redes profundas son muy efectivas en la clasificación de imágenes y algunos otros problemas. Los bosques aleatorios son efectivos en muchos otros problemas de clasificación. La regresión logística es probablemente el algoritmo de aprendizaje automático más utilizado en la industria, debido a su robustez y escalabilidad. Y hay problemas en los que Bayes ingenuo funciona mejor, especialmente con pequeñas cantidades de datos.

Para ser efectivo, un algoritmo de aprendizaje automático debe generalizarse a partir de los ejemplos que se dan. La mejor manera de generalizar puede variar según el problema.

Las redes convolucionales profundas son muy flexibles y tienen algunos buenos trucos que funcionan bien en los datos de imágenes. En particular, las capas convolucionales explotan el hecho de que un patrón interesante puede ocurrir en cualquier región de la imagen, y las regiones son bloques contiguos de píxeles. Pero una de las razones por las cuales las personas están realmente entusiasmadas con el aprendizaje profundo es la posibilidad de que el modelo aprenda características útiles de los datos sin procesar. Hacer que el aprendizaje automático funcione normalmente requiere pasar mucho tiempo traduciendo los datos en bruto en un conjunto de buenas características. El aprendizaje profundo parece encontrar mejores características automáticamente, aprendiendo efectivamente representaciones interesantes en diferentes niveles de granularidad. La desventaja es que estos métodos requieren una gran cantidad de datos y muchos recursos computacionales para entrenar.

no se trata solo del algoritmo. La arquitectura que modela el modelo de aprendizaje es inmensamente importante. Pero tan pocas personas entienden que la naturaleza de la máquina modelada es tan importante como los procesos de datos. Y, sin embargo, la teoría detrás de esto es tristemente muy débil.