¿Qué es lo importante de un algoritmo de aprendizaje profundo exitoso?

Hay un par de cosas que mencionaste que son ciertas:

Funciona solo en grandes conjuntos de datos. Si tiene un conjunto de datos pequeño, adáptelo con un conjunto de datos similarmente grande y vuelva a entrenarlo en el conjunto de datos especificado para obtener la salida correcta.

Funciona increíblemente bien en el reconocimiento de patrones. (Se ha realizado un trabajo inmenso en el reconocimiento de dígitos escritos a mano. Microsoft está trabajando en el Proyecto Adam Microsoft desafía el Cerebro Artificial de Google con ‘Proyecto Adam’ | WIRED, que es para el reconocimiento de imágenes. Todavía se desconoce por qué funciona solo en el reconocimiento de patrones. menos para mí).

Agregaré algo más para mostrar, lo que es importante sobre la arquitectura de aprendizaje profundo (Red neuronal convolucional- CNN):

Lo mejor de CNN es que no hay necesidad de extracción de características . El sistema aprende a realizar la extracción de características, lo cual es una gran esperanza teniendo en cuenta que puede ser completamente automatizado. El concepto central de CNN es que utiliza una convolución de imagen y filtros para generar características invariables que se pasan a la siguiente capa. Las características en la siguiente capa están enrevesadas con diferentes filtros para generar características más invariantes y abstractas y el proceso continúa hasta que obtenemos la característica / salida final (digamos la cara de X) que es invariante para las oclusiones.
Podemos descubrir qué está implementando cada capa (como la capa inferior haciendo detección de bordes, la siguiente capa haciendo reconocimiento de textura, etc.) a diferencia de la red neuronal artificial cuyas capas no significaban nada más que una entidad computacional. A medida que cada capa realiza un cálculo más abstracto y humano, la red se puede reutilizar . (Esta es ciertamente mi idea, no hay fuentes al respecto).
Como estoy en la fase de ” estudiar literatura “, no puedo darte una diferencia más detallada. Empezaré a trabajar en él muy pronto y volveré a tu pregunta.
Fuentes:

Redes de convección: una perspectiva modular
Página en codeproject.com
Aprendizaje profundo

Aprendizaje automáticoAprendizaje profundoinformáticaInteligencia ArtificialRedes neuronales artificiales

¿Cómo pueden los ingenieros industriales ser parte de la próxima revolución industrial, es decir, la inteligencia artificial?

Cómo programar un robot que pueda entender su entorno

Cómo planificar una trayectoria en robots teniendo en cuenta múltiples restricciones como tirón, aceleración, velocidad

¿Cómo funciona la hipótesis para una red neuronal simple (MLP con activación logística, salida única) en forma simplificada?

Si tuviera un sistema de IA de próxima generación hoy, ¿cómo lo usaría para ganar dinero?

Como médico que programa y participa en la investigación tecnológica, ¿cómo puedo comenzar a aprender sobre aprendizaje automático / aprendizaje profundo?

No existe un “mejor” algoritmo de aprendizaje automático. Las redes profundas son muy efectivas en la clasificación de imágenes y algunos otros problemas. Los bosques aleatorios son efectivos en muchos otros problemas de clasificación. La regresión logística es probablemente el algoritmo de aprendizaje automático más utilizado en la industria, debido a su robustez y escalabilidad. Y hay problemas en los que Bayes ingenuo funciona mejor, especialmente con pequeñas cantidades de datos.

Para ser efectivo, un algoritmo de aprendizaje automático debe generalizarse a partir de los ejemplos que se dan. La mejor manera de generalizar puede variar según el problema.

Las redes convolucionales profundas son muy flexibles y tienen algunos buenos trucos que funcionan bien en los datos de imágenes. En particular, las capas convolucionales explotan el hecho de que un patrón interesante puede ocurrir en cualquier región de la imagen, y las regiones son bloques contiguos de píxeles. Pero una de las razones por las cuales las personas están realmente entusiasmadas con el aprendizaje profundo es la posibilidad de que el modelo aprenda características útiles de los datos sin procesar. Hacer que el aprendizaje automático funcione normalmente requiere pasar mucho tiempo traduciendo los datos en bruto en un conjunto de buenas características. El aprendizaje profundo parece encontrar mejores características automáticamente, aprendiendo efectivamente representaciones interesantes en diferentes niveles de granularidad. La desventaja es que estos métodos requieren una gran cantidad de datos y muchos recursos computacionales para entrenar.

Daniel Lowd

no se trata solo del algoritmo. La arquitectura que modela el modelo de aprendizaje es inmensamente importante. Pero tan pocas personas entienden que la naturaleza de la máquina modelada es tan importante como los procesos de datos. Y, sin embargo, la teoría detrás de esto es tristemente muy débil.

Nikhil Badugu

More Interesting

¿Cómo es trabajar en Watson Analytics de IBM?

¿Los modelos no paramétricos bayesianos funcionan bien en la práctica?

¿Estamos cerca de construir potencialmente una IA malvada?

¿Alguien ha asistido a MIRI http://intelligence.org/ taller o pasantía?

¿La IA reemplazará al músico?

¿Qué tipo de antecedentes matemáticos son beneficiosos para alguien que comienza a programar en IA?

¿Podrán las computadoras componer música y escribir poemas que podamos apreciar? ¿Es la inteligencia humana tan superior que no se puede crear?

¿Se automatizará el desarrollo web de backend?

¿Por qué los científicos tienen debates teóricos sobre la inteligencia artificial que se apodera del mundo cuando existen problemas reales como disturbios políticos y sociales en este momento?

¿Cuáles son los algoritmos de inteligencia artificial (IA) que todo estudiante de informática debe conocer?