¿Qué parte de la investigación de aprendizaje profundo es empírica versus teórica?

Deep Learning es una ciencia empírica. Incluso el trabajo teórico que se ha realizado para caracterizar el aprendizaje profundo se realiza (1) en arquitecturas de red homogéneas muy simplificadas y (2) se realiza mediante simulación en una computadora. Las matemáticas simplemente no están disponibles para manejar sistemas complejos como este. Los físicos han estado estudiando sistemas complejos durante mucho tiempo y, en el mejor de los casos, podemos caracterizar sistemas simplificados. La mayoría de los sistemas son intratables matemáticamente después de una dimensión mayor que 2. La ecuación de Navier-Stokes tridimensional es intratable matemáticamente. Hay muchos sistemas como este a medida que avanzamos en la dimensión de que el comportamiento colectivo se vuelve intratable. Las herramientas más sofisticadas para analizar sistemas colectivos complejos están en el dominio de la mecánica estadística. Desafortunadamente, se sabe que las herramientas en este campo tienen limitaciones en contextos de no equilibrio y desorden.

En el mejor de los casos, podemos encontrar algunas soluciones aproximadas para algunos sistemas simples y hacer muchas maniobras manuales para que el mismo tipo de características también esté presente en sistemas más complejos. Las matemáticas tienen sus límites en el análisis de dominios físicos. Cualquiera que haya hecho Física conoce ese tipo de saludo manual que realizamos para modificar la información de nuestros modelos simplificados. Esta limitación se amplifica aún más cuando hablamos de procesos evolutivos o procesos de aprendizaje aún más complejos.

Related Content

¿Cuáles son algunas trampas comunes al estudiar la clasificación en el aprendizaje automático?

¿Cuál es una buena secuencia de autoaprendizaje para el aprendizaje automático?

¿En qué orden debo aprender redes neuronales, aprendizaje automático, IA y NPL?

¿Es posible darle a una computadora millones de imágenes de varios objetos, y se da cuenta de que hay cosas como animales, platos de cocina, montañas, etc. sin que nosotros lo digamos, y cómo se hace esto exactamente?

¿Por qué se usan CNN para PNL?

¿Cómo podemos estimar múltiples parámetros de un clasificador?

¿Qué tan realista es hacer un trabajo independiente de TI mientras viaja por los EE. UU. En automóvil?

Parece haber algunas razones teóricas profundas por las cuales funciona el Aprendizaje Profundo que está conectado con algunas ideas muy sutiles y poderosas en Física Teórica

¿Por qué funciona el aprendizaje profundo?

Por qué Deep Learning Works II: el Grupo de Renormalización

Carlos E. Perez

More Interesting

¿Cuáles son los populares paquetes ML de adopción (Machine wise)?

¿Qué es una red neuronal bayesiana?

¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

Cómo optimizar una red neuronal convolucional para hacer una clasificación de imágenes

Como ingeniero de ML en Quora, ¿alguna vez ha implementado un artículo de investigación en aprendizaje automático para resolver un problema técnico o de producto?

¿Cuál es el punto de usar el problema dual cuando se ajusta SVM?

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

¿Cómo se pueden usar las redes neuronales recurrentes para predecir el género a partir de los nombres de pila?

¿Dónde puedo obtener más información sobre la persona en el MIT Media Lab que está trabajando para eliminar el sesgo en el aprendizaje automático?

¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?

¿Qué son las redes amplias?

¿Cuáles son las futuras áreas de investigación del aprendizaje automático y el reconocimiento de patrones para comenzar el doctorado y necesito algunas cosas buenas relacionadas con eso? como tesis doctorales y papel para estudiar?

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

¿Cómo debo comenzar con las redes neuronales recurrentes?

¿Cuál fue su peor interacción con una máquina?

Web Analytics