¿Hay grupos de investigación trabajando en aprendizaje profundo teórico?

Creo que sí … Las redes profundas son funciones no convexas y, por lo tanto, no hay una respuesta única a través de la propagación inversa. Mucho depende de los valores iniciales que use para sembrar la red … Odio esta idea … Pero parece que eso es lo que es actualmente … Todo depende de cómo se inicialice. Loca. Lo odias, apuesto.

Algunas personas consideran el algoritmo genético en lugar de BackProp, que estoy seguro de que despreciaría (los algoritmos genéticos no se mantienen como algo ‘elegante’ ya que carecen del rigor teórico).

Entonces, ¿qué es lo interesante de las redes profundas?

Diseñar una red neuronal que realmente pueda generalizar algunas funciones cerebrales es la “cosa” real en todo este drama. Por ejemplo, eche un vistazo a LSTM y RNN. Todos tratan de generalizar algunas funciones cerebrales sin recurrir a un sistema basado en reglas. Aquí es donde está todo el interés, si no me equivoco. Si puede obtener una red elegante que pueda aprender muchas cosas, será el próximo multimillonario. Y, gran parte de este diseño se basa en cómo funciona realmente nuestro cerebro … Introspección sobre la función de nuestro propio cerebro y convertir ese proceso en una red neuronal que puede aprender … ¡Voto! Suena interesante, al menos para mí.

PD:

Tenga en cuenta cualquier BS. Soy nuevo también y estoy tratando de resolver las cosas. Así que toma todo lo anterior con una pizca de sal. Podría estar completamente equivocado también. Espero que los conocedores me corrijan. Gracias por adelantado.

Aprendizaje automáticoAprendizaje profundoInvestigación

Related Content

¿Qué se considera estado de arte para la traducción automática neuronal?

¿Cuáles son los pros y los contras de estos tres modelos de secuencia: modelo MaxEnt Markov, campos aleatorios condicionales y redes neuronales recurrentes?

Después de dominar el aprendizaje profundo, ¿es posible conseguir un trabajo en aprendizaje automático?

Cómo crear un motor de búsqueda médica utilizando el aprendizaje automático en Java

Cómo comenzar a aprender lenguaje máquina a partir de tutoriales

¿Es el atributo central del reconocimiento de patrones genios?

Cómo aumentar la precisión utilizando redes neuronales convolucionales (CNN / ConvNets) para la regresión

More Interesting

Después de lograr una precisión de aproximadamente el 82% en los datos de prueba mediante regresión logística, ¿cómo puedo estar seguro / seguro de que mi algoritmo se generalizará bien para toda la población?

¿Cuáles son las aplicaciones de las redes adversas generativas en imágenes médicas?

Cómo usar el procesamiento del lenguaje natural (PNL) para resumir un documento en una serie de ideas principales

¿Podemos usar variador automático para aprender una representación como el autoencoder de vainilla?

Cómo saber formalmente si una función objetivo es convexa o no convexa

¿Cómo puedo comparar diferentes arquitecturas de redes neuronales sin entrenarlas durante semanas? ¿Hay alguna forma práctica de verificar si las redes merecen la capacitación completa o no?

Cómo calcular un puntaje usando la prueba de relación de distancia al vecino más cercano en MATLAB

¿El submuestreo de un entrenamiento desequilibrado es una buena idea cuando los datos del mundo real, usaré mi clasificador, también estarán desequilibrados?

¿Cuál es la forma más sencilla de entender el equilibrio de sesgo-varianza en el aprendizaje automático?

¿Cómo funciona el algoritmo de recomendación de YouTube?

¿Por qué la regresión logística se considera un modelo lineal?

Máquina de Boltzmann restringida (RBM): ¿Cómo se podría reformular (y / o explicar) las dos tareas en la siguiente diapositiva de una charla de Geoffrey Hinton?

¿Es el atributo central del reconocimiento de patrones genios?

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿Existe alguna medida estadística que demuestre que un clasificador Neural Net con una precisión del 96% en un conjunto de datos de N ejemplos proporcionará una precisión similar en el mundo real?

Web Analytics