¿Cómo se les ocurre a las personas una topología apropiada para las redes neuronales (recurrentes)? Me gustaría conocer las diversas heurísticas que usan los investigadores, y tal vez algunos comentarios sobre qué tan bien funcionan y cuándo podrían fallar.

No hay una receta general para responder a su pregunta. En el caso de imágenes y datos secuenciales, a menudo se usan capas conectadas convolucionalmente o localmente (en el tiempo y / o espacio). En otros casos, hasta ahora (debido a la tecnología de GPU) es muy eficiente hacer capas completamente conectadas porque la multiplicación de matriz grande es como 10 veces más rápida que un montón de multiplicaciones de matriz más pequeñas (o peor, dispersas conectadas aleatoriamente multiplicación matricial) para el mismo número de parámetros. Por lo tanto, las capas completamente conectadas aún dominan (al menos en parte de la red) en los sistemas de vanguardia. Sin embargo, esto se debe a consideraciones de implementación. Es muy posible que surjan mejores modelos con capas más grandes que estén menos conectadas. La situación de conectividad no es muy diferente si se consideran variantes generativas (Boltzmann, DBN) o discriminatorias (MLP profundo supervisado).

Related Content

Si tuviera que construir una máquina inteligente a partir de un gran número de componentes similares, ¿cómo debería comportarse cada componente?

¿Cuáles son algunos ejemplos de juegos de computadora que usan aprendizaje automático? ¿Los juegos como FIFA 2013 de EA Sports aprenden de un usuario? ¿La computadora cambia sus tácticas de acuerdo con el estilo de juego del oponente? Si no, ¿es esto posible de implementar?

¿Alguien ha intentado crear una IA que asocie un objeto o una imagen con algún tipo de información?

Cómo detectar mediante programación un sonido específico

¿Cómo puede una computadora predecir el acento que uno escucharía de alguien cuyo idioma nativo es A cuando habla un segundo idioma B?

¿Puedo usar la programación de expresión génica para desarrollar programas C ++?

¿El aprendizaje por refuerzo es escalable?

Hablando en general, decidirlo por un par de razonamientos empíricos es mejor que cualquier pequeña provisión ya que, por lo tanto, NN parece escalas muy grandes en los modelos exitosos, por lo tanto, la estimación del mejor modelo posible por adelantado es incluso imposible.

Mi plan de ruta es;

lea algunos documentos sobre el interés particular
usar los modelos propuestos
medir resultados
cambiar de una manera que espere ver algunas mejoras
medir de nuevo
si funciona, escriba un documento o envíelo para impugnar o gane dinero con él 🙂

Advertencia: tenga en cuenta la simplicidad de Occam

Kenneth Tran

More Interesting

¿Logramos controlar un robot a través del cerebro humano, o sigue siendo un sueño lejano?

¿Son las redes neuronales generalmente reversibles?

¿Cuáles son los documentos de lectura obligatoria en AI / ML que trazan los principales desarrollos en el campo en los últimos 50 años?

¿Es una mala señal estar más interesado en las máquinas que en los humanos?

¿Qué áreas de las matemáticas puras son relevantes para la IA?

¿Debería considerarse que la computación flexible forma parte de la inteligencia artificial o la informática blanda debe considerarse una disciplina separada? ¿Y por qué?

¿Son útiles las matemáticas aplicadas en el campo del aprendizaje automático y las redes neuronales?

¿Qué carreras reemplazarán los robots más que otras?

¿Los límites de tiempo más largos favorecen a los humanos o las computadoras en una partida Go?

¿Cuáles son algunas de las nuevas empresas de aprendizaje automático en 2016?

¿Cuál fue el problema exacto en Facebook AI que llevó a su cierre?

¿Qué es algo en inteligencia artificial que no veremos en nuestra vida pero que crees que es posible?

¿Es la inteligencia artificial para la batalla algo bueno o malo?

¿Hay alguna solución disponible para entrenar redes neuronales específicamente en CPU, donde una GPU podría no estar disponible?

¿Cuál es el futuro de la investigación de 'reconocimiento de voz'?

Web Analytics