¿Existe alguna directriz para diseñar redes neuronales en términos de número de capas ocultas, número de unidades ocultas, tamaño de filtro (CNN) y paso de tiempo (RNN)?

Respuesta corta: actualmente es más arte que ciencia, y hay mucha intuición de la experiencia + pruebas empíricas para obtener los hiperparámetros correctos.

La razón de esto es que no hay formas muy básicas de pensar acerca de cuáles son las configuraciones de hiperparámetros “correctas”, por ejemplo, puede elegir el tamaño de la muestra en función de su potencia estadística deseada en una prueba de hipótesis simple.

En general, hay muchas heurísticas y reglas generales que la mayoría de las personas siguen, demasiadas para enumerarlas aquí. La buena noticia es que, en general, los hiperparámetros pueden ajustarse independientemente uno del otro (ver: Una Odisea del espacio de búsqueda), lo que significa que puede encontrar el “punto óptimo” para cada hiperparámetro individualmente, en lugar de buscar el espacio de búsqueda exponencial. Por supuesto, algunos trucos se superpondrán entre sí, por ejemplo, la deserción ayuda mucho menos si ya está utilizando la normalización por lotes.

Aprendizaje automáticoAprendizaje profundoRedes neuronales artificiales

Related Content

¿Cómo se determina el tamaño del paso de actualización para el algoritmo de retropropagación ADADELTA?

¿Qué puedo hacer con una base de datos de 800 GB de un sitio de reserva de boletos en línea? (Películas, obras de teatro, algunos eventos deportivos)?

¿Cómo se puede utilizar el aprendizaje automático para mejorar el software de gestión de proyectos?

¿Cómo aprendiste Machine Lerning?

¿Podemos aplicar el aprendizaje automático a los problemas de NP Complete?

Cómo usar un árbol de decisión para construir datos sintéticamente

¿Cómo se puede aplicar la ciencia de datos a los anuncios de Facebook?

Simplemente puede usar cualquier herramienta disponible y dejar que busque los parámetros más apropiados para su red. Hay varias formas de hacerlo (también conocido como optimización de hiperparámetros). Por ejemplo, si usa Keras, puede usar hyperas.

Gonzalo Pérez

Desafortunadamente, NN todavía está en la misma etapa que la radio anterior: más intuición y sintonización manual que una lista de reglas.

Incluso la topología de la red a menudo está diseñada por un algoritmo genético.

Gonzalo Pérez

More Interesting

¿Es el aprendizaje automático y el aprendizaje profundo una carrera mejor que el desarrollo web ahora?

Sistemas de recomendación: ¿Cuál es la diferencia entre el filtrado colaborativo de elemento a elemento y el filtrado basado en contenido?

¿Qué tipo de aumento de datos se puede usar para imágenes médicas?

Cómo estructurar sus proyectos de aprendizaje automático

¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?

¿Qué es exactamente el sobreajuste? ¿Por que sucede? ¿Cómo afecta a mi modelo?

Algunas cosas "fueron modeladas como procesos de Poisson". ¿Qué quieren decir con eso?

¿Alguien consiguió un trabajo en Machine Learning después de completar un Nanodegree de Machine Learning?

¿Por qué asumiríamos que los datos son iid cuando no lo son?

¿Cuál es el mejor curso en línea para el aprendizaje automático con Python?

¿Qué es el Autoencoder Adversarial?

¿Cuáles fueron los algoritmos utilizados para los chatbots antes de que surgiera el aprendizaje profundo?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Qué sistemas IDS, IPS en Network Security hoy en día son los más adaptables para aprender nuevas amenazas? ¿Hay algún tipo de punto de referencia estándar para medir esto?

¿Puede el aprendizaje automático diagnosticar el autismo?

Web Analytics