Cómo elegir una red neuronal para la clasificación basada en la aplicación y cómo las capas ocultas afectan el rendimiento de la red neuronal

No existe un método único más utilizado como tal para decir que esta es la arquitectura correcta de la red requerida.

Una forma de hacerlo es construir una red más grande de lo necesario y usar varias técnicas de poda para reducir el tamaño de la red. Se utilizan técnicas como un cirujano cerebral óptimo basado en arpillera.

La otra forma es construir lentamente la red a partir de unidades más pequeñas de lo necesario y verificar la precisión, cuando la precisión se satura o cuando comienza a disminuir ligeramente (debido al sobreajuste) puede determinar el tamaño óptimo de la red.

El número de capas ocultas y el número de unidades ocultas en cada capa determinan en última instancia el grado de la línea de clasificación que obtenemos, según los datos, si la línea de clasificación es de tercer grado o más, podríamos necesitar más capas ocultas para generar ese complejo límite de decisión.

Related Content

¿Cómo se compara Wolfram | Alpha con el conocimiento verdadero?

¿Cuáles son algunos libros sobre aprendizaje automático e inteligencia artificial para un laico?

¿Dónde está el mejor lugar para comenzar a investigar el aprendizaje automático en inteligencia artificial?

¿Qué debe hacer si viene una máquina para su trabajo?

¿La IA necesitará humanos para siempre para tener un propósito, incluso cuando ocurra la singularidad?

¿En qué orden debo aprender el aprendizaje automático, el aprendizaje profundo, el procesamiento del lenguaje natural y la inteligencia artificial?

¿Cuál es el diagrama de red de DeepDream de Google?

No estoy seguro de lo que quiere decir con ‘elegir una red neuronal basada en la aplicación’, aquí supongo que se refiere a la estructura de la red neuronal. Vea que siempre hay un problema de sesgo vs varianza (como con cualquier otro algoritmo de aprendizaje).

Y puede verificar esto a través de curvas como el diagrama de caja o a través de curvas de aprendizaje, el curso del profesor Andrew Ng sobre Coursera habla sobre ellas en detalle.

Una red más grande puede sobreajustarse, mientras que una más pequeña puede no aproximarse bien a la función (bajo ajuste).

Aditya Ramesh

More Interesting

¿Cuánto de la canción escrita de AI 'Daddy's Car' es realmente el producto de AI?

Si gravamos a los robots y les hacemos pagar salarios, ¿todavía nos preocupa que la IA reemplace a la fuerza laboral humana?

¿Cómo elegir la red neuronal para proyectos? ¿Qué red neuronal debo usar para detectar el equipaje abandonado usando el aprendizaje autodidacta?

¿Cómo se ve una plantilla para la generación de lenguaje natural?

¿Por qué los algoritmos de búsqueda de IA solo parecen funcionar en la estructura de árbol?

¿Cómo funciona el algoritmo de búsqueda de ruta de Age of Empires II?

Cómo crear una IA en Python

¿Cómo afecta el aumento del aprendizaje automático a los fabricantes de procesadores?

Cómo entrenar una red neuronal para generar XML desde una imagen

¿Qué tan rápido crearíamos inteligencia artificial inteligente si basamos a toda la sociedad en el diseño de tecnologías de inteligencia artificial?

¿Podemos usar un algoritmo genético para desarrollar un modelo de la neocorteza y luego dejar que esto aprenda sobre su entorno y se vuelva inteligente?

¿Cuál sería la forma más rápida y fácil de hacer una API de reconocimiento de oraciones utilizando una red neuronal?

¿Google DeepMind AI dominará el videojuego LoL, inventará un nuevo meta y superará a SKT si está desarrollado para hacerlo?

¿Crees que los robots puedan convertirse en enemigos de la humanidad?

¿Cuál es la controversia sobre la IA?

Web Analytics