Al entrenar una red neuronal, ¿tengo que entrenar a la red con la salida correcta para cada entrada posible?

Bueno, si entendí lo que estás haciendo, en mi opinión, estás mostrando a tu red neuronal solo aquellas entradas para las cuales la salida correcta es 1. Digamos que tienes un conjunto de entradas con algunas imágenes de Hotdogs y entrenas tu NN solo para reconocer un perrito caliente y nada más. Ni siquiera pizza. Entonces, cuando su NN vea una pizza, pensará que, de hecho, es otro estilo de hot dog y nada más. Esto se debe a que el universo de un NN se basa en lo que se muestra (Fuente: Silicon Valley, HBO GO 😉). Debido a que lo que está haciendo es una clasificación bivariada que utiliza el aprendizaje supervisado, por lo tanto, su NN necesita alimentarse tanto con 0 como con 1 para discriminar entre ellos.

Personalmente tomo un NN supervisado como un bebé recién nacido, que aún no ha visto el mundo y soy responsable de mostrar todas las características de este mundo antes de que pueda comenzar a probarlo. Esto me hace comprender mejor la mayoría de las partes de la NN.

Si es posible enumerar todas las entradas posibles y las salidas conocidas, también podría usar una tabla de búsqueda en lugar de una red neuronal. La idea con NN es lograr que la red se “generalice”, es decir, responda adecuadamente a las entradas que tienen las características generales correctas cuando esa entrada exacta nunca se ha visto antes. No me considero un experto en dominios, pero en general, necesita entrenar la red con suficientes entradas para que aprenda esto, pero también evitar que simplemente memorice su conjunto de entrenamiento sin generalizar. Una red más grande / profunda puede, en general, memorizar más, por lo que requerirá un conjunto de entrenamiento más grande. Es posible que una red (demasiado) pequeña no pueda generalizarse en absoluto.

No todas las demás entradas posibles, pero una buena cantidad de ellas.

Básicamente, debe entrenar la red no solo para la salida 1 cuando se proporciona su entrada específica, sino también para emitir ‘0’ cuando se proporcionan otras entradas. Esto asegura que su red no haya aprendido a emitir ‘1’ independientemente de la entrada dada.

Si da suficientes ejemplos de entradas donde la salida debería ser ‘0’, la red debería ser capaz de generalizar y comprender que cualquier otra entrada debería generar un ‘0’

Debe entrenar su red para discriminar entre las salidas en función de su asociación con la entrada. Debe tener ambos casos, es decir, 0 y 1 y entrenar su red para ambos. De esta manera puede distinguir cuándo dar salida 0 o 1.

No necesariamente, si obtiene un 100% de precisión en los datos de entrenamiento, entonces es probable que esté sobreajustando. Por lo tanto, debe entrenar la red para obtener la mejor precisión, y luego probarla en el conjunto de prueba y comparar la precisión, si obtuvo el 100% de los datos de entrenamiento pero el 90% en la prueba, entonces ciertamente está sobreajustando.

More Interesting

¿Cuál es la aplicación más grande y más reciente de las redes neuronales?

Quiero hacer una IA simple (inteligencia artificial), entonces, ¿qué lenguaje de programación debo aprender para hacer una IA simple?

¿Cuáles son algunos hechos desconocidos sobre Cortana?

¿Cuáles son los programas de maestría para el aprendizaje de refuerzo profundo y / o el aprendizaje profundo en robótica en general? ¿Dónde puedo postular, particularmente en Europa?

¿En qué áreas los métodos del núcleo siguen siendo competitivos con el aprendizaje profundo?

¿Cuál es el propósito de Google Dream?

¿Cuál es la aplicación del aprendizaje automático en contabilidad / auditoría / impuestos y finanzas corporativas?

¿Qué tan bien maneja Parsey McParseface las oraciones del camino del jardín?

¿Cuál será la próxima tendencia tecnológica después de la Inteligencia artificial?

¿No es el examen de ciencias de cuarto u octavo grado una posibilidad demasiado remota para la IA actual? ¿Por qué no realizar primero tareas más simples como la comprensión básica del mundo a partir de videos?

¿Por qué los agentes de conversión se están generalizando ahora? ¿Es por razones tecnológicas o de mercado?

¿Qué son las no linealidades continuas en el contexto de las funciones de activación en redes neuronales?

¿Debo dejar de preocuparme por el futuro de la IA y la robótica, la adquisición y el reemplazo de trabajos?

¿Cuál es la mejor manera de hacer una red neuronal capaz de aprender sin supervisión, y cuáles son sus usos?

¿Tendría una inteligencia artificial miedo a la muerte?