¿Una red neuronal necesita un nodo de salida para cada cosa que pueda clasificar?

Esa es una pregunta interesante. ¿Qué significa clasificar algo? ¿Y cómo sabemos que un sistema clasifica las cosas de una manera útil?

Una forma es asignar una palabra o frase a cada cosa que queremos clasificar, por ejemplo, “gato doméstico” o “Pontiac TransAm 1979”. Un nodo de salida por cosa: ahora es fácil calificar cómo funciona el sistema de acuerdo con la métrica que elegimos . Una salida por clase es prueba de clasificación y podemos juzgar esa calidad de la clasificación.

Pero, incluso si nuestra red comprende 100 especies de gatos domésticos y 1000 tipos de automóviles, si el resultado que nos interesa es “¿esto es una amenaza para mí?”, A pesar de eso, solo tenemos dos nodos de salida (Sí o No) de la red que tiene un rico modelo interno.

Entonces, no, un ANN no necesita un nodo de salida por cosa clasificada. Necesita un nodo de salida por factoid que queremos saber sobre una cosa. Esto corresponde a la capa de lectura en muchos ANN.

No en teoría

Lo que estás describiendo se llama codificación 1-hot. N elementos, N salidas (aunque las salidas N-1 también funcionan).

También puede usar la codificación binaria, por ejemplo.

000 = clase 0, 001 = clase 1, 010 = clase 2, 011 = clase 3, … 111 = clase 7.

Sin embargo, será más difícil para la red aprender este mapeo, y el rendimiento probablemente se verá afectado.

Creo que la respuesta de Matthew Lai es muy buena, pero técnicamente podría tener solo una salida y dividir los valores, por lo que si tiene 5 salidas particulares, <.2 sería una clasificación,> .2 y <.4 sería otra, etc.

Sin embargo, no recomiendo esto; Tendría un nodo de salida para cada cosa que pueda clasificar.

More Interesting

¿Dónde puedo encontrar el algoritmo para encontrar los otros nombres de la entidad popular?

Cómo aprender los conceptos básicos del aprendizaje automático dentro de una semana para una entrevista de trabajo

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

¿Qué es apilar en el aprendizaje automático?

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?

Visión por computadora: ¿cómo es la detección de objetos usando los puntos clave SIFT escala / rotacionalmente invariante?

¿Qué es el etiquetado gráfico?

¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

¿Cuál es la diferencia entre la regresión de mínimos cuadrados ordinarios y la regresión lineal con el método de mínimos cuadrados?

¿Tiene Microsoft una mejor tecnología de aprendizaje automático y aprendizaje profundo que Google?

¿Por qué los entrenamientos CNN desequilibrados afectan tanto la clasificación?

Como proyecto de graduación, elegimos hacerlo en el análisis de sentimientos de Twitter, tenemos algunos conceptos básicos de ML obtenidos de los MOOC, ¿a dónde deberíamos ir después?

¿A quién o qué investigación de laboratorio en aprendizaje automático le parece más interesante?

¿Cuál sería el mejor desafío de Kaggle para mí como entusiasta del aprendizaje automático de nivel intermedio?