No recibí la pregunta por completo, pero estoy escribiendo la respuesta a una pregunta, ‘¿cómo se extraen las características utilizando la red neuronal convolucional?’.
Existen diferentes formas de extraer características de redes neuronales convolucionales según la aplicación.
Las CNN pueden tener convolución y capas completamente conectadas. Si extraemos entidades de la última capa oculta que está antes de la capa softmax, obtendrá un vector de entidad dimensional 4096. Entonces, por ejemplo, si tiene una base de datos perro contra gato (25000 imágenes de gato y 25000 imágenes de perro) puede extraer estos 4096 vectores para todas sus imágenes y ajustar un pequeño clasificador de 2 clases a estas características y obtendrá una muy buena precisión para hacerlo clasificación gato vs perro.
- ¿Es un software codificado a mano más caro que un software producido en fábrica? ¿Tiene aditivos o inteligencia artificial?
- ¿Podrían la IA y los robots reemplazar la necesidad de policías, bomberos, etc. en el futuro?
- Inteligencia artificial: ¿Cuántas líneas de código se necesitarían para codificar un AI / AGI fuerte?
- ¿Hay alguna referencia para C # como la documentación de Java AI?
- ¿Una IA nacida de la singularidad sabría sobre el chantaje? ¿Qué sería lo primero que aprende?
Otra forma es, puede extraer la matriz de entidades de la última capa de convolución (sexta capa en el caso de alexnet) y estas matrices de entidades representan la representación de alto nivel de la imagen de entrada. Por ejemplo, puede usar estas funciones para la predicción de video o para el reconocimiento de actividad de video, etc.
Otro se llama característica de hipercolumna. Que se utiliza en la segmentación de la imagen. Aquí extraemos hipercolumnas para todas las características y hacemos la segmentación a nivel de píxeles …