No estoy muy claro sobre el contexto de su pregunta. Si está creando características para un clasificador, entonces tiene el control de qué características trata como globales y cuáles trata como locales. Pensando estrictamente geométricamente, usted define una ventana, dentro de la ventana es local, fuera de la ventana es global. Cuando habla de convoluciones, lo que está dentro de su núcleo es local, afuera es global.
El escalado es uno de los aspectos matemáticamente más desafiantes del procesamiento de imágenes. Es posible que haya visto imágenes que están hechas de miles de imágenes más pequeñas: ¿cuál es la escala correcta para verlas? En cualquier caso, tienes que hacer algunas suposiciones. En general, si buscamos objetos específicos como caras, establecemos un tamaño mínimo, luego construimos una pirámide de escalas para que podamos encontrar caras desde el tamaño mínimo hasta el tamaño completo de la imagen. Si esta es la técnica que está buscando, busque citas para presentar pirámides de redes convolucionales .
- ¿Qué es la agrupación conceptual?
- ¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?
- ¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?
- ¿Qué caminos puede tomar un ingeniero mecánico para comenzar a trabajar con robótica, aprendizaje automático e inteligencia artificial?
- ¿Por qué la biblioteca de estadísticas de Python es tan limitada en métodos bioestadísticos avanzados en comparación con R, mientras que la biblioteca de Python de Machine Learning es mucho mejor?