Sí, es más como un enfoque de escala múltiple por el cual los tamaños de ventana más pequeños procesan un contexto más pequeño (escala más pequeña) en comparación con los tamaños de ventana más grandes que pueden capturar un contexto mucho más grande (escala más grande).
O, más precisamente, si vincula los pesos entre un determinado grupo de núcleos con tamaños de ventana variables (pero igual conteo de parámetros), entonces es equivalente a hacer una convolución en escala, recuerde, una convolución típica se realiza solo en el plano xy (espacial). Es decir, el modelo buscará características no solo en términos de ubicación, como se hace en las redes neuronales convolucionales típicas (CNN), sino también en términos de escala.
Lo que eso significa es que puede obtener una traducción + escala equivalente * CNN. Las redes neuronales convolucionales típicas son solo equivalentes de traducción, la adición de núcleos multiescala puede mejorar la forma en que el modelo trata con las características y objetos de escala.
- En un modelo gráfico dirigido, el aprendizaje es fácil pero la inferencia es difícil. ¿Es esto cierto?
- ¿Cuáles son los problemas de investigación en la detección de objetos?
- ¿Cuáles son algunos de los desafíos y oportunidades sobresalientes en el análisis predictivo con respecto a la privacidad y la propiedad de los datos, el análisis de los datos del usuario, el escalado de algoritmos y los ecosistemas e intercambios de datos emergentes?
- ¿Cuáles son los pros y los contras del aprendizaje en línea y fuera de línea? ¿En qué escenarios son útiles cada uno?
- ¿En qué dominios encuentra aplicación la tecnología de procesamiento de eventos complejos (CEP)?
* Algunos dicen invariante, pero el término correcto aquí es equivalente ya que el mapa de respuesta reflejará la escala y la ubicación de una característica / objeto en particular.
Eso puede ser beneficioso porque entonces, el aumento de datos con diferentes versiones escaladas de objetos de entrenamiento puede ser innecesario para tal modelo. Dado que ahora tiene una función incorporada, las características / objetos del mundo pueden variar en posición y en escala.
Espero que esto ayude.