¿Puede el conocimiento del dominio ayudar a usar menos datos de entrenamiento, cuando se entrena una red neuronal convolucional para una aplicación específica?

Siempre y cuando tenga una forma en que pueda usar efectivamente ese conocimiento de dominio, sí.

Por ejemplo:

  • Es posible que pueda realizar alguna forma de extracción de características en los datos sin procesar. Claro, una o algunas capas adicionales en la parte inferior podrían hacer lo mismo, pero eso requeriría capacitación, lo que significa más datos.
  • Puede ayudarlo a elegir el tamaño de convolución si conoce el tamaño típico de los efectos / interacciones locales. En lugar de experimentar con varios tamaños, podría continuar de inmediato, tal vez probando 1 o 2 posibles tamaños de candidatos.
  • Es posible que pueda elegir su diseño de red de manera inteligente (sabiendo cuántas capas, qué tipos de capas usar para cada nivel, …). Igual que el anterior: esto limita cuánto necesita experimentar con diferentes diseños.
  • Es posible que pueda sembrar los pesos con una elección sensata de valores. Esto podría ser bastante grande, pero requiere que tenga una buena idea de qué característica podría representar cada nodo. Puede ser demasiado pedir, pero si lo tiene, úselo.

Muchas de estas cosas se pueden hacer automáticamente si tiene suficientes datos, pero incorporar cualquier conocimiento que tenga puede acelerar drásticamente el proceso.