Siempre y cuando tenga una forma en que pueda usar efectivamente ese conocimiento de dominio, sí.
Por ejemplo:
- Es posible que pueda realizar alguna forma de extracción de características en los datos sin procesar. Claro, una o algunas capas adicionales en la parte inferior podrían hacer lo mismo, pero eso requeriría capacitación, lo que significa más datos.
- Puede ayudarlo a elegir el tamaño de convolución si conoce el tamaño típico de los efectos / interacciones locales. En lugar de experimentar con varios tamaños, podría continuar de inmediato, tal vez probando 1 o 2 posibles tamaños de candidatos.
- Es posible que pueda elegir su diseño de red de manera inteligente (sabiendo cuántas capas, qué tipos de capas usar para cada nivel, …). Igual que el anterior: esto limita cuánto necesita experimentar con diferentes diseños.
- Es posible que pueda sembrar los pesos con una elección sensata de valores. Esto podría ser bastante grande, pero requiere que tenga una buena idea de qué característica podría representar cada nodo. Puede ser demasiado pedir, pero si lo tiene, úselo.
Muchas de estas cosas se pueden hacer automáticamente si tiene suficientes datos, pero incorporar cualquier conocimiento que tenga puede acelerar drásticamente el proceso.
- ¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?
- ¿Cuáles son algunos conjuntos de datos sin resolver que son los objetivos de la investigación actual de Deep Learning?
- ¿Qué debería aprender primero para el aprendizaje automático y la autoeducación: cálculo, probabilidad, estadística o álgebra lineal?
- ¿Cuál es la diferencia entre un sistema experto y el aprendizaje automático?
- ¿Cuál es la diferencia entre las redes de Markov y las redes bayesianas?