Comenzaste con la misma materia prima (datos de entrenamiento originales) y estás evaluando en el mismo conjunto de pruebas, no veo por qué la comparación no será legítima.
Consideraría que el aumento configurado es parte del método que se está comparando. El “método” no es solo su arquitectura de red. El aumento no requiere nuevos datos de entrenamiento. Para el caso, el mismo aumento podría haberse realizado “dentro” del algoritmo de aprendizaje automático: ¿lo consideraría entonces permisible?
Por otro lado, si está comparando explícitamente las fortalezas de dos arquitecturas de red, entonces probablemente ambas deberían * explotar el tren en el mismo conjunto de imágenes (conjunto de entrenamiento + aumento). De lo contrario, es difícil decir si la diferencia en el rendimiento proviene de las diferencias de arquitectura o de los datos de entrenamiento.
- Cómo calcular un puntaje usando la prueba de relación de distancia al vecino más cercano en MATLAB
- ¿Cómo calcularía el ROI del uso de Big Data y el aprendizaje automático en los productos de la compañía?
- Cómo calcular la probabilidad de que una oración aparezca en algún lugar del texto usando Word2Vec
- ¿Es generalmente una buena idea entrenar en caso real, desarrollar y probar conjuntos de datos para la traducción automática?
- ¿Qué algoritmos de aprendizaje automático para la clasificación admiten el aprendizaje en línea?
* En realidad, incluso entonces, es (raro pero) posible que un modelo solo tenga un rendimiento peor debido (!) Al aumento, en cuyo caso lo más correcto sería usar la configuración para cada modelo que produzca el mejor rendimiento. ¡Efectivamente, trate el aumento como un hiperparámetro!