Sí. Con el preprocesamiento y la capacitación correctos, un convnet debe reconocer objetos en todas las condiciones que mencionó. Sus esfuerzos en el preprocesamiento serán menores si tiene un gran conjunto de datos, de lo contrario, tendrá que comenzar a procesar mucho.
el objeto está presente en cualquier orientación posible
el objeto está presente a cualquier distancia
- ¿Pueden Kmeans y el algoritmo DBSCAN dar el mismo resultado para un conjunto de datos en particular?
- ¿Cómo verifican las personas los resultados de un análisis de causa raíz en la minería de datos? ¿Hay algún conjunto de datos público disponible que especifique cuáles son las causas reales del problema?
- ¿Cuál es la desventaja de usar ADVI?
- ¿Cuál es el principio del aprendizaje profundo?
- Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?
el objeto está presente en diferentes condiciones de rayos
Para las tres condiciones anteriores, su conjunto de datos debe tener muchas variaciones / puntos de datos (por ejemplo, imagenet tiene puntos de datos con varios niveles y orientaciones de zoom, por lo que el entrenamiento directo en imagenet podría estar bien para que convnet funcione bien en todas estas condiciones) por suficiente características que se deben aprender en cada una de las condiciones o de lo contrario tendrá que simular estas condiciones para que convnet aprenda mediante preprocesamiento / aumento.
El objeto es similar pero diferente como dos caras diferentes, gatos, planos, etc. El objeto está parcialmente oculto. Los objetos ocluidos son particularmente difíciles y hay una investigación especial para esta categoría.