Una buena característica para las aplicaciones de imágenes debería ser la escala y, idealmente, la rotación invariante. Algunos ejemplos son las funciones SIFT y HOG.
Otra idea que se usa ampliamente es la bolsa de palabras visuales. Inspirado en la minería de texto, representa su imagen como un vector de ocurrencias visuales de palabras. Para tratar su imagen como un documento, primero detecta puntos clave (como bordes o manchas), luego representa estos puntos clave con una función como SIFT o HOG. A partir de estas representaciones, genera un diccionario de palabras visuales agrupando todas las representaciones. Y finalmente tienes tu imagen representada como un vector de apariciones de palabras visuales.
Referencias
Transformación de característica invariante de escala
Histograma de gradientes orientados
https://en.wikipedia.org/wiki/Ba…
- ¿Existe algún proyecto de datos abiertos que utilice el aprendizaje automático y la ciencia de datos para proporcionar información sobre los datos de incidentes de aplicación de la ley disponibles públicamente?
- ¿Dónde puedo descargar datos de proyecto disponibles públicamente para entrenar mi red neuronal?
- ¿Qué cantidad de sistemas de recomendación se trata solo de usar el algoritmo correcto?
- ¿Cuáles son algunos buenos documentos con ejemplos del mundo real del aprendizaje de refuerzo inverso (IRL)?
- ¿Qué es la mente profunda de Google?