Su mejor opción sería escribir una aplicación móvil que use la cámara nativa para enviar imágenes a un servicio en la nube para su análisis. Esto puede hacerse automáticamente a intervalos fijos, o bajo demanda con solo presionar un botón. Para el servicio en la nube, usaría un modelo y pesos que han sido previamente entrenados en ImageNet [1]. ImageNet es un gran conjunto de imágenes que los humanos han clasificado y anotado en miles de categorías diferentes. Al usar un modelo ImageNet pre-entrenado, podrá clasificar muchos objetos cotidianos como una taza de café y un bate de béisbol, un elefante e incluso podrá distinguir entre diferentes razas de perros y gatos.
Si los objetos que desea clasificar son más específicos y ha recopilado suficientes datos etiquetados, es bastante fácil realizar una capacitación sobre su modelo ImageNet para refinar su sistema.
Keras [2] tiene modelos pre-entrenados para muchas arquitecturas diferentes con la arquitectura VGG-16, probablemente la más popular. Con la facilidad de uso de Keras, estará listo y funcionando en muy poco tiempo.
- ¿Qué te emociona del futuro del aprendizaje automático?
- ¿Puede el aprendizaje automático desarrollar el gusto?
- ¿Preferiría que una novela sobre la era medieval fuera históricamente precisa y llena de conceptos verificables o fácilmente legible pero de hecho escasa?
- ¿Se pueden utilizar bosques aleatorios para la selección de variables? De ser así, ¿cómo?
- Como estudiante de pregrado de CS interesado en el aprendizaje automático, ¿cómo puedo saber si me gustaría la economía / computación financiera?
Recursos:
[1] ImageNet
[2] Modelo pre-entrenado VGG-16 para Keras