Hace dos años estaba interesado en ver lo que implica el desarrollo de aplicaciones móviles, así que escribí una especie de aplicación de álbum de fotos de aspecto horrible que clasificó sus fotos por objetos contenidos en las fotos. Hoy en día puedes usar herramientas como CoreML para hacerlo tú mismo, pero en ese entonces la única forma razonable de hacer visión por computadora es del lado del servidor. Me inscribí para una prueba gratuita de IBM Watson para hacer esa clasificación de objetos del lado del servidor.
La interfaz de Watson era muy simple para trabajar. Le envía una solicitud de publicación HTTP (codifica su clave API y la imagen en sí) y le devuelve una cadena JSON legible por humanos que contiene lo que solicitó. Es el tipo de cosa que funciona en el primer intento. Y si usted es el tipo de desarrollador de aplicaciones que no conoce ni se preocupa por los modelos que se utilizan, le complacerá no haber especificado qué modelo usar: simplemente dijo cuáles son sus datos.
Pero hace dos años, el clasificador de objetos predeterminado no tenía un rendimiento impresionante. La precisión era cualitativamente peor de lo que razonablemente esperarías con un clasificador típico de la era 2015 en Imagenet, mi memoria es “generalmente el objeto no está en el top 5”. Watson probablemente ha mejorado desde entonces, pero en ese momento uno tendría que construir su propio conjunto de datos para que Watson le brinde mejores resultados que una suposición aproximada. Lo cual, por cierto, es bastante fácil de hacer con la API de Watson: puede crear un nombre de conjunto de datos asociado con su clave API, enviarle el conjunto de datos e IBM capacitará los modelos que estén usando en él.
- Cómo escribir un bot de chat de Microsoft Lync
- ¿Cuáles son algunos de los problemas importantes en el campo de la IA que deben resolverse para 2018 o 2023?
- Cómo crear un chatbot de dominio específico
- ¿Cómo define el aprendizaje automático para un niño de seis años?
- ¿Por qué existe el temor de dominación de robots / IA cuando se pueden incorporar múltiples niveles de interruptores de muerte?
Entonces, si está usando Watson, está gastando dinero en hacer que IBM maneje la visión por computadora por usted. Si necesita un control detallado, o si no desea que IBM observe imágenes privadas, o si necesita funcionar sin conexión a Internet, o si no desea tratar directamente con dinero o relaciones comerciales, eso descarta a Watson. Pero si esas preocupaciones no importan y buscas la máxima comodidad, es una buena herramienta.