Mi experiencia con el rendimiento de las capacidades NLP de IBM Watson fue mala. ¿Como estuvo el tuyo?

En primer lugar, soy el CEO y cofundador de lang.ai, tenemos la primera plataforma de inteligencia artificial no supervisada para la comprensión del lenguaje, por lo que competimos con las capacidades de PNL de IBM Watson en algunos aspectos, a pesar de las diferencias obvias, por supuesto. Somos una empresa de 5 años y 40 personas. Déjame contarte sobre mi experiencia y lo que he visto en el mercado hasta ahora.

Por lo que he visto en clientes en España, América Latina y los Estados Unidos, la experiencia para algunos de ellos no ha sido buena porque necesitan grandes conjuntos de datos para capacitarse y un largo período de configuración que generalmente involucra recursos de consultoría, especialmente para compañías más grandes que externalizar ese proceso de configuración. Ese es un desafío, como se mencionó en otra respuesta, que también tiene otras plataformas que dependen de enfoques supervisados ​​(wit.ai, api.ai o luis.ai).

Las principales limitaciones que he experimentado en el pasado (y he visto la experiencia de muchos clientes en todo el mundo) al tratar con esos sistemas supervisados ​​son:

  • Mucho tiempo para construir una configuración que requiere mucho procesamiento manual y definición de intentos, expresiones, entidades, etc.
  • Difícil de adaptar a nuevos datos para descubrir nuevas intenciones y limitada en la precisión para nuevos enunciados que no se han visto antes
  • Difícil para el análisis multilingüe

Exactamente por eso hemos construido lang.ai. Creemos que los enfoques no supervisados ​​para construir capacidades de detección de intenciones o chatbots tienen limitaciones y complejidades que son difíciles de resolver y proporcionamos un enfoque no supervisado para hacerlo que es independiente del lenguaje.

Estoy de acuerdo

Pero debe comprender el contexto en el que trabaja Watson. IBM ha creado Watson como una plataforma cognitiva genérica que puede hacer frente a todo tipo de problemas para todo tipo de dominios: salud, comercio minorista, seguros, etc. En virtud de esto, se ha vuelto muy amplio y moderadamente bueno en muchas cosas. pero no supera a todos los demás es un campo.

Hacemos mucho reconocimiento de imágenes y PNL para los minoristas y la mayoría de los clientes que trabajan con nosotros ya han probado Watson o Google Vision y no han logrado lo que realmente querían. Debido a nuestro enfoque en el sector minorista, podemos extraer información increíblemente profunda basada en PNL y reconocimiento de imágenes.

Cuando un cliente minorista intenta usar Google Vision para identificar las características de un vestido, le dice que se parece a un vestido y algunos detalles básicos. La mayoría de las empresas ya saben cuál es la naturaleza del contenido que le transmiten. Quieren saber algo más profundo que ‘esto parece un vestido’. Cosas como, ¿este vestido tiene un aspecto angustiado? ¿Se puede usar en verano? ¿Es un vestido sin tirantes? ¿Tiene volantes?

Esto es lo que intentamos extraer de las imágenes:

Del mismo modo, para PNL: la extracción genérica puede ser muy frustrante. Watson puede decirle todos los temas, entidades y nombres propios que detecta, pero sin contexto, no es útil.

Digamos que quería analizar muchas reseñas de productos con Watson. Es probable que recoja cosas que no son lo suficientemente profundas y muy genéricas. Mientras que, sacamos algunas ideas sorprendentes de las revisiones para automatizar la comercialización para los minoristas. Mira esto:

Desglosamos las revisiones de productos en múltiples áreas de interés: cómo lo usan los clientes, para qué lo usan, cuáles son algunos de los otros productos con los que lo usan, qué les gusta del rendimiento del producto.

Incluso dentro de Retail, este modelo cambia de mezcladores a zapatos:

¿Imagina si mostramos filtros de actividad para cafeteras? Nuestros clientes estarán realmente decepcionados.

Y ese es el desafío con Watson. Está construido como una plataforma que tiene capacidades fundamentales y le permite construir soluciones personalizadas en la parte superior. Si intenta utilizar las capacidades genéricas, se decepcionará.

Espero que esto ayude.

Depende de cómo se defina “malo”. He realizado pruebas exhaustivas de los servicios de conversación de Watson con wit.ai, api.ai y luis.ai. Los resultados fueron bastante similares. Todos esos servicios son generales y requieren grandes conjuntos de datos para trabajar. Incluso con 1000 expresiones estaba en un rango de precisión del 80-85%.

Construyo un modelo específico de dominio: es mucho mejor para la conversación sobre un tema específico, pero lo más probable es que falle en otros temas.

Nunca probé el clasificador de Watson: es más fácil construir uno en Python que usarlo como servicio.

More Interesting

¿Cuáles son las herramientas / software más utilizados para el aprendizaje automático / big data?

¿Cuál es la diferencia entre la estimación de máxima verosimilitud (ML) y máxima a Posteri (MAP)?

¿Cuál es actualmente la mejor GPU para el aprendizaje profundo?

¿Cuál es su experiencia de aprendizaje automático en el mundo real en Haskell?

¿Es el hecho de que los algoritmos de aprendizaje profundo requieren grandes extensiones de datos como una limitación final de su potencial en IA?

¿Qué algoritmo utiliza AutoDraw de Google para asociar nuestro dibujo con uno existente?

¿Por qué las variedades son importantes para el aprendizaje profundo o el aprendizaje de refuerzo profundo?

¿Cuánto aprendizaje profundo puedes aprender en 20 días si trabajas todo el día?

¿Usaría WEKA o MATLAB para la clasificación binaria?

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

Cómo ejecutar la regresión logística en SAS en los datos de una encuesta donde las variables dependientes e independientes son niveles de satisfacción (escala - 0 a 5)

¿Cómo cambio de una carrera de software integrado a una carrera en aprendizaje automático?

¿Cuál es el algoritmo de búsqueda de patrones (o reconocimiento de patrones) más avanzado? ¿Como funciona?

¿Puede Naive Bayes alcanzar algún rendimiento con suficientes datos?

¿Qué pasos son necesarios para construir un sistema de aprendizaje profundo para el análisis de sentimientos, tomando como datos de entrada de las redes sociales?