¿Se pueden utilizar las API de IBM Watson para crear un asistente de voz completo?

Hay una serie de servicios de Watson que sin duda ayudarían:

  1. Watson Conversation le permite construir, probar e implementar rápidamente un bot o agente virtual en dispositivos móviles, plataformas de mensajería como Slack o incluso en un robot físico. Conversación tiene un generador de diálogo visual para ayudarlo a crear conversaciones naturales entre sus aplicaciones y usuarios, sin necesidad de experiencia en codificación.
  2. Watson Speech to Text convierte la voz de audio en texto escrito. Use Voz a texto para transcribir llamadas en un centro de contacto para identificar lo que se está discutiendo, cuándo escalar llamadas y comprender el contenido de múltiples oradores. Use voz a texto para crear aplicaciones controladas por voz, incluso personalice el modelo para mejorar la precisión del idioma y el contenido que más le interesan, como nombres de productos, temas delicados o nombres de personas.
  3. Text to Speech convierte el texto escrito en audio con sonido natural en una variedad de idiomas y voces. Puede personalizar y controlar la pronunciación de palabras específicas para ofrecer una interacción de voz perfecta que se adapte a su audiencia. Use texto a voz para desarrollar juguetes interactivos para niños, automatizar las interacciones del centro de llamadas y comunicar instrucciones con las manos libres.
  4. Analice el texto para extraer metadatos del contenido, como conceptos, entidades, palabras clave, categorías, sentimientos, emociones, relaciones, roles semánticos, utilizando la comprensión del lenguaje natural. Con modelos de anotación personalizados desarrollados con Watson Knowledge Studio, identifique entidades y relaciones específicas de la industria / dominio en texto no estructurado.
  5. El servicio Clasificador de lenguaje natural comprende la intención detrás del texto y devuelve una clasificación correspondiente, completa con un puntaje de confianza. Por ejemplo, “¿Cómo está el clima hoy? o “¿Hace calor?” o “¿Va a ser bueno hoy?” son todas formas de preguntar acerca de la “temperatura”. Use NLC para responder preguntas en un centro de contacto, crear chatbots, categorizar volúmenes de contenido escrito y más.

Puede encontrar más documentación e información sobre otros servicios de Watson en Watson Developer Cloud.

Consulte ‘El asistente de voz con tecnología Watson de IBM está diseñado para profesionales de la seguridad’.

Con respecto a Watson y Slack, uno de estos talleres puede estar cerca de usted la próxima semana: The Slack and IBM Watson Tour – IBM Watson.

No tengo experiencia directa con él, sin embargo, todo lo disponible muestra que puedes. IBM ha publicado su SDK y documentación para usar en esto. Lo importante aquí es cuál es su definición de asistencia de voz completa aquí. También la otra cosa a investigar es qué información está buscando tener disponible para que Watson brinde capacidades de asistencia. Si la información no es parte de su catálogo, entonces solo puede llegar tan lejos al proporcionar la experiencia que espera. Existen muchas soluciones para la asistencia de voz, como se mencionó, primero debe identificar su necesidad para saber cuál es la opción correcta. Estoy seguro de que has estado allí, sin embargo, visita Watson Developer Cloud para obtener los recursos que necesitas como punto de partida.

Sí, por supuesto: voz a texto, texto a voz, servicios de descubrimiento, etc. se pueden usar para hacer un asistente de voz