¿La entrada de texto de reconocimiento de voz requiere IA?

Hoy en día, los productos con voz se pueden utilizar para tareas cotidianas, como dictar correos electrónicos o mensajes de texto, consultar búsquedas en Internet o reproducir música y programas de televisión. Este es solo el comienzo. El experto de la industria Tristan Louis predijo que la inteligencia artificial “se convertirá en un componente requerido de cada oferta tecnológica”. Pero antes de dar el salto, hay algunas implicaciones de seguridad a considerar.

Primero, los diseñadores de aplicaciones deben comprender y cultivar los entornos de desarrollo adecuados para crear estas nuevas aplicaciones de control por voz. Los cuatro proveedores mencionados están trabajando para expandir sus respectivos alcances. Incluyen interfaces de programación de aplicaciones para sus interfaces de voz y se han esforzado por crear un mejor soporte de voz para varios sistemas operativos.

Amazon, por ejemplo, lanzó su servicio de voz Alexa y ofrece un kit de desarrollo despojado de $ 300 de Conexant para construir aplicaciones de voz Alexa. Mientras tanto, Google implementó Actions API para crear aplicaciones para su Asistente utilizando Node.js y el SDK de Google Cloud. Del mismo modo, SiriKit de Apple permite que las aplicaciones iOSv10 funcionen con mensajes de voz de Siri, y agrega la capacidad de aceptar pagos y compartir citas. Utiliza el lenguaje de programación estándar Apple Xcode y el marco de programación Intents. Finalmente, el Centro de desarrollo Cortana de Microsoft contiene las extensiones de programación para habilitar su interfaz de voz.

Si ya está utilizando estos entornos de desarrollo básicos, tiene menos que aprender que aquellos que comienzan desde cero sin experiencia previa en codificación. Cada entorno de desarrollo es, en su mayor parte, su propia isla, aunque Microsoft tiene un convertidor para transferir el código de Alexa a algo que Cortana puede usar, junto con una forma de negociar conexiones desde sus Bot Frameworks para habilitarlos por voz. .

El término “IA” se usa en exceso en general, pero necesitará una buena cantidad de aprendizaje automático (aprendizaje profundo) para lograr un buen modelo de reconocimiento de voz. Ha habido un buen éxito con diferentes tipos de redes neuronales en lo que respecta al reconocimiento de voz, específicamente el modelado secuencia a secuencia.

More Interesting

¿Puedes hacer un chatbot patentado usando API.AI?

¿Qué tecnologías emergentes puedo obtener hoy en la planta baja? ¿Qué necesito aprender hoy para estar listo para el futuro?

En los chatbots, ¿cuándo es bueno el aprendizaje automático y cuándo es malo?

¿Jack Ma tiene razón al decir que la IA causará más dolor social que beneficios en los próximos 30 años?

Cómo atacar un problema de aprendizaje automático con una gran cantidad de funciones

¿Podrían los robots crear más trabajos de los que destruyen?

¿Por qué la búsqueda A * se llama búsqueda A *?

¿Ha habido alguna investigación sobre la creación de una red neuronal artificial física?

¿Cuál es el estado del arte en el aprendizaje no supervisado?

¿Por qué hacerse cargo de la inteligencia artificial retratada como negativa?

¿Cuál es una forma intuitiva de definir 'conocimiento previo' en el contexto del aprendizaje automático bayesiano?

¿Cuál debería ser el curso de acción para aprender IA y cuán importante es el aprendizaje automático para la IA?

Inteligencia artificial de videojuegos: ¿Por qué es tan difícil usar la inteligencia artificial de agente de red Q profunda para jugar La venganza de Montezuma a un nivel similar al humano?

¿Qué debo elegir para estudiar, aprendizaje automático, análisis de big data o algo más en inteligencia artificial?

Cuántos 'nodos' funcionales una vez integrados son; (a) requerido, (b) óptimo, para que el "cerebro global" logre una conciencia de funcionamiento coherente (sensible)?