¿Qué área de la PNL es más prometedora y gana más tracción en la industria: la PNL sobre los datos de voz frente a texto?

La forma en que está formulada la pregunta no es clara lo que se pregunta:
a) ¿Es más rentable aplicar PNL a la señal acústica de voz o al texto?
b) ¿Es más rentable usar métodos de PNL para texto que se originó como voz versus texto que se escribió?

Para responder a) es imposible aplicar los principios de la PNL a la señal de voz per se, por lo que supongo que quiere decir b.

La respuesta corta a b) es: ambas son apuestas bastante buenas durante al menos algunos años, pero en última instancia depende de lo que le interesa más.

La respuesta b) es algo difícil ya que se basa en la suposición de que podemos diferenciar de manera confiable el texto escrito del texto que se originó como discurso y está pidiendo una evaluación de las personas en la industria que confían en los productos NLP / NLU (no desarrollarlos) para lograr ciertos objetivos.
Por ejemplo, si ejecuta un centro de atención telefónica y tiene un sistema IVR (respuesta de voz interactiva), se inclinará a decir que es más valioso mejorar la NLU del texto basado en voz junto con la información generada desde la acústica señal (emociones, longitud de los espacios entre las palabras), para que el IVR pueda predecir cuándo un cliente está enojado y escalar la llamada directamente a un representante de servicio.
Por el contrario, si usted es un profesor de literatura que estudia el uso de verbos modales (“deseo”, “esperanza”, etc.) en la literatura del siglo XX, es más probable que apoye el desarrollo del texto escrito PNL.
Sin embargo, ahora considere el caso de una persona que estudia el “sentimiento” de los tweets a raíz de algún “evento importante” como el súper tazón. Los datos no serían tan claros como las personas pueden usar sus motores de voz2 en sus teléfonos para twittear o podrían escribir sus tweets (junto con todas las otras opciones como compartir un enlace a través de Twitter, etc.) aunque diría que todos ninguna modalidad de entrada de voz se basa en la escritura). Aquí, nos veríamos obligados a clasificar todos nuestros tweets de acuerdo con la forma en que fueron ingresados ​​(si tenemos suerte, los obtenemos como metainformación) o tendríamos que abolir la distinción y tratarlos como uno.

La señal del habla en sí es un juego de pelota completamente diferente.

More Interesting

¿Existe una versión de objetivos múltiples de regresión logística, regresión lineal, SVM, PCA, K-means o algún otro algoritmo de aprendizaje automático?

¿Puedo usar el aprendizaje profundo o ANN para un problema de agrupación como KNN?

¿Existe una diferencia práctica y significativa entre los términos 'función objetivo' y 'función de pérdida' en el aprendizaje profundo?

¿El aprendizaje de refuerzo se convertirá en un tema candente en ML después del éxito de AlphaGo? ¿Qué preguntas importantes de investigación en RL aún no tienen una buena respuesta?

¿Cuántos temas de matemáticas me mejorarán en el aprendizaje automático?

¿Qué quieres decir con optimización?

¿Cuál es la intuición para usar tocones de decisión en el aprendizaje automático?

Cómo elegir el modelo correcto con la distribución correcta

¿Qué es el 'aprendizaje automático de crowdsourcing'?

¿Debo aprender el aprendizaje automático y el desarrollo de aplicaciones de Android simultáneamente? En caso afirmativo, ¿a qué lenguaje (s) de programación debo recurrir?

¿En qué áreas podría el aprendizaje automático ayudar a las personas a tomar decisiones imparciales?

Soy un hombre de 25 años que estudió CS, aprendizaje automático y minería de datos para mi maestría. Mi verdadera pasión radica en la música y los viajes. He estado sin trabajo durante 7 a 8 meses, solicito un doctorado en ML y música, y mi papá quiere que consiga un trabajo. ¿Qué debo hacer?

¿Cuál es la mejor biblioteca de aprendizaje profundo en la etapa actual para trabajar en grandes datos? ¿Cuáles son algunas alternativas para las bibliotecas a gran escala?

¿Cómo calcula la regresión logística de liblinear los gradientes (por ejemplo, diferenciación numérica o automática)?

¿Puede el aprendizaje automático ayudar en la detección de malware? ¿Cuáles son los cuellos de botella en tal implementación de ML?