Cómo usar la red neuronal

Bueno, supongo que entendió mal cómo funciona NN, no son específicos del reconocimiento de imagen, puede usar NN para cualquier problema, siempre que pueda modelar sus datos correctamente con etiquetas.

El reconocimiento de imágenes es bastante común con estas bibliotecas porque, de hecho, es bastante fácil convertir una imagen en datos utilizables para NN. Tiene que encontrar una manera, (no tengo idea de esto), de representar su sonido como datos explotables para tener entrada para entrenar su NN.

Primero debe intentar obtener más información sobre el reconocimiento de voz, por ejemplo, utilizando este pdf: http://cs229.stanford.edu/proj20…

Podrían ser algunas bibliotecas las que transformarían directamente su discurso (sonido) en datos explotables, pero tenga en cuenta que esto no tiene nada que ver con NN, solo se trata de preprocesar los datos.

Espero que haya ayudado

Rafael

Related Content

¿Cómo está transformando el aprendizaje automático la investigación en biociencia?

¿Qué lenguaje de programación se usa para el aprendizaje automático?

¿Cuáles son algunos de los proyectos que uno puede hacer para comprender SVM y los trucos del kernel?

¿Por qué mi modelo de regresión produce valores negativos para SalePrice en los datos de prueba?

Música: ¿Cómo se puede usar el aprendizaje automático para analizar música?

¿Debo usar la validación cruzada k-fold para un clasificador de bosque aleatorio?

¿Hay algún programa en desarrollo que pueda escuchar un idioma y comenzar a aprenderlo, como en Star Trek?

More Interesting

¿Cuáles son las principales diferencias entre econometría y aprendizaje automático?

¿Cómo utiliza Google el aprendizaje automático?

¿Cuáles son las aplicaciones del aprendizaje profundo en la India?

¿Cómo y dónde podemos comenzar a implementar proyectos basados en el aprendizaje automático y qué idioma es preferible para el mismo?

¿Qué es lo que más te gusta del aprendizaje automático?

¿Debo usar la validación cruzada k-fold para un clasificador de bosque aleatorio?

Cómo saber que un modelo de similitud de documentos puede lograr un alto rendimiento / mejor calidad que los otros modelos

¿Qué necesitan saber los desarrolladores de aplicaciones sobre Siri para interactuar con él?

¿Qué significa decir que dos clasificadores son independientes?

¿Cuál es el minimizador de [matemáticas] H [f] = \ sum ^ {N} _ {i = 1} \ | y ^ {(i)} - f (x_i) \ | ^ 2_ {2} + \ lambda \ | Pf \ | ^ 2 [/ math] cuando la salida es un vector?

¿Cómo puede ser posible la IA si las máquinas se limitan a la lógica y el lenguaje?

¿Cuál es la forma completa de AUC en el estado de AUC de los resultados del examen AKTU?

MLconf 2015 Seattle: ¿Cómo funciona la técnica de aproximación simbólica agregada (SAX)?

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿El desarrollo teórico en el aprendizaje automático está llegando a un punto muerto (significa que no habrá necesidad de continuar)?

Web Analytics