¿Cómo se almacenan los archivos de sonido (wav) en binario?

El sonido se transmite a través del aire como secuencias de cambios rápidos en la presión del aire. Cuando un micrófono detecta sonido, convierte la presión de aire variable del sonido en una señal eléctrica de voltaje variable.

Hay muchos tipos diferentes de micrófonos que involucran diferentes tecnologías para convertir el sonido en señales eléctricas. Un micrófono dinámico, por ejemplo, involucra un pequeño diafragma conectado a una bobina, donde la bobina, suspendida por el diafragma, se cierne alrededor de un imán permanente. Como el sonido hace que la presión del aire varíe sobre el diafragma, el diafragma vibra y hace que la bobina vibre en relación con el imán. Este movimiento entre la bobina y el imán induce voltaje eléctrico en la bobina creando una señal eléctrica que se aproxima a la señal de audio del sonido. Esta señal es una señal eléctrica que varía continuamente, llamada señal “analógica”.

Dado que las computadoras son digitales (no analógicas, procesan valores enteros discretos a intervalos de tiempo discretos), la electrónica de la computadora que procesa la entrada del micrófono (generalmente una tarjeta de sonido) debe convertir la señal analógica de un micrófono en una señal digital. La computadora logra esta conversión muestreando los voltajes de la señal de micrófono analógico, a un número muy alto de muestras por segundo, y mapeando los valores de voltaje muestreados en un rango de enteros, para crear una secuencia de enteros que se aproxima a la señal del micrófono. Esta secuencia de enteros es la representación digital de una señal de micrófono analógico, que podemos llamar una “señal de audio digital”.

Hay dos factores que afectan la calidad de una señal de audio digital, donde el primer factor es la frecuencia de muestreo de la señal de micrófono analógico y el segundo factor es el tamaño del campo de bits utilizado para representar los enteros de una señal de audio digital. Llamemos a estos, “frecuencia de muestreo” y “tamaño de palabra”, respectivamente (en informática, un byte es un número entero de 8 bits y una palabra es un número entero de 16 bits o mayor, sin embargo, en los últimos tiempos la palabra ha llegado a significa cualquier computadora representada con un número entero de cualquier tamaño. Entonces, ahora solo decimos “palabra de n bits”. Por ejemplo, un píxel RGB es una palabra de 24 bits. Un byte es una palabra de 8 bits). Por lo tanto, un archivo de sonido almacena una secuencia de enteros de un determinado tamaño de palabra, muestreados a una determinada frecuencia de muestreo, a partir de una señal de micrófono analógico.

Por convención, una señal de audio digital puede incluir tamaños de palabra de 4, 8, 16, 24 o 32 bits, donde 24 bits tiene calidad de CD. Además, las frecuencias de muestreo para una señal de audio digital son 44.1 kHz (CD), 48 kHz, 88.2 kHz o 96 kHz. Es fácil ver que se necesitará más memoria de la computadora para una señal de audio digital con un tamaño de palabra más grande y una frecuencia de muestreo más alta.

Espero que esto haya ayudado. Haga cualquier pregunta adicional que pueda tener en un comentario.

Los archivos de sonido digital son solo una serie de valores digitales muestreados multicanal almacenados que definen una forma de onda.

Generalmente hay un encabezado que define el número de canales, el intervalo de muestreo y el formato de los valores (longitud de bits, PCM, etc.).

No desea ninguna definición formal, pero las fuentes de Internet le dicen exactamente cómo construir e interpretar dicho archivo. Construí archivos de onda a partir de datos sísmicos muestreados almacenados antes, usando un intérprete BASIC y pude reproducir y escuchar la forma de onda usando un reproductor de audio estándar en Windows. Fue bastante facil.

More Interesting

No entiendo por qué el enredo cuántico no se puede usar para la comunicación. ¿Pueden algunos explicarlo?

¿Qué tan rápido será una computadora cuántica y cuánto tiempo llevará comercializarse?

¿Por qué la teoría de campo cuántico no es más popular que la mecánica cuántica? ¿No tiene más sentido la teoría cuántica de campos que la mecánica cuántica?

¿Cómo explicaría el algoritmo de Grover a un programador profesional?

¿Cuánto tiempo crees que tomará ver el impacto de la Computación Cuántica de Google?

¿Es redundante la ley de Hooke fuera de la teoría cuántica?

¿Cuál es la diferencia entre las computadoras cuánticas y el autómata finito no determinista?

Cómo trabajar en computación cuántica en Google

¿Cuál es el peor escenario posible para la criptomoneda? ¿Podrían las computadoras cuánticas diluir el mercado con más códigos? ¿Me puede recomendar uno?

¿Cómo puede hacer que los datos retengan una partícula de fotón (luz) eliminando la necesidad de hardware y sistemas de big data?

¿La computación cuántica agrega soporte para la hipótesis del multiverso?

¿Cómo puedo aplicar la informática para simular (o calcular) fenómenos en física o química?

¿Cuál es un ejemplo de un sistema cuántico con un número infinito de estados de energía permitidos?

¿Qué lenguajes de programación se usan en la computación cuántica?

Si los campos cuánticos generan materia, ¿qué genera los campos cuánticos? ¿De dónde vienen? ¿Por qué están en todas partes? ¿Son 'espacio-tiempo'?