¿Cómo se almacenan los archivos de sonido (wav) en binario? La tecnología cambia la vida futura

El sonido se transmite a través del aire como secuencias de cambios rápidos en la presión del aire. Cuando un micrófono detecta sonido, convierte la presión de aire variable del sonido en una señal eléctrica de voltaje variable.

Hay muchos tipos diferentes de micrófonos que involucran diferentes tecnologías para convertir el sonido en señales eléctricas. Un micrófono dinámico, por ejemplo, involucra un pequeño diafragma conectado a una bobina, donde la bobina, suspendida por el diafragma, se cierne alrededor de un imán permanente. Como el sonido hace que la presión del aire varíe sobre el diafragma, el diafragma vibra y hace que la bobina vibre en relación con el imán. Este movimiento entre la bobina y el imán induce voltaje eléctrico en la bobina creando una señal eléctrica que se aproxima a la señal de audio del sonido. Esta señal es una señal eléctrica que varía continuamente, llamada señal “analógica”.

Dado que las computadoras son digitales (no analógicas, procesan valores enteros discretos a intervalos de tiempo discretos), la electrónica de la computadora que procesa la entrada del micrófono (generalmente una tarjeta de sonido) debe convertir la señal analógica de un micrófono en una señal digital. La computadora logra esta conversión muestreando los voltajes de la señal de micrófono analógico, a un número muy alto de muestras por segundo, y mapeando los valores de voltaje muestreados en un rango de enteros, para crear una secuencia de enteros que se aproxima a la señal del micrófono. Esta secuencia de enteros es la representación digital de una señal de micrófono analógico, que podemos llamar una “señal de audio digital”.

Hay dos factores que afectan la calidad de una señal de audio digital, donde el primer factor es la frecuencia de muestreo de la señal de micrófono analógico y el segundo factor es el tamaño del campo de bits utilizado para representar los enteros de una señal de audio digital. Llamemos a estos, “frecuencia de muestreo” y “tamaño de palabra”, respectivamente (en informática, un byte es un número entero de 8 bits y una palabra es un número entero de 16 bits o mayor, sin embargo, en los últimos tiempos la palabra ha llegado a significa cualquier computadora representada con un número entero de cualquier tamaño. Entonces, ahora solo decimos “palabra de n bits”. Por ejemplo, un píxel RGB es una palabra de 24 bits. Un byte es una palabra de 8 bits). Por lo tanto, un archivo de sonido almacena una secuencia de enteros de un determinado tamaño de palabra, muestreados a una determinada frecuencia de muestreo, a partir de una señal de micrófono analógico.

Por convención, una señal de audio digital puede incluir tamaños de palabra de 4, 8, 16, 24 o 32 bits, donde 24 bits tiene calidad de CD. Además, las frecuencias de muestreo para una señal de audio digital son 44.1 kHz (CD), 48 kHz, 88.2 kHz o 96 kHz. Es fácil ver que se necesitará más memoria de la computadora para una señal de audio digital con un tamaño de palabra más grande y una frecuencia de muestreo más alta.

Espero que esto haya ayudado. Haga cualquier pregunta adicional que pueda tener en un comentario.

BinarioComputación cuánticaElectricidadinformáticaSonido