Usted pregunta: ¿Los sonidos de alta frecuencia consumen más espacio de memoria en la computadora? ¿Qué pasa con una mayor amplitud (volumen)?
Supongamos que muestreas un sonido usando la modulación de código de pulso, para reproducirlo más tarde (que es la forma común de hacerlo, menos la compresión de datos a través de varios algoritmos con pérdida y sin pérdida).
Si desea poder reproducirlo más tarde con suficiente fidelidad (y minimizar la distorsión), debe tener en cuenta:
- ¿Cómo es tomar CS 224N (procesamiento del lenguaje natural) en Stanford?
- ¿Es posible que un modelo de Machine Learning sobreajuste y subadapte simultáneamente los datos de entrenamiento?
- ¿Se puede superar el problema del envejecimiento de la población de Europa aumentando el uso de la inteligencia artificial?
- ¿Cuál es el futuro de la informática estocástica y aproximada?
- Cómo escribir una solución Bactrack de un problema
- cuántas muestras se toman por segundo (es decir, la frecuencia de muestreo);
- qué tan precisa es cada muestra (es decir, cuántos bits por muestra)
El teorema de muestreo de Nyquist-Shannon, en síntesis extrema, dice que para representar una frecuencia f a través de muestras, necesita muestrearla a una frecuencia que sea al menos el doble que esa frecuencia (en realidad más que eso, o obtienes distorsión). Por ejemplo, para muestrear adecuadamente un sonido que (puede) contiene frecuencias de hasta 22KHz, debe muestrearlo al menos a 44KHz (esto significa: tomar 44000 muestras por segundo).
Ahora, en algún tipo de sonido, las frecuencias altas no son tan importantes. Por ejemplo, las frecuencias de voz humana en las llamadas de voz del teléfono no son tan altas, y dado que una llamada telefónica es principalmente voz humana, puede saltearla con solo 8KHz, aplicar filtros, reducir el muestreo a 4KHz y aceptar cierta distorsión en la reproducción.
Pero en otro tipo de sonidos (grabación de música clásica, por ejemplo), las frecuencias altas son importantes y mantener la distorsión al mínimo es importante, por lo que la frecuencia de muestreo debe ser necesariamente mucho más alta que eso.
Un compromiso que parecía lo suficientemente bueno fue el que se usó en los discos compactos, con 44100 muestras por segundo (en reproducción).
Entonces, las frecuencias son importantes, ya que más muestras ocupan más espacio en la memoria .
Y luego está el otro aspecto: ¿qué tan precisa debe ser cada muestra (es decir, cuántos bits debemos usar para representar una muestra)?
En aquellos días tenía un Commodore 64 con una grabadora de cassette (y una unidad de disquete 154I, pero esa es otra historia).
Lo importante es que la grabadora tenía una línea que se conectaba directamente a la CPU (un MOS 6510), y si los niveles en esa línea estaban por encima de cierto umbral, un cierto bit en la memoria (en realidad un registro en la CPU que apareció como memoria) mágicamente se convierte en 1, mientras que volvió a cero una vez que el nivel cayó por debajo de ese umbral.
Y funcionó de otra manera también, para grabar en cinta (la dirección fue establecida por un bit diferente).
Esto se usó para implementar programas de grabación y lectura en un cassette de audio compacto ordinario (bastante ubicuo en ese entonces).
Pero esto significaba que también podría poner un cassette de música en la grabadora, presionar play e intentar “muestrearlo” a través de ese único bit.
Esto efectivamente me dio un tamaño de muestra de 1 bit.
La CPU Commodore 64 funcionaba a aproximadamente 1MHz, y un programa que leía ese bit y almacenaba su valor en la memoria en ubicaciones posteriores no requería mucho más que unas pocas decenas de ciclos de CPU para cada muestra.
Esto significaba que podía muestrear a (digamos) 50KHz, pero solo tenía muestras de 1 bit. Al reproducir, la distorsión era horrible, pero la música aún era reconocible.
Las muestras de 1 bit tomadas a 50 kHz se pueden visualizar como una imagen en blanco y negro (sin sombras grises) con una alta resolución.
Obviamente, las cosas en ese caso mejorarán dramáticamente si tiene, digamos 8 bits por muestra (256 niveles de gris), e incluso mejor si tiene más (hasta cierto punto). Y eso funciona de manera similar para los sonidos.
En el caso de los discos compactos de audio, tiene muestras de 16 bits (bueno, en realidad pares de muestras de 16 bits debido a la estereofonía), y para la reproducción generalmente se considera lo suficientemente bueno.
Por lo tanto, el tamaño de la muestra es importante, porque significa más precisión . Más bits por muestra ocupan más espacio en la memoria.
Tenga en cuenta que dije precisión : la amplitud se puede escalar fácilmente hacia arriba y hacia abajo principalmente a voluntad, por lo que el tamaño de la muestra realmente no importa en este caso porque los niveles de sonido se pueden llevar fácilmente dentro de los rangos deseados. Lo que marca la diferencia es la precisión en la medición de los niveles dentro del rango de muestreo.