En todas nuestras tarjetas de sonido encontraremos una referencia a la frecuencia de muestreo y a la profundidad de bits con la que trabajan. Cosas como 24 bits/ 196 Khz o 16 bits/ 48 Khz, son habituales en las especificaciones técnicas. Pero ¿qué significa esto realmente? Y lo más importante ¿cómo afecta a la calidad de nuestro sonido?

Para responder a esta pregunta tenemos primero que acompañar al sonido en el viaje que va desde nuestros instrumentos o micrófonos hasta que llega a nuestra computadora y realizamos alguna transformación o procesamiento en él.

El mundo del audio analógico

El sonido nos rodea en forma de vibraciones en el aire que nos circunda. Cuando hablamos, cantamos, o tocamos nuestra guitarra, se producen estas vibraciones en el aire que llamamos sonido.

Los transductores de audio comunes como los micrófonos, convierten esa vibración del aire en energía eléctrica. En sentido contrario, las señales eléctricas se pueden convertir mecánicamente en vibraciones acústicas, por ejemplo, un voltaje eléctrico amplificado puede mover el cono de un altavoz, produciendo sonido, es decir, una vibración en el aire.

Audio analógico

Se denomina audio analógico a esta transformación eléctrica del sonido, debido a que la onda eléctrica tendría una semejanza o analogía con la onda sonora en el aire a la que estaría, hasta cierto punto, imitando.

Onda sonora-onda eléctrica -Frecuencia de muestreo
Onda sonora – Onda eléctrica

Una vez que el sonido se ha transformado en una señal eléctrica, diferentes tipos de dispositivos pueden transmitir y almacenar una representación del sonido, ya sea en formato analógico o digital.

Algo es análogo a otra cosa si las dos son comparables de alguna manera. El término análogo en relación con el sonido se refiere a la variación continua de la señal eléctrica que representa las variaciones originales de la presión del aire de un sonido.

En realidad, la señal es aproximada, no es una perfecta representación de la fuente original. Ello es debido a las limitaciones de los transductores que se utilizan en el mundo real, como los micrófonos.

A pesar de todo, las variaciones de tensión (la señal analógica) será bastante parecida a las variaciones originales en la presión del aire (el sonido).

El mundo del audio digital

Las señales analógicas son sensibles al ruido y a la pérdida de calidad cuando se transmiten y copian. Además sin digitalizar no tenemos acceso a la flexibilidad que el procesamiento digital de señales nos ofrece.

Dado que los ordenadores son esencialmente sofisticadas máquinas de realizar operaciones aritméticas, no se puede utilizar un ordenador para trabajar con el sonido a menos que se conviertan las señales analógicas de audio en números.

La solución es utilizar una corriente de números para representar la señal analógica en lugar de utilizar la señal analógica directamente.

Conversión analógico-digital

Para convertir el rango continuo de voltaje analógico en forma numérica, una tarjeta de sonido utiliza un dispositivo llamado convertidor analógico-digital (A/D).

Un convertidor digital traduce un voltaje continuo analógico en valores numéricos discretos, siguiendo una serie de pasos:

Conversión de una señal analógica a digital - Frecuencia de muestreo
Conversión de una señal analógica a digital
  1. La entrada que llega al convertidor es una señal eléctrica analógica, que tiene un nivel continuamente variable análogo a las variaciones en la presión del aire en el sonido original.
  2. El convertidor es capaz de traducir estos datos en una “red” de posibles números discretos: en el eje “x”, el tiempo, una serie de instantáneas por segundo, y en el eje “y”, la fuerza de la señal, un cierto número de valores numéricos para cada una de esas instantáneas.
  3. El convertidor digital deberán redondear los niveles continuos de la señal analógica a estos valores numéricos.
  4. Esto se traduce en una señal digital que modela la señal analógica original como una serie de números.

Cualquier sistema de audio que utilice los números para almacenar, procesar y transmitir datos es llamado digital.

El convertidor A/D convierte la señal en forma digital, después de lo cual se puede procesar o almacenar en el ordenador. Pero también necesitamos una manera de conseguir que los datos digitales vuelvan de nuevo a la forma de un voltaje analógico. De lo contrario, no seríamos capaces de conducir estos datos a los auriculares y los altavoces para convertirlo de nuevo en sonido.

Un convertidor digital a analógico (D/A) (a veces denominado DAC) hace justamente lo contrario de lo que el A/D. El D/A convierte los datos digitales a un voltaje analógico continuo.

Calidad del audio digital

Varios elementos trabajan juntos para definir el proceso de muestreo:

  • La frecuencia con que el convertidor toma una muestra (la frecuencia de muestreo)
  • La precisión con la que puede representar una muestra como un número (la profundidad de bits).

Es importante en cualquier dispositivo de captura digital, como nuestras tarjetas de sonido, grabar la información suficiente para proporcionar un registro exacto de la señal sonora.

La frecuencia de muestreo que elijas determina cuánto rango de frecuencia puedes grabar, y la profundidad de bits determina, con precisión, la forma en que puedes registrar cambios en el nivel de la señal analógica; lo que repercute en el rango dinámico y, por tanto, en la cantidad residual de ruido en la señal.

Frecuencia de muestreo y rango de frecuencia

Muestras individuales vistas en un editor de audio - Frecuencia de muestreo
Muestras individuales vistas en un editor de audio

La velocidad de muestreo es la frecuencia con que el convertidor A/D mide el nivel de la señal. Las muestras son, a grandes rasgos, análogas a una serie de instantáneas. Si el convertidor toma diez muestras de la señal cada segundo, tiene una velocidad de muestreo de 10 Hz.

El rango de frecuencia de un convertidor A/D está determinado por la frecuencia de muestreo. La frecuencia más alta que se puede captar es sólo la mitad de la frecuencia a la que funciona el convertidor.

Por ejemplo: una frecuencia de muestreo de 10 Hz puede capturar un máximo de 5 Hz de frecuencia, no de 10 Hz.

De acuerdo con el teorema de Nyquist-Shannon, para muestrear frecuencias hasta el límite superior del oído humano (que se sitúa en unos 22000 Hz), necesitamos una frecuencia de muestreo de alrededor de 44000 Hz, que es, no por casualidad, la tasa normal de muestreo para CDs de audio comercial.

Profundidad de bits y rango dinámico

La frecuencia de muestreo nos indica cómo un convertidor A/D trabaja en el tiempo, y por lo tanto la manera en que capta la información de la frecuencia del eje “x” de los diagramas de formas de onda.

La profundidad de bits determina la cantidad de detalle que se puede grabar sobre el nivel entrante de la señal, el  eje “y”, de los diagramas.

Con cada muestra, el convertidor A/D debe medir el nivel de la señal entrante y asignarle uno de entre un grupo de números. Este número procede de la profundidad de bits y el convertidor debe limitarse a estos valores discretos.

Por cada bit añadido, el número de posibles niveles de presión sonora que se pueden almacenar se dobla. Con 16 bits el audio cuenta con más de 65000 niveles posibles de resolución; con 24 bits tiene más de 16 millones de posibles niveles.

El secreto de la profundidad de bits

El impacto directo de la profundidad de bits en la captura de la señal se produce sobre el rango dinámico: cuanto mayor sea la profundidad de bits, mayor rango de dinámica o niveles de amplitud que se pueden capturar antes de que la señal se sumerja en el ruido de fondo.

El rango dinámico es obviamente importante, por que define el nivel de rangos dinámicos que nuestros oídos pueden escuchar. Pero además evita que los errores creados por el redondeo de los números (errores de cuantización) acaben escuchándose como ruido.

Frecuencias de muestreo y profundidades de bits habituales

Haciendo un resumen de lo dicho hasta ahora la resolución del audio digital se mide en términos de:

  • Frecuencia de muestreo (relacionada con el rango de frecuencias del sonido y medida en kHz)
  • Profundidad de bits (relacionada con la amplitud y se mide en bits).

Estos valores son más o menos equivalentes a la resolución de una imagen y a la profundidad de color en los gráficos digitales. Cualquier número es teóricamente posible para estos valores, y se pueden mezclar y combinar frecuencias de muestreo y profundidades de bits, pero las configuraciones que encontrarás la mayoría de las veces son:

  • 16 bits/ 44,1 kHz: El estándar para CD de audio comercial. También se usa para CD-Rs de consumo y es la más común para el software de audio de ordenador.
  • 16 bits/ 48 kHz: El estándar para el vídeo digital (DV), videos DVD comerciales, y radiodifusión de vídeo digital.
  • 24 bits/ 96 kHz: El formato emergente de alta resolución cada vez más soportado por software y hardware de audio, aunque todavía no se ha generalizado como un estándar en el mercado de consumo para escuchar música.

Finalmente: ¿Qué frecuencia de muestreo utilizo?

Puede parecer un contra sentido trabajar con audio capaz de manipular frecuencias que están por encima de la más alta que los seres humanos podemos escuchar.

Sin embargo, existen tres razones por las cuales podríamos querer utilizar frecuencias de muestreo de hasta 96 kHz o mayores:

Tres razones para usar una frecuencia de muestreo mayor

  1. La primera razón, aunque es debatida, es que las frecuencias inaudibles superiores a 22 kHz pueden tener un impacto en el espectro audible, procesando el audio a 96 kHz el sonido suena mejor o más preciso que a 44,1 kHz. Sin embargo, es una cuestión de opinión: algunos afirman que se puede escuchar, otros que no.
  2. La segunda razón es más concreta: algunos algoritmos de audio digital, en particular los relacionados con procesamientos intensivos numéricos como el estiramiento y el cambio de tono, logran mejores resultados cuando se tienen más datos.
  3. La tercera razón es igualmente importante: aunque es discutible si las frecuencias altas influyen directamente en el espectro audible de un modo significativo, la distorsión de fase introducida por el filtro anti-aliasing es mucho menos probable que se produzca en el rango de frecuencias audibles cuando la tasa de muestreo es mayor.

La ausencia de esta distorsión puede resultar en un sutil pero notable cambio en la percepción de la claridad. Esto no significa que debamos ponernos a grabar todo a 96 kHz, sobre todo teniendo en cuenta que será costoso en espacio en el disco duro y capacidad de procesamiento.

Pero sí significa que existe alguna diferencia entre las frecuencias de muestreo, y que hay una razón por la cual los estudios profesionales pagan un buen dinero por equipos que pueden operar a las más altas frecuencias de muestreo posibles.

…Y por último sólo me queda desearte una feliz grabación.

Puedes encontrar la UM2, por su puesto, a su mejor precio en Amazon haciendo clic aquí.

También te podría interesar:

¡Comparte el artículo!

Deja una respuesta