Audio digital: amplitud, frecuencia, ruido y normalización
Martes, 20 de Septiembre de 2005
El sonido se propaga en forma de ondas, y en nuestros PCs podemos visualizarlas y tratarlas para ajustar su volumen o eliminar las interferencias que le restan nitidez. En este artículo presentamos las bases teóricas del audio digital, junto con algunos consejos prácticos para mejorar la calidad de nuestras grabaciones.
Contenidos de este artículo
- El sonido y su propagación
- Amplitud y frecuencia
- El sonido en el audio digital
- Reducción de ruido
- Amplificar vs. Normalizar
- Referencias
El sonido y su propagación
El sonido es una perturbación que se propaga a través de un medio físico, ya sea éste el aire, el agua, un sólido… pero siempre se necesita un medio físico, es decir, el sonido no se propaga en el vacío. Cuando esta perturbación llega a nuestros oídos, el tímpano la recibe en forma de vibraciones, que son amplificadas mediante los huesecillos del oído y transmitidas a través del caracol, en el oído interno; finalmente alcanzan unas fibras elásticas conectadas a las terminaciones nerviosas que son las que producen la sensación sonora en el cerebro.
Esas perturbaciones se propagan en forma de ondas sonoras, en las que podemos distinguir dos magnitudes que son las que definen la forma y tamaño de la onda: la amplitud y la frecuencia.
Amplitud y frecuencia
La amplitud define la intensidad de la onda, su “altura”, y normalmente puede proporcionarnos una medida del volumen del sonido, aunque hay que tener en cuenta que el volumen con que percibimos un sonido es algo subjetivo y que depende también de otros factores como la frecuencia.
La frecuencia, como su propio nombre indica, nos da una medida del número de ondas que podemos encontrar en un determinado tiempo, es decir, si se producen más ondas en una misma unidad de tiempo, tendremos un sonido de mayor frecuencia, y por lo tanto un tono más agudo; los tonos más graves corresponden a frecuencias menores. La frecuencia se mide en hertzios (ciclos por segundo).
Estas dos magnitudes combinadas dan lugar a la forma de onda compleja que vemos en cualquier programa de edición de sonido, con sus altos, sus bajos y sus variaciones. Si vemos la onda como un todo, es fácil observar las variaciones de amplitud -de altura-, mientras que al hacer “zoom” para “acercarnos” a la onda, veremos que unas veces las ondas están más juntas y otras más separadas, lo que nos indica de alguna manera las variaciones en la frecuencia. En la práctica, lo que vemos nunca serán ondas perfectamente uniformes (con una cresta y un valle), sino ondas de formas variadas, debido a que en realidad el sonido está compuesto de muchas ondas superpuestas de amplitudes y frecuencias muy diversas.
El sonido en el audio digital
En el audio digital, las variaciones de amplitud y de frecuencia se recogen en forma de números, analizando la onda de sonido original y tomando valores a lo largo del tiempo para “anotar” en qué altura está la onda en cada instante. Para indicar esa altura se divide la escala en una serie de tramos que corresponderán a unos valores numéricos entre 0 y el número máximo de tramos que estemos considerando.
Ese número máximo de tramos está definido por los “bits” de sonido con los que estemos trabajando. Así, con 8 bits podemos tener hasta 256 (28) valores posibles (entre 0 y 255), mientras para un sonido de 16 bits tenemos 65536 (216). Esto significa que al trabajar con 16 bits la precisión que obtenemos al reproducir el sonido original es mucho mayor, y por lo tanto la calidad será normalmente mejor.
Pero además de tener distintas escalas de altura, al digitalizar un sonido también podemos tomar muestras de esa altura con mayor o menor frecuencia. Esto es lo que se denomina la “frecuencia de muestreo” (no confundir con la frecuencia del sonido), que indica cuántas medidas del sonido que está siendo digitalizado llevamos a cabo en un segundo. Así, si tenemos una frecuencia de 44.1 KHz (lo que vulgarmente se llama “calidad de CD”), estamos tomando 44.100 mediciones en cada segundo, lo cual nos da obviamente una precisión y calidad mayores que si estuviéramos trabajando con frecuencias de muestreo más bajas.
Reducción de ruido
Por regla general, el ruido está compuesto por variaciones de amplitud o de frecuencia que se producen de una forma más o menos aleatorias, y que se solapan con la onda principal (que es la que nosotros queremos que se escuche nítidamente). No obstante, la mayoría de los “ruidos” tienen un patrón de frecuencias más o menos bien definido.
El ruido tampoco tiene por qué ser algo aleatorio, con el “fsss” característico, sino que también puede ser una onda simple con una frecuencia definida: por ejemplo, cuando se produce una interferencia por culpa de la red eléctrica debido a un mal aislamiento, podemos escuchar un ruido sordo que corresponde con una onda simple de 50 Hz. (la frecuencia de la red eléctica en España; en otros países sería de 60 Hz.).
Para reducir el ruido, ya sea el de la red eléctrica o el más habitual ruido aleatorio, se utilizan los filtros de ruido, que pueden ser de diversos tipos dependiendo del tipo de interferencia que queramos eliminar; incluso existen filtros para eliminar o reducir chasquidos y golpes, aunque su efectividad puede ser relativa.
En el caso del ruido de fondo, éste procede de muy diversas fuentes, como pueden ser el ventilador del ordenador o las paredes (que sirven como “espejo” para el sonido), o simplemente del aire que circula a nuestro alrededor sin que apenas lo percibamos y que el micrófono recoge amplificado. Todos estas fuentes producen un patrón de ruido específico que puede ser examinado por el filtro de ruido para, a continuación, ser eliminado de la onda principal.
Uno de los filtros de ruido más comunes sirve precisamente para eliminar ese ruido de fondo que recogen los micrófonos mientras grabamos. Para ello, se analiza primero un segmento de nuestra grabación que sólo contenga ruido -es una buena práctica dejar grabar unos segundos sin decir nada-, para así localizar cuáles son las frecuencias que contiene ese ruido y cuál es su amplitud. A continuación, se selecciona la onda completa y se le dice al programa que elimine esas frecuencias de la onda completa.
Sin embargo, hay que tener en cuenta que, como es lógico, el ruido contiene también parte de las frecuencias de nuestra voz, y por ello al eliminarlas queda esa especie de sonido metálico muy característico.
Amplificar vs. Normalizar
Cuando grabamos desde un micrófono es bastante habitual que el nivel de amplitud de nuestra grabación sea muy bajo, lo que significa que el volumen será también bajo y necesitaremos “subirlo” para escuchar con claridad. Para eso, una opción es utilizar la función “amplificar” del programa de edición de audio.
Sin embargo, si amplificamos demasiado podemos llegar a “salirnos” del 100% del rango de medidas permitidas por el programa para la amplitud; en ese caso, no puede hacer otra cosa que recortar el sonido, haciendo que las crestas y valles de la forma de onda queden cortados, lo que produce un efecto de distorsión muy característico.
Para evitar esto y ajustar la amplitud de la onda para que se oiga alto y claro, podemos hacer uso de la función “Normalizar”. Lo que hace esta función es analizar primero la onda buscando cuál es el máximo nivel que tiene ahora, y a continuación ajusta la onda completa de modo que ese máximo coincida con el nivel de normalización que nosotros le especifiquemos. Si ese valor de normalización es el 100%, lograríamos aumentar la amplitud al máximo nivel posible sin que se produzcan cortes en la onda.
12 de Febrero de 2007 a las 10:24
Buenos Días:
Soy un Teniente de Navío de la Marina española y he entendido bien la normalización en amplitud pero
me gustaría saber, si es posible qué significa la normalización frecuencial. Es decir, yo trabajo con sistemas(sónares) que además de realizar la normalización en amplitud, tambien realizan la normalización frecuencial ya que son sistemas basados en el efecto doppler y no entiendo bien el concepto. Muchas gracias.
12 de Febrero de 2007 a las 10:24
Buenos Días:
Soy un Teniente de Navío de la Marina española y he entendido bien la normalización en amplitud pero
me gustaría saber, si es posible qué significa la normalización frecuencial. Es decir, yo trabajo con sistemas(sónares) que además de realizar la normalización en amplitud, tambien realizan la normalización frecuencial ya que son sistemas basados en el efecto doppler y no entiendo bien el concepto. Muchas gracias.
20 de Marzo de 2008 a las 19:59
Muy buena la página, también estoy muy interesdo en la ciencia y sobre todo en el sonido y el audio. Ánimo a todos para que sigais así y nunca pareis.
Hasta pronto.
Ah, la dirección de mi sitio, por si le quereis hechar un ojito, gracias y hasta la vista:
http://musicalwars.blogspot.com/
21 de Marzo de 2008 a las 1:55
Jorge: gracias por los ánimos, aunque lo cierto es que esto lleva parado desde hace mucho… Pero algún día volveremos, espero que más pronto que tarde