Este capítulo contiene información procedente de la experiencia personal, también de «The Internet Society». Alguna información expuesta procede de:

16.1-¿Fraunhofer? ¿Lame? ¿mp3?

16.2-Compresión Mp3. Un estudio de radio.

16.3-Compresión Mp3. Equipos portátiles.

16.4-Compresión Mp3. Locales de difusión.

16.5-Compresión Mp3. Estudios de grabación.

 

 Puedes descargar este tema en versión pdf, de forma gratuita.

 

6.1-¿Fraunhofer? ¿Lame? ¿mp3?

Finalizando el mes de diciembre de 2012, prácticamente todo el mundo ha escuchado la palabra «mp3». De los que conocen esa palabra, calculo que al menos un 25% desconoce exactamente el proceso de compresión de audio a este formato. La razón más obvia es porque estas personas prácticamente no han realizado ese proceso de compresión logarítmica. Un porcentaje muy elevado (quizás un 80%) de la música que circula por las redes está ya comprimida en mp3 y hoy en día existen muchísimos programas capaces de realizar la compresión tan sólo detectando el CD.

¿Qué necesidad tenemos de comprimir a mp3? La única ventaja razonable es por su ocupación de espacio en los discos duros o reproductores de audio. Efectivamente cuando guardamos en *.wav (formato nativo de Windows) nuestra música, nos damos cuenta que prácticamente un minuto de audio ocupan unos 10Mb’s. Su homólogo para Mac es el *.AIFF.

Tanto el formato *.wav como el *.aiff, son formatos de audio sin compresión de datos; es decir, sin pérdida. El gran problema de todo esto es la cantidad de espacio necesario para poder conservar nuestra fonoteca en los discos duros, o la cantidad de tiempo necesaria para poder descargar audio con un considerable tamaño. Hoy en día existen conexiones de banda ancha lo suficientemente rápidas para hacerlo, pero hace unos años eran prácticamente inexistentes (el streaming no era viable).

Para no extenderme mucho sobre este aspecto del formato mp3 os recomiendo este interesante artículo de Wikipedia.

Para comprimir en mp3 disponemos de dos tipos de codecs: Fraunhofer y Lame. El formato Mp3 de Fraunhofer es un sistema de compresión perceptual. El término perceptual se refiere a que trabaja siempre en relación a la percepción humana, buscando sólo los datos que nuestro oído puede percibir y desechando el resto. Mientras más detallado sea ese esquema sonoro, más datos tendrá que almacenar.

El sonido estándar utilizado, normalmente, es de 16 bits estereofónicos a una frecuencia de 44100Hz. Esta es la calidad de un Cd de audio tradicional. En este formato, cada muestra de 1 segundo ocuparía 1’4 Mb en «disco duro»

El formato Mp3 de Lame podemos decir que funciona con el mismo criterio, pero nos dá unos resultados aparentemente de mejor calidad. ¿Es entonces mejor que Fraunhofer? No sabría decir con exactitud. Dependiendo del tipo de audio a comprimir, el codec de Lame me ha dado resultados de mejor calidad. Pero, puestos a ponernos «rigurosos», no creo que haya muchas personas en este planeta capaces de diferenciar con una simple escucha la calidad (a 320 kbps -máxima calidad) de una misma canción o sonido. Todo dependerá, como dije antes, del tipo de música o sonido. Un grandioso colchón de cuerdas quedará mejor con Lame, pero sólo lo notarás cuando, a través de un programa de edición de audio que disponga de barrido espectral, lo tengas en «pantalla». Para más información sobre este codec puedes visitar este artículo de Wikipedia.

 

16.2-Compresión Mp3. Un estudio de radio.

La emisión de radio en FM tiene una frecuencia de muestreo baja, 11Khz por canal. Por tanto, para almacenar más canciones en menos espacio, deberíamos muestrear a esas frecuencias para eliminar todo lo que no es posible escuchar, ya que la emisión FM lo recortará. De todas formas, hay que tener en cuenta que el sonido original siempre debe poseer una calidad superior a la del siguiente filtro que lo procese. En este caso, el filtro de Frecuencia Modulada. En una emisión FM, para obtener una cierta calidad, es aconsejable convertir la muestra a 32KHz (16Khz por canal), que nos da margen antes de la mezcla final del filtro.

En el caso de que la emisión se desee realizar en estéreo, podemos ahorrar cierto ancho de banda utilizando el parámetro «joint-estéreo».

En la mayoría de los equipos musicales tan sólo hay un subwoofer, y normalmente la música no da una impresión de tridimensionalidad. En estas frecuencias demasiado bajas o altas, el oído no tiene una percepción real del sonido. El formato Mp3 tiene la capacidad de utilizar el sistema IS (Intensity Stereo). Algunas frecuencias son grabadas en monoaural, ya que el equipo destino difícilmente puede representarlas.

En el caso de necesitar un poco más de calidad y aumentar esa percepción tridimensional del sonido, se puede combinar el modo IS del joint-stereo con la opción «Mid-side stereo», que consiste en guardar los dos canales mezclados y guardar solamente la información de diferencias entre ellos. Como conservamos esas diferencias, mantenemos buena parte del surround que teníamos en origen.

Como nuestra intención es ahorrar espacio para acumular la mayor cantidad de temas sin perder calidad de emisión, nuestro «bitrate» ha de ser discreto. 96Kbits/s es más que suficiente para una emisión FM de calidad. En un estudio de radio FM, un perfil adecuado consistiría en comprimir a 22Khz de frecuencia con un bitrate de 96Kb/s y utilizando en modo joint-stereo.

Sin tener en cuenta el joint-stereo, un segundo de muestra ocupa 96Kb, dos canales de 48Kb, respecto a 1’4Mb que sería la muestra original. Otra opción que proporciona suficiente calidad en poco espacio es el VBR (Variable Bitrate), que consiste en aumentar o disminuir el bitrate según la complejidad del sonido.

 

16.3-Compresión Mp3. Equipos portátiles.

La mayoría de equipos de reproducción Mp3 portátiles, al estar conectado a un medio de reproducción analógico como son los auriculares o los altavoces de escritorio, suenan perfectamente a 128Kb/s, con una frecuencia de 44K1Hz. Los altavoces difícilmente reproducirán el sonido con mejor calidad, por tanto, es más que suficiente. Aún así, suelen perderse las frecuencias superiores a 15KHz.

 

16.4-Compresión Mp3. Locales de difusión.

Cuando se trata de sonido profesional, tenemos un especial interés en que la respuesta sea lo más fiel posible al original y, por tanto, tendremos mucho menos ahorro de espacio, pero éste será considerable de todos modos. Cuando comprimimos a 128Kb/s estamos perdiendo un rango de frecuencias importante, las respuestas por encima de los 17KHz son malas. Además, el estéreo pierde el surround si está activado el joint-stereo. Para obtener sonidos que respeten al máximo el sonido original, necesitaremos utilizar un bitrate mayor para que sea más preciso. Cuando trabajamos a 192Kb/s, por ejemplo, la onda es muy similar a la original, aunque no exacta. El oído difícilmente podría distinguirlo, pero existe una pérdida. Este bitrate sería adecuado para una discoteca.

 

16.5-Compresión Mp3. Estudios de grabación.

En los estudios de grabación, para almacenar piezas originales (masters) existen formatos mejores que el Mp3 (wav, iff, aiff, por ejemplo). Pero para almacenar muestras temporales para su posterior uso en un multipistas, por ejemplo, el formato Mp3 es ideal.

A 256Kb/s obtenemos una respuesta tan parecida al original que es casi imposible distinguirlos. El sonido es muy fiel a la muestra original, y el ahorro de espacio, aunque mucho menor, es también considerable.

Sin embargo, si trabajamos a 320Kb/s, aunque la fidelidad es casi perfecta, la diferencia entre ésta y la onda generada a 256Kb/s es tan mínima que casi es inapreciable. Estamos perdiendo calidad a partir de los 20Khz, que son el límite físico de la mayoría de periféricos de audición y de nuestros oídos.

En el sonido profesional no es recomendable utilizar el parámetro VBR, ya que la diferencia entre la onda original y el resultado suele ser bastante apreciable.

 

NOTAS.

 11025 Hz Sample rate = Calidad de discurso.

22050 Hz Sample rate = Calidad de radio FM.

32075 Hz Sample rate = Calidad de cinta.

44100 Hz Sample rate = Calidad de CD.

48000 Hz Sample rate = Calidad de DAT.

96000 Hz Sample rate = Calidad de DVD.