Mis Proyectos: BlackmusicLoversIlgreco Labs

El mp3 y los formatos lossless

Se le llama formatos lossless a los formatos de compresión de audio que privilegian la calidad del sonido ante el tamaño del  archivo de audio resultante. Esto, gracias a la masificación de sistemas de hardware de alta capacidad y a la crecida de la velocidad en conexiones a internet, ha logrado popularizarse de gran manera mientras el mp3 cada vez pierde cabida en mundo del audio y la música.

En el mundo profesional, el WAV PCM es y será el formato de audio más ocupado, por su fácil manejo en la codificación y su alto grado de confiabilidad, sin embargo en la música que tenemos en nuestras bibliotecas esto es poco factible, debido a gran espacio en disco que ocupa.

Por lo mismo, desde hace casi 20 años se intenta innovar en este sentido, cuando se creó el MP3 de manos de Moving Picture Experts Group (MPEG), el cual aprovecha las falencias de nuestro sistema auditivo para eliminar datos “irrelevantes”.

Ahora pasaremos a analizar algunos de los métodos de compresión, sus pro y sus contra.

Principalmente la codificación del mp3, reduce el rango dinámico irrelevante y se aprovecha de la incapacidad del sistema auditivo para detectar los errores de cuantificación en condiciones de enmascaramiento, o sea que enmascara los errores de cuantificación con el nivel de sus frecuencias vecinas. Esto se realiza en función de un método llamado “Predicción polinómica”, el cual analiza la señal de audio y predice cual es la cantidad de  ruido de cuantificación que le es posible inducir en función de la frecuencia, obteniendo así un umbral de enmascaramiento, aprovechándose de que a nuestro sistema auditivo le es imposible determinar cambios frecuenciales que estén dentro de un 1/3 de octava, por lo mismo los ecualizadores gráficos tienen bandas de 1/3 de octava.  Este proceso se realiza mediante un análisis discreto mediante una serie de Fourier, a través del algoritmo de la transformada rápida de Fourier (FFT).

Los formatos lossless, término genérico para cualquier tipo de fichero digital que reduzca el tamaño del archivo sin perdida de datos, como por el ejemplo el Flac (Free Lossless Audio Codec) aplican una reducción del tamaño del fichero de audio mucho menor a la que usan los formatos lossy como MP3 o WMA, pero conserva en su totalidad la cantidad de información. En la práctica, los formatos lossless usan un algoritmo en base a la predicción lineal para convertir las muestras en series de pequeños números no correlativos, lo que sumado a la codificación por longitud de pista, que aprovecha los silencios y los lugares donde la representación numérica del audio presenta repeticiones, reducen el tamaño del archivo.

Ejemplo de codificación en PCM, donde en un silencio se usa una cantidad de muestras fijas. Ejemplo de codificación en FLAC, donde se aplica una codificación por longitud de pista, tomando solo una muestra al inicio y una al fin de los datos repetitivos.

Si bien, para oídos no entrenados, la diferencia entre un mp3 codificado a 192kbps versus un formato Lossless escuchados en un sistema casero no es notoria, si los escuchamos y comparamos en un sistema de alta  fidelidad, en un mp3 se notara la ausencia de agudos y los grabes y medios tendrán un ruido, por lo tanto la coloración del sonido será diferente.

Fase de pruebas:

Produciremos un ruido blanco y lo codificaremos en FLAC y luego en MP3. Si analizamos los espectros de frecuencia de un ruido blanco, que tiene la misma cantidad de energía en todas sus frecuencias tendremos esto:

El archivo FLAC  se ve más oscuro que el MP3, debido a que tiene la energía en cada frecuencia de manera uniforme. Además podemos notar que al codificar en MP3 se aplica un filtro “corta altos” de orden prácticamente infinito, con una frecuencia de corte en los 15,5 kHZ, por lo que no existe energía en frecuencias superiores a 15,5 kHz. Debido a que nuestro oído es capaz de percibir frecuencias de hasta los 20 kHZ, esto provocara una perdida de coloración en el sonido resultante al ser escuchados en sistemas de alta fidelidad.

Prueba auditiva

Para esta prueba, usaremos el tema “Airbag” de RadioHead.

Por concepto de acústica, si sumamos dos señales idénticas, pero una invertida en polaridad, deberían cancelarse. Sin embargo, si a un sonido codificado en Flac -en este caso “Airbag” de RadioHead-, le sumamos el mismo sonido codificado en mp3 pero invertido en polaridad, obtenemos lo siguiente:

Lo que escuchan, es todo el sonido que tiene la muestra en Flac pero no tiene el mp3, esto provoca tal perdida de coloración del sonido resultante. Es un ruido, porque tiene energía en todas las frecuencias, que son las frecuencias que la codificación en mp3 elimina.

Conclusión

Si bien los formatos de audio Lossless, como el FLAC o APE realizan una representación muy fidedigna de la señal, para el mundo profesional el WAV PCM continuara siendo el predilecto, debido a que trae consigo una gran confiabilidad.

Para el mundo no profesional, como para el emergente mercado de las disqueras dentro del mundo del internet o las DAP (Digital Audio Player), los formatos lossless aun no logran estandarizarse y el mp3 sigue llevando la delantera, que -por ejemplo- a pesar de ser licenciado y tener que pagar por agregar un códec al reproductor aun no logra sacarse ser reemplazado por algún otro formato de compresión sin perdida, libre de licencias y con alta calidad de audio.

La representación fidedigna empleada comúnmente como referencia es la de un CD, codificado a una frecuencia de muestreo de  44,1 kHz y 16bits en formato tipo WAV PCM, donde si comparamos sus espectros de frecuencia con los de un formato lossless son iguales. Por lo mismo, si un archivo tipo FLAC luego creamos una copia codificada en MP3, le invertimos la fase y los mezclamos, podemos escuchar los rastros que deja la codificación en mp3, donde todas las frecuencias altas superiores a 15,5khz fueron cortadas y, aun más notorio, las frecuencias criticas que están dentro del rango de frecuencias medias.

Estas características dan a los formatos lossless como el FLAC una supremacía por sobre los formatos lossy de compresión con perdida como el MP3, y lo impulsan a comenzar a liderar el actual mercado de las reproducciones caseras, que a pesar de usar más espacio en disco, la emergente crecida de la velocidad en las conexiones a internet y la exponencial crecida del tamaño de almacenamiento tanto en discos duros como en memorias flash, le dan a este formato un mejor posicionamiento en cuanto a performance y rendimiento.

Cabe mencionar que el convertir el tiempo en una serie de muestras es algo muy complejo que lleva consigo una perdida implícita. Al convertir una señal continua en una serie de muestras discretas, estamos truncando el tiempo, y a pesar de que para nuestro oído las diferencias prácticamente no sean notorias, hay una gran pérdida de información de por medio que nuestras muestras no pueden captar.

19 Comentarios

  • […] Un ejemplo de un codec y formato libre de audio es el Free Lossless Audio Codec (FLAC) no tiene pérdidad de calidad y es muy superior al MP3. […]

  • Muy interesante y claro en verdad. Voy a empezar a bajar flac a ver si noto la diferencia. Un saludo!

  • buenisima info, tengo una duda si paso un disco mp3 a flac mejora su calidad o igual queda como formato lossy?

    salu2

  • 4 Matías Greco

    Andres, obviamente que si conviertes un archivo de baja calidad en un formato lossless, la resultante sería un archivo igual al anterior, en este caso, un archivo que suena como lossy.

    Puedes hacer la prueba de ello hasta con imagenes, ya que funcionan bajo el mismo principio. Si en Photoshop exportas un archivo JPG con 50% de calidad y luego ese archivo JPG lo conviertes en un PNG 24, el archivo se verá igual que el JPG anteriormente cuestionado.

    Lo que sucede con los formatos de audio es similar a cualquier sistema de archivos digital, y los datos perdidos… perdidos estan.

  • ese ruido que se escucha no son las frecuencias obviadas, recuerda que el oido humano no es capaz de oirlas … en todo caso serían a penas notables, ese ruido es la diferencia de codificación (calidad) entre el flac y el mp3

  • 6 Matías Greco

    Si, son las frecuencias obviadas, sin embargo el oido no es capaz de oirlas debido a un fenomeno de enmascaramiento, que es parte de la codificacion psicoacustica.

  • ¿Con qué programas has hecho las estas pruebas? Me gustaría hacerlas con varias canciones que tengo en FLAC y en mp3.

    Salu2

  • Hay dos cosas con las que no estoy de acuerdo.

    1) El formato WAV PCM es preferido por el profesional de audio mientras trabaja con una pista no por su fiabilidad sino porque es la única representación manipulable. El fomato FLAC es un formato de almacenamiento y no está diseñando para ser manipulado (por ejemplo aplicar efectos o filtros). Todo programa de edición de audio abre archivos flac y los pasa a WAV internamente para manipularlos así como el photoshop abre un TIFF, PNG o JPEG y lo pasa a un mapa de bits (el equivalente al WAV PCM en cuanto a imágenes).

    2) Respecto del última párrafo, cuando se digitaliza una señal analógica la cantidad de información que se pierde es infinita. No se puede representar digitalmente toda la información que hay en una señal analógica justamente porque no tiene fin. Así como no se puede representar el número pi. Pero el teorema de Teorema de muestreo de Nyquist-Shannon (http://es.wikipedia.org/wiki/Teorema_de_muestreo_de_Nyquist-Shannon) demuestra que la reconstrucción exacta de una señal periódica continua en banda base a partir de sus muestras es matemáticamente posible si la señal está limitada en banda y la tasa de muestreo es superior al doble de su ancho de banda.
    Es decir que en el muestreo no hay pérdida de información (ya que se la reconstruye matemáticamente tal como era a partir de las muestras) con la única condición de que esté limitada en banda. En el caso de sonidos, el oído humano nos provee ese límite que es de 20 kHz, pero podrías subirlo a lo que quisieras llevar el límite a 100kHz si estás dispuesto a tomar más muestras por segundo.

    Donde hay una pérdida es en la cuantificación (a cada muestra darle un valor discreto). Los sistemas profesionales usan 24 bits (más de 16 millones de valores distintos), pero está comprobado que aún con 16 bits (65.000 valores) es oído no es capaz de distinguir.

    El formato FLAC puede almacenar señales de hasta 192 kHz (permiten reconstruir una señal hasta 96 kHz cuando el oído humano no llega a 20 kHz) y muestras de 24 bits. Incluso, creo que el formato no está limitado a eso, sino que no existe hardware que capture con más detalle por considerarse inútil para el propósito del audio.

  • @Ignorante…

    Sobre el punto 1) Concuerdo contigo, es obvio que necesitamos manipular las señales. Los software de audio convierten hasta un mp3 en una representacion PCM. El flac tiene como usuario final la persona que oye un disco en su casa, con sus respectivos cue-points y no desea tener un archivo extremadamente pesado. Una de las ultimas gracias del WAV es el Broadcast Waveformat, que integra cue-points al igual que el flac y permite correr sesiones de mezcla sin la necesita de tener un archivo de posicionamiento.

    Sobre el punto 2) Obviamente cuando convertimos una señal continua en una señal discreta, la cantidad de informacion “perdida” (o obviada) es infinita, debido a que la cantidad de puntos en un intervalo de una representacion continua son infinitos. Pero existe un pero gigante en esa analogia que acabas de decir, que nosotros no muestreamos en formato flac, sino que muestreamos en WAV PCM, y luego pasamos a flac o a mp3. ¿Que indica esto? Que nuestro Ancho de banda viene limitado desde el momento en que el cantante puso su voz en un microfono y este se grabo en una pista digital (ya que obviamente paso por un filtro anti-alias), por lo que en el proceso de conversion a flac no nos queda mas que resignarnos a los 44.100.

    En el proceso de muestreo hay perdida, ¿de que?, de ancho de banda.
    Y en la cuantificación, ¿de que perdida estariamos hablando? de rango dinamico, lo que a la larga se traduce en ruido. Si bien mencionas, es muy dificil captar diferencias entre audio a 16bits o 24bits, sin embargo en el mundo profesional es netamente necesario utilizar un rango dinamico alto para estar muy lejos del ruido. El dither ha servido de mucha ayuda en esta area.

    Y para los fines del audio, las frecuencias sobre 20khz si son utilez, tal vez por si solas para el oido no son persibibles, pero en condiciones controladas este es el futuro del audio, y es algo de lo que pienso escribir proximamente, por ahora, te recomiendo le heches una mirada a un articulo del destacado ingeniero de mastering y presidente de la AES Latinoamerica Andres Mayo llamado ¿Hay vida despues de los 20 KHz? (http://www.andresmayo.com/images/Hay%20vida%20despues%20de%20los%2020%20KHz.pdf)

  • MUY BUENA EXPLICACION DE TODOS,PERO SI QUIEREN BUENA CALIDAD DE VERDAD COMPREN VINYLOS AHI NO VAN A PERDER NADA DE CALIDAD Y DEJENSEN DE JODER JAJA

  • Hola, excelente explicación y análisis,
    soy estudiante de diseño y estoy haciendo mi proyecto de titulo sobre la perdida de valor en la transición de los formatos físicos a los virtuales.., es posible que me envíes las pruebas auditivas que hiciste con el tema de Radiohead, por supuesto voy a poner que tu me las facilitaste..etc…, las usaría en la presentación, para mostrar con evidencia la perdida de sonidos….

    de antemano muchas gracias

    Karin

  • Muy buena la info, ahora si quedo entendible totalmente

  • […] I come to offer the comparison between these two popular formats. I found a blog ( Matias Greco ) on this subject in which he describes very well the differences, the language is completely […]

  • […] Greco El mp3 y los formatos lossless […]

  • Bueno que más decir, muy buena la información Matias Greco. Hoy me dio curiosidad sobre el formato FLAC, asi que me bajé algunos singles MP3 y FLAC para compararlos. sin duda el formato FLAC se escucha como el CD original.

  • […] memoria ampliable, hasta 32GB y muchas opciones de ecualizacion Por el tema Flac, lease esto ^^ https://matiasgreco.com/2008/10/el-mp…atos-lossless/ Editado por angel_oriel en 07-jul-2012 a las […]

  • […] […]

  • Great blog! I really love how it is simple on my eyes as well as the data are very written. I will be wondering how I might be notified when a brand new post has been created. I’ve decided upon your Feed which need to do the trick! Possess a great day time!

Deja un comentario