Ogg-Vorbis



Si quieres esuchar el contenido de ésta página, reproduce lo siguiente:

Definición

Como el formato MP3, es una forma de compresión que reduce algunos de los datos de audio y se denomina "compresión con pérdida". ​
Lo que distingue al formato Ogg Vorbis es que es un formato completamente gratuito, abierto y sin patente; a diferencia de sus competidores principales como el formato MP3 o AAC. Esto significa que el algoritmo de compresión se puede utilizar libremente por todos los productores de software.​

¿Qué es OGG y qué es Vorbis?

Ogg es el nombre del formato contenedor de Xiph.org para audio, video y metadatos. ​ No es solo un códec de vídeo o de audio, sino que es un contenedor que comprende audio, video y subtítulos
Vorbis es el nombre de un codec ó esquema de compresión de audio con pérdida, que está diseñado para estar dentro del contenedor Ogg. ​

¿Quién lo propuso?

El proyecto Ogg Vorbis fue iniciado en 1993 por el programador Chris Montgomery, fundador y director técnico de la Fundación Xiph.Org​ ​ Esta organización es un grupo sin fines de lucro para proteger el contenido multimedia en Internet del control de intereses privados.

Características

  1. OGG Vorbis admite un mínimo de dos canales y un máximo de 256 canales, y, puede reproducir sonidos en sistemas que utilizan canales 5.1 o 7.1.​

  2. OGG Vorbis tiene mejor calidad de sonido que otros tipos de archivos como MP3.​

  3. El archivo comprimido del formato OGG Vorbis es más pequeño que el de MP3. ​ ​ Mientras que a un mp3 de 128 kbps le tomaría 10.3MB al ogg le tomaría sólo 7.1MB, sin conllevar alguna pérdida de calidad.

  4. La tasa de bits de compresión en OGG Vorbis es variable, cambia según la necesidad del archivo. ​

  5. La extensión de nombre de archivo .ogg se usaba para todos los datos cuyos materiales de contenido usaban el formato de contenedor Ogg. Desde 2007, la Fundación Xiph.Org recomienda que .ogg se utilice únicamente para datos de audio Ogg Vorbis​

  6. Vorbis incluye un campo de comentarios completo y flexible para la información de la canción y el artista, así como otros datos de la pista. Permite ingresar información de comentarios en el momento de la codificación. Otras herramientas también permiten ingresar y editar datos de seguimiento.​

  7. Reproducir un archivo ogg consume más recursos que reproducir un mp3 lo que puede reducir la duración de la batería. ​

  8. Su frecuencia va desde los 8kHz a los 48.0kHz, es polifónico y sus tasas de bits fijas y variables son de 16 a 128 kbps/canal.​

  9. Existen reproductores de audio que no reproducen .ogg, además de que es menos usado que otros formatos como MP3 o AAC. ​ (Por algo no existe el reproductor ogg pero sí reproductores MP3)​

Calidad y Bitrate

El codificador genera un flujo a una velocidad de bits de 45 a 500 kbit / s, según la calidad elegida.​ El coeficiente de calidad es una métrica arbitraria y puede variar de -2 a 10 ​ Mientras más información contiene el .ogg; la calidad es más cercana a la grabación de audio original. ​

Historia

  1. 1993: Inicialmente, el código fuente de Ogg/Vorbis estaba basado en un proyecto anterior iniciado inicialmente por Christopher Montgomery en 1993. ​

  2. 1998: Se desarrolló el código fuente utilizado en las versiones actuales de Ogg/Vorbis, poco después de que Fraunhofer decidiera fortalecer su control de MP3 y amenazó con demandar a los proyectos MP3 gratuitos. ​

  3. 2002: La primera versión de códec estable, 1.0, se lanzó el 19 de julio de 2002. Esta versión cumple al estándar Vorbis I.​

Compresión del formato

Sobre el MDCT con ventana

Modelo psicoacústico

Vorbis utiliza el modelo psicoacústico humano para descartar información no audible, característica que lo ubica en el grupo de códec con pérdidas.​ El modelo proporciona una compresión de señal con pérdida de alta calidad al describir qué partes de una señal de audio digital determinada se pueden eliminar de manera segura, es decir, sin pérdidas significativas en la calidad percibida del sonido. Parte de la psicoacústica se en las limitaciones del oído para percibir el sonido.​ Estas limitaciones son:

Cuantificacion

La cuantificación es básicamente el proceso de disminuir la​ número de bits requeridos para almacenar valores de coeficiente por​ disminuyendo su precisión (por ejemplo, redondeando de tipo flotante a​ entero). ​ El objetivo de la cuantificación es disminuir la mayor parte de​ los coeficientes de alta frecuencia menos significativos a cero.​ ​ Por ejemplo, redondear un número real 𝒙 al valor entero más cercano forma un tipo de cuantificador muy básico: uno uniforme. Un cuantificador uniforme típico (de la mitad de la banda de rodadura) con un tamaño de paso de cuantificación igual a algún valor 𝚫 se puede expresar como

donde la notación [ ] denota la función de suelo.​
Una función suelo es la función que toma como entrada un número real x, y da como salida el mayor entero menor o igual que x.​ El espectro de frecuencia cuantificado se puede considerar como una función de suelo, esta curva está codificada sin pérdidas y tiene muchos menos datos (coeficientes) e información que el espectro cuantificado. ​
Dependiendo de la tasa de bits de salida deseada y la frecuencia , el SAM aplica un paso de cuantificación diferente a conjuntos de frecuencias de diferente tamaño.​ Estos son los niveles cuantización disponibles para Vorbis:

Cuantificacion vectorial: Codificacion Huffman

La cuantificación vectorial (VQ) es una técnica clásica de cuantificación del procesamiento de señales que permite modelar funciones de densidad de probabilidad mediante la distribución de vectores prototipo. ​ Originalmente se utilizó para la compresión de datos. Vorbis utiliza la codificación Huffman para comprimir los datos contenidos en las porciones de suelo y residuos. La diferencia (residuo) entre la curva de suelo y el espectro cuantificado se codifica con VQ+Huffman (con pérdidas).


Decodificacion

Una vez completada la codificación Huffman, los datos de la trama se empaquetan en bits en un paquete lógico. ​ En Vorbis, una serie de estos paquetes siempre va precedida de un encabezado. El encabezado contiene toda la información necesaria para una decodificación correcta. ​ Esta información incluye un conjunto completo de libros de códigos, descripciones de métodos para representar el piso y el residuo, y los modos y asignaciones para soporte multicanal. ​ Vorbis proporciona el formato 'Ogg', para encapsular paquetes lógicos en flujos de transporte.
La configuración del decodificador consiste en la configuración de múltiples abstracciones de componentes autónomos que realizan funciones específicas en la canalización de decodificación.​ Estos son: Antes de que pueda comenzar la decodificación, el decodificador debe inicializarse utilizando los encabezados de flujo de bits que coinciden con el flujo que se va a decodificar. ​ Vorbis usa tres paquetes de cabecera; todos son requeridos, en orden, por esta especificación. Una vez configurado, la decodificación puede comenzar en cualquier paquete de audio que pertenezca al flujo de Vorbis. ​ Los paquetes de encabezado son: El procedimiento de decodificación y síntesis para todos los paquetes de audio es fundamentalmente el mismo. ​