| Artículos | 01 MAR 1998

Introducción a MPEG

Tags: Histórico
David Rodríguez.

El vídeo digital no es más que una secuencia de imágenes al igual que el vídeo convencional, con la única diferencia de que están constituidas por una matriz de puntos de color o pixels. El problema reside en que la información a tratar tiene, en principio, un tamaño inmenso. Baste con decir que una película con una resolución de VGA superaría unas tasas de transferencia de cien Mbps (megabits por segundo).

Pero existen dos propiedades del vídeo digital que lo aventajan respecto el analógico: su copia y reproducción sin pérdidas y la posibilidad de comprimir las imágenes reduciendo así varias veces su tamaño lógico.

Aquí es donde entra en juego el MPEG, un acrónimo de Moving Picture Experts Group que viene a ser un comité formado por el propio ISO con objeto de definir este estándar. Su encargo era, desde 1988, establecer un estándar internacional para la representación codificada de imágenes en movimiento y audio asociado, orientado a medios de almacenamiento digital. En realidad, MPEG es el nombre común, desde luego mucho más familiar que su nombre auténtico: ISO/IEC JTC1 SC29 WG11.

Seguramente a más de uno le habrá asaltado la duda de si tendrá algo que ver con JPEG, que suena parecido y es un conocido formato de compresión de imágenes. Y en efecto, tiene una estrecha relación, puesto que se trata del mismo subcomité del ISO, pero existen ciertas diferencias dado que el JPEG se aplica a imágenes fijas y el destino final de las mismas es otro. Más adelante insistiremos en este tema.

Estándares de MPEG

Evidentemente no puede existir un único estándar en MPEG por la sencilla razón de que su aplicación pretende ser universal. Hoy en día, existen tres estándares que son bastante utilizados. Dentro de cada uno de ellos se admiten variantes, como, por ejemplo en lo que respecta a la resolución o color, pero siempre dentro de ciertos límites preestablecidos.

MPEG1 es muy característico en el ámbito de la informática, con una tasa de transferencia máxima de 1.5 Mbps y una resolución típica de 352 pixels por 240 pixels a 30 Hz. (podemos hablar de Hz. o fps, es decir, cuadros por segundo). Puede contener dos canales de audio con 250 Kbps.

Este estándar es muy socorrido en ordenadores ya que la tasa de transferencia es más que adecuada para los CD-ROM. Normalmente las tarjetas reproductoras amplían la imagen hasta llenar la pantalla (eso sí, con efecto de ?pixelizado?). Es muy útil para presentaciones multimedia, pequeños videoclips, enciclopedias, etc.

MPEG2 es el estándar televisivo por antonomasia, mucho más cerca de nosotros gracias a cámaras digitales y sobre todo, las televisiones vía satélite (p.e. Vía Digital o Canal Satélite) y televisiones por cable. Existen varios perfiles dentro del estándar, pero el más común es el que da 720x480 pixels con 30 cuadros y una tasa de 15 Mbps.

MPEG3 fue diseñado para la televisión de alta definición. No obstante, al descubrir que el MPEG2 se comportaba perfectamente con altas tasas de transferencia, hoy en día se incluye a la alta definición como un perfil del MPEG2, desapareciendo el MPEG3 como tal. En cualquier caso, la televisión de alta definición cuenta con otros estándares ajenos al MPEG (por desgracia, con demasiados estándares).

MPEG4 nace como una necesidad de videoteléfonos o videoconferencias, pero pronto queda claro que su principal campo de aplicación es Internet, así como la multimedia en general. La idea es exprimir al máximo canales con un ancho de banda pequeño (del orden de 64 Kbps). Inicialmente se había pensado en incluir imágenes de vídeo de 176 x 144 con 10 cuadros, pero las posibilidades fueron creciendo conforme se definían animaciones, síntesis de voz, etc.

Existen otros estándares en desarrollo que cubren sectores muy concretos. Uno de ellos es el MPEG7 orientado a describir objetos multimedia (Multimedia Content Description Interface). En la tabla de la figura 1 tenemos un resumen de características.

Características del MPEG2

Aunque el sentido del orden nos dicta empezar nuestra descripción por el MPEG1, vamos a evitar comenzar por el MPEG2 por ser un formato más completo y de difusión universal.

Como todo formato digital, su componente principal es una secuencia de bloques homogéneos, que se subdividen en una cabecera (puede haber más de una secuencia de cabecera) y uno o varios grupos de imágenes, (el grupo de imágenes se suele abreviar como GOP). La figura 2 nos da una buena idea de la estructura del MPEG2.

Los GOP se subdividen en una cabecera y series de una o más imágenes (Pictures) permitiendo el acceso aleatorio a cada una de ellas.

Las imágenes constituyen la unidad principal de una secuencia de vídeo. Una imagen estás constituida por tres matrices rectangulares que representan la luminancia (Y) y dos valores de crominancia: Cb (crominancia azul -blue-) y Cr (crominancia roja -red-). La matriz Y contiene un número par de valores, mientras que Cb y Cr contienen justo la mitad de elementos de Y.

A su vez, cada imagen se corta en ?rebanadas? o slices que son conjuntos de macrobloques. La existencia de slices se justifica con la corrección de errores. Cuando se detecta un error, el decodificador puede omitir un slice y continuar con el siguiente. Evidentemente, cuanto más subdividimos una imagen, mejor respuesta tendremos ante los posibles errores, pero hay que recordar que esto significa un mayor consumo de bits, que de otra forma podrían dedicarse a otros menesteres, como mejorar la calidad de la imagen. El orden de los macrobloques dentro de un slice es de izquierda a derecha y de arriba a abajo. Siguiendo con nuestro esquema, llegamos a los macrobloques (MB) o unidades básicas de codificación. Consisten en segmentos de 16x16 pixels dentro de un cuadro, a los cuales les corresponden cuatro luminancias Y y cuatro crominancias (dos Cr y dos Cb).

Un bloque consiste en 8x8 pixels y puede ser de tres tipos: Y, Cr o Cb. Contiene la unidad más pequeña dentro del algoritmo MPEG y es utilizado especialmente en cuadros internos o intraframes.

El esquema de la figura 3 es una simplificación de lo dicho y puede ayudar a comprender mejor la división que hemos expuesto. En la figura 2 nos han quedado algunos elementos sin describir, pero tan sólo contienen diversa parametrización que escapa al objetivo de este artículo.

Codificación

Antes de entrar en detalles sobre la codificación, hemos de definir tres tipos de imágenes: I-Pictures (Intra-Pictures) que son codificadas en base a información existente únicamente en la imagen en sí, proporcionando una compresión moderada (generalizando, son imágenes JPEG). P-Pictures (Predicted Pictures) que son codificadas respecto a la imagen anterior más próxima, ya sea de tipo I-Picture o P-Picture. Podríamos traducir esta técnica como predicción hacia delante. Dado que existe una compresión adicional basada en el movimiento, se alcanza una tasa muy superior. Finalmente, tenemos a las B-Pictures (Bidirectional Pictures) que toman como referencia no sólo a la imagen anterior, sino a la siguiente. A esta técnica se la denomina predicción bidireccional y consigue el mayor grado de compresión dado que emplea la imagen pasada y la futura, pero, eso sí, a costa de un mayor tiempo de cálculo.

La codificación de una imagen independiente, es decir, una I-Picture, se puede ver en detalle gracias a los gráficos de la figura 4. En primer lugar se aplica una transformada de coseno discreta (DCT), seguida de una cuantificación para finalmente comprimir mediante un algoritmo RLE (Run-length encoding). Los bloques de imagen y los de predicción de errores tienen una gran redundancia espacial, que se reduce gracias a la transformación de los bloques desde el dominio del espacio al dominio de frecuencia (gracias al empleo de la DCT).

Con la cuantificación y la

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información