Universitat Oberta de Catalunya

Claves para entender el funcionamiento del vídeo digital

Introducción

Hasta no hace mucho tiempo el vídeo e Internet eran prácticamente dos mundos aparte, dos universos sin casi intersección. El vídeo, divulgado a través de televisión o visionado a través de reproductores domésticos, se caracterizaba por ser un media rico en experiencias que se aproximaba a la experiencia visual diaria. Internet se asemejaba a un territorio amplio, sin límites, en el que la búsqueda de contenidos era rápida y carente de fronteras pero limitada a un cierto tipo de información. El vídeo, por una parte como consecuencia del gran volumen de datos que genera y por otra por las limitaciones del ancho de banda disponible en la red, era un elemento poco habitual en Internet.

Pero las webs actuales son el resultado de una evolución rápida y progresiva. Integran vídeo, música, datos e interactividad y son capaces ya de crear experiencias multisensoriales. No podemos afirmar que se asemejan a la experiencia televisiva ya que la realidad del vídeo en Internet constituye una realidad nueva que va más allá de lo que permite la televisión. La convergencia de medios diluye fronteras. Las características propias, y hasta hace poco exclusivas, de un medio pasan a formar parte del otro. La televisión evoluciona hacia formatos interactivos, la web progresa a un ritmo rápido e intenso hacia una calidad de imagen cada vez mayor. En el camino se modifican esquemas y formas de trabajo. La integración del vídeo en la web genera cambios que afectan a aspectos tan diversos como los procesos de producción, la estética y el lenguaje audiovisual.

Los estándares de vídeo analógico

Aunque sea por poco tiempo, unos años a lo sumo, estamos conviviendo aún con el vídeo analógico. La introducción de la TDT y el apagón analógico previsto para finales de esta década provocarán con mucha probabilidad que términos como PAL o NTSC pasen a formar parte del pasado. Y seguramente antes desaparecerán siglas como VHS o Hi-8 del mismo modo que hace unos años términos como U-MATIC o Betamax entraron en el baúl de los recuerdos. Pero en estos momentos es preciso comentar aún las características del vídeo analógico ya que como origen o como destino en la mayoría de los casos es preciso realizar el paso entre analógico y digital. Es cierto que en origen cada vez nos encontramos con menos fuentes analógicas. Las cámaras digitales ganan mercado sin cesar pero aún es importante el parque de equipos de grabación existentes en VHS, 8, S-VHS, Hi-8 o Betacam. En cambio, en el otro extremo de la cadena, la conversión a analógico es aún mayoritaria a consecuencia del considerable número de televisores existente.

Existen diversos estándares analógicos. El NTSC (Nacional Televisión System Comité) sigue las especificaciones establecidas en 1950 para la introducción de la televisión en color. Se usa en USA y Japón. El PAL (Phase Alternating Line) es el sistema propio de Australia, Oriente Medio, Asia y Europa con la excepción de Francia que utiliza el SECAM. Ninguno de estos sistemas resulta óptimo para una visualización en la pantalla del ordenador a causa de algunas diferencias técnicas importantes.

  • Tamaño del fotograma. Mientras que en la pantalla del televisor convencional la imagen se forma en base a líneas horizontales (525 en NTSC y 576 en PAL), en la pantalla del ordenador se crea en base a un mosaico de píxeles. Por otra parte, mientras la resolución del televisor es fija, la de la pantalla de ordenador es variable y en ella los reescalados de la imagen pueden ser necesarios.
  • Fotogramas por segundo (fps). El vídeo es en esencia una sucesión de fotogramas que al visionarse a una determinada velocidad crea la ilusión de movimiento. En NTSC la frecuencia es de 30 fps mientras que el valor en PAL es de 25. En aplicaciones multimedia es frecuente que el vídeo se reproduzca a la mitad de estos valores.
  • Píxel Aspect Ratio. Existen diferencias también que atañen a la forma del píxel. Mientras en una pantalla de televisor es rectangular, en un monitor informático es cuadrado. En consecuencia una misma imagen puede aparecer deformada. En función de cuál sea el destino del vídeo será preciso llevar a cabo o no la corrección de este parámetro. Algunas aplicaciones de edición de vídeo llevan a cabo esta compensación al mostrar la imagen en una ventana del monitor. Si el destino final del vídeo es la web es recomendable adaptar los píxeles a unas proporciones de 3×4.<7li>
  • Vídeo entrelazado y progresivo. La imagen de vídeo analógico consiste en dos campos entrelazados cuya suma forma un fotograma. La necesidad del entrelazado proviene de una limitación técnica de los inicios de la televisión y fue la solución que evitaba que se produjera excesivo efecto de parpadeo aún trabajando con una baja frecuencia de imagen. Con el advenimiento del vídeo digital esta característica constituyó un serio obstáculo en la integración de formatos analógicos y digitales y no es descartable que en el futuro desaparezca. De hecho, en los nuevos formatos de televisión de alta definición se ha eliminado el entrelazado.

El paso a vídeo digital

La generalización del vídeo digital se ha producido de la mano del DV y la posibilidad de editar en el ordenador. A la facilidad de uso de las cámaras DV y su notable calidad de imagen se unen las potencialidades que se derivan de la edición digital. A diferencia de los casos en los que la fuente de origen es un vídeo analógico, el trabajar en formato digital en origen elimina la necesidad de disponer de tarjeta digitalizadora en el ordenador. De hecho un simple puerto Firewire, USB o USB-2 permite la transferencia de datos entre la cámara y el equipo informático. El sentido puede ser también el inverso cuando se graba el master ya editado en una cámara o magnetoscopio externo.

La edición digital recupera en cierto modo el espíritu de la edición cinematográfica clásica. Editar un vídeo analógico sobre cinta implica no poder cortar y suprimir secuencias innecesarias, o no poder añadir nuevos planos a una cinta ya editada. Es lo que denominamos edición lineal que se contrapone a la clásicamente ejercida en el cine. Mientras en éste se corta físicamente el film, se suprimen fotogramas o se añaden libremente, en la edición analógica del vídeo el mismo procedimiento es imposible. Uno de los grandes cambios aportados por la edición digital es la recuperación de la no linealidad. Trabajar en formato digital permite insertar, suprimir, aplicar efectos, sumar capas,…, sin perder en absoluto calidad. En teoría son posibles infinitas generaciones a través de la exportación y reimportación de los clips a un proyecto.

La introducción del ordenador como instrumento de edición de vídeo se produjo en los entornos profesionales los últimos años del siglo pasado y se generalizó para el público en general los primeros de éste. Los procesos de edición digital se han generalizado y si bien existen diversas posibilidades de software para llevarlos a cabo puede afirmarse que forman un conjunto de procedimientos y tareas bastante uniforme. En cambio el uso del vídeo editado es ya todo otro tema. Por decirlo de algún modo, un campo que se diversifica y ramifica ampliamente.

Usos del vídeo digital

En términos generales podemos hablar de dos grandes tipos de salidas y usos.

  • El primer grupo lo integran las salidas para teledifusión y soportes que como el DVD o las cónsolas de videojuegos no plantean problema por gestionar grandes volúmenes de información. En general prima en ellos una elevada calidad de imagen, pero quizás el común denominador que más nos interesa ahora es que en ninguno existe problema derivado del peso de los archivos. Que el material de vídeo ocupe gigas no reviste mayor importancia que la de disponer de un equipo con las prestaciones adecuadas. Una vez realizada la edición y guardado el master, ya sea en cinta, ya sea en un soporte óptico, los archivos de trabajo se borran del disco duro.
  • El segundo grupo se refiere a la salida para multimedia, la web o los dispositivos móviles. En él se incluyen los clips destinados a ser reproducidos en un ordenador, ya sea a través de un soporte óptico o sea a través de la web, y los destinados a dispositivos como los teléfonos móviles o las PDAs.

Es este segundo grupo que nos interesa ahora especialmente para comentar el desarrollo de las características del vídeo digital. Dicho de otro modo, nos centraremos en las necesidades que presenta el uso del vídeo como un elemento integrante de aplicaciones multimedia. No obstante es interesante señalar como, a consecuencia de la convergencia digital de medios, la frontera entre ambos grupos se diluye progresivamente. Así, es frecuente que en una cadena televisiva un mismo contenido se guarde en versión master, en versión mpeg-2 para teledifusión, en alguna versión comprimida para redes locales o para los distintos anchos de banda comunes en Internet y un formato apto para teléfonos móviles y PDAs.

Tecnologías de vídeo en la web

Al hablar de la salida de vídeo para multimedia entramos en dos temas claves a resolver para posibilitar el uso de los clips en estos entornos. En primer lugar la necesidad de sincronización, gestión y reproducción de los clips, así como su necesaria integración con el resto de contenidos multimedia. En segundo lugar la necesidad de conversión de los clips a archivos suficientemente pequeños como para ser reproducidos con fluidez y almacenados con unas necesidades de espacio de disco razonables. El peso considerable de los archivos de vídeo obliga a un proceso de compresión y codificación que permitan reducirlo. Para dar respuesta a estas necesidades disponemos de tres tipos de tecnologías multimedia, Quicktime, Windows Media y Real Vídeo, cada una de las cuáles desarrolla diversos codecs. El término codec contiene en su propia denominación el resumen de su funcionalidad, es la abreviatura de las palabras inglesas compressor – decompressor,. Los codecs son instrumentos para comprimir y descomprimir vídeo.

Publicar y distribuir vídeo a través de Internet origina una serie de problemáticas específicas la primera de ellas derivada del ancho de banda. En este sentido la caída progresiva de precios de la banda ancha, el incremento de su capacidad de flujo de datos, facilita el uso de vídeo en la red.

La segunda problemática se relaciona con la importante complejidad que supone la publicación de vídeo a través de la red. Las distintas tecnologías que hemos apuntado anteriormente implican una serie de requerimientos propios y precisan que el usuario configure su equipo para su correcto funcionamiento. Aquí es dónde encontramos la necesidad de instalar plugins.

El peso de cada plugin varía. Así el de Quicktime pesa por encima de las 11 megas, el de Windows Media 9,6 megas y el de Real 8,2. Instalar los plugins permite disponer de un amplio abanico de codecs y por tanto de la capacidad de reproducir vídeos que han sido comprimidos mediante ellos. No obstante es importante señalar como, precisamente, este amplio abanico de posibilidades supone también una débil garantía de visualización. Si el usuario no dispone del codec con el que ha sido comprimido un vídeo no puede visualizarlo. Precisa buscarlo, habitualmente en la web, descargarlo e instalarlo. En ocasiones el proceso no es simple y en casos como el de Real el usuario debe cumplimentar datos para poder acceder a él.

Llegados a este punto es preciso llevar a cabo una puntualización. Hasta ahora hemos estado hablando de las tres tecnologías clásicas de visualización del vídeo en la web. Actualmente existe una cuarta posibilidad que presenta importantes innovaciones. Queda quizás en discusión si se trata de una tecnología independiente, como plantea la casa de origen, o si es preciso situarla en la órbita de la tecnología Quicktime. Se trata de la opción de integrar el vídeo en aplicaciones Flash.

Esta opción dispone de un plugin propio que a diferencia de los anteriores pesa muy poco, únicamente unos 400 kb. No se trata de un plugin específico para visualizar vídeo sino del propio de Flash que en estos momentos tiene casi la categoría de universal. Si bien no es nativo en Windows se encuentra en un porcentaje de ordenadores que se aproxima al 100%. Utiliza un codec propio (Sorenson Spark) que permite el uso de vídeo como elemento importado dentro de la aplicación o controlado desde ésta como media externo. Se basa en tecnología derivada del mpeg-4 y utiliza un formato propio (flv) para los clips externos.

El uso del vídeo en la web

Más allá de la discusión de si el vídeo en flash constituye una cuarta tecnología o simplemente una evolución dentro de Quicktime, el análisis de las innovaciones que se derivan de la integración de vídeo en flash abre la puerta a nuevos usos y funcionalidades. Clásicamente el vídeo en la web se ha caracterizado por una muy escasa interactividad que se limitaba a la reproducción y el visionado. Las primeras experiencias de vídeo en la red han tendido al estatismo, a simular una televisión de baja calidad. Un rectángulo con contenido que se reproduce en una parte parcial y reducida de la pantalla del ordenador y con frecuencia en forma de una ventana flotante que se despliega. Una imagen pequeña, con poca información e ínfima calidad, que no aporta una experiencia especialmente positiva.

El objetivo hacia el que tiende actualmente el vídeo en la red apunta hacia la creación de experiencias inmersivas y atrayentes que fusionen el vídeo con el resto de componentes multimedia. Es en este sentido en el que la experiencia de usar vídeo en flash resulta muy interesante ya que, aparte simplificar procesos en las cuestiones relacionadas con el plugin, flash trata al vídeo como cualquier otro objeto. De esta forma es posible ejecutar no únicamente un control de las imágenes internas de un vídeo visualizado a través de Flash Player sino también poder mantener un alto nivel de interactividad con dichas imágenes mediante el anclaje de objetos con capacidad interactiva anidados dentro del clip padre que hace de contenedor del objeto de vídeo.

Es de preveer muchos cambios en el uso y los formatos del vídeo. Aparte de la integración de clips en páginas web que hemos comentado, en la actualidad puede afirmarse también que el intercambio de ficheros de vídeo es uno de los mayores causantes del gran aumento de la cantidad de tráfico en la red. Hace pocos meses, por ejemplo, un clip de vídeo en el que una madre disfrazaba de castor a su hijo y hasta el final no era consciente que tenía que haberlo hecho de pastor, llegó a cotas de popularidad importantes. Muchos de estos clips tienen una estructura de formato rápido y ágil, se orgininan en la publicidad y son referente de uno de los usos actuales del vídeo en la web.

Tradicionalmente los formatos audiovisuales han tenido como condicionantes las características de los canales mediante los cuáles se transmitían. Así, la hora y media de duración de las películas viene delimitada en gran parte de los condicionantes técnicos que exigían su difusión en bobinas. También algunos formatos televisivos de corta duración enlazan con las necesidades de mantener cotas de audiencia y dar cabida en su estructura a cortes publicitarios. ¿Que formatos audiovisuales prevalecerán en el nuevo medio de medios? Con toda certeza formatos nuevos. La red no es un mero canal de información sino también deviene un canal de publicación. Sin ir más lejos, cortometrajes y films que surgen de iniciativas sin altos presupuestos encuentran en la red un medio hábil para llegar a los espectadores. La publicación en formatos como el Div-X o el WMV permite una distribución de clips que posteriormente pueden reproducirse en el televisor. En este sentido podemos encontrar ejemplos como el film Hay motivo o el corto 7:35 de la mañana.

Codecs y métodos de compresión

Básicamente existen dos métodos de compresión, la denominada compresión espacial y la temporal. En la primera se reduce la información comprimiendo la existente en el interior de cada frame. En lugar de describir la imagen píxel a píxel, señalando por ejemplo la posición y color de los píxeles, el codec de compresión generaliza describiendo área similares y sus características de luz y color. Así por ejemplo, en lugar de reproducir un cielo azul píxel a píxel se describiría el mismo como un área con características de luz y color similares.

  • Una conclusión clara es que cuantos menos detalles variados presente una imagen más fácilmente el codec podrá generalizar y comprimir. Crear vídeos con fondos simples facilita la compresión y la reducción, del mismo modo que trabajar con trípode en lugar de cámara en mano supone estabilizar los fondos y por lo tanto facilitar la compresión posterior.

Un segundo método de compresión es el temporal. Aquí se compara la información entre frames consecutivos y únicamente se almacenan los detalles que varían. Si el cielo azul del ejemplo anterior fuera atravesado por un pájaro en vuelo, aplicar una compresión temporal a la secuencia implicaría describir únicamente los píxeles que variasen en cada fotograma. Se podría prescindir de la información del cielo y relacionar únicamente la del animal.

  • No obstante es claro que la compresión temporal precisa también describir algunos fotogramas sin comprimir, en el ejemplo anterior el primero de la serie, pongamos por caso. Los fotogramas de referencia a partir de los cuáles se analizan las diferencias y se sustentan los posteriores se denominan fotogramas clave y contienen la imagen completa. Por el contrario, los fotogramas que reflejan las diferencias se denominan delta frames y sólo contienen la información de las áreas que varían respecto de las imágenes anteriores.

En general, como ya hemos apuntado anteriormente, los vídeos que presentan pocos cambios entre fotogramas se comprimen mejor y ello afecta necesariamente a la realización. Actualmente tanto la realización televisiva como la cinematográfica tienden al uso de la cámara en movimiento. No únicamente panorámicas, travellings y zooms, sino también filmaciones con steadycam (o su emulación como la función steadyshot de los equipos domésticos) e incluso filmaciones cámara en mano. Como ya se ha apuntado, la compresión de los vídeos dinámicos resulta más problemática que los casos de imágenes más estáticas. Pero, por otra parte, la evolución hacia una realización dinámica en estos momentos de la historia del lenguaje audiovisual no parece que vaya a cambiar de sentido.

Un vídeo dinámico de calidad en la web pasa por la capacidad de compresión de los codecs en este sentido. Algunos de ellos como los Sorenson o los MPEG tienen capacidad para tratar adecuadamente movimientos moderados de la cámara y compensar por ejemplo los cambios para lograr panorámicas sin saltos. De todos modos, el campo de estudio que relaciona dos extremos de la cadena de trabajo, la realización y la compresión para publicación en la web, presenta un panorama extenso y dilatado en el que hay mucho camino por recorrer.


Cita recomendada: MARÍN, Antoni. Claves para entender el funcionamiento del vídeo digital. Mosaic [en línea], julio 2005, no. 39. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n39.0517.

Acerca del autor

Licenciado en Ciencias de la Educación, posgrado en Sistemas Interactivos Multimedia y doctor en Sociedad de la Información y el Conocimiento. Profesor de la UOC en las asignaturas de Fotografía, Vídeo y Composición Digital. Desde el punto de vista de la investigación, trabaja actualmente en la aplicación de la realidad aumentada como recurso docente. Fue guionista y realizador de programas de televisión educativa PMAV-Canal 33. Como fotógrafo, es miembro de AFOCER y de AFOTMIR.