Universitat Oberta de Catalunya

Tratamiento del rango dinámico en la imagen digital

El uso de nuevas tecnologías digitales para el almacenamiento, procesamiento, presentación y captura de información se ha extendido al mundo fotográfico recientemente. Esto ha provocado un cambio tecnológico, como se apunta en el artículo de Antoni Marín, y, aunque los conceptos clásicos de fotografía siguen siendo los mismos, el vocabulario asociado a la fotografía se extiende para tratar con la imagen en su representación digital.

La imagen digital

Una imagen digital se puede definir como la representación en intensidades lumínicas y en dos dimensiones de un objeto o escena. Está formada por diferentes puntos luminosos o píxeles y utiliza números para codificar su intensidad lumínica asociada. Por ejemplo, en una imagen en blanco y negro, el valor 255 puede corresponder al blanco; y el valor 0, al negro, dejando toda la escala de grises en los valores intermedios entre el 1 y el 254. Este rango de 256 valores está asociado a imágenes de 8 bits por píxel. Si se desea tener más precisión, se pueden utilizar 16 bits por píxel, lo cual ofrece valores entre 0 (negro) y 65.535 (blanco). Ambas escalas contienen tonalidades entre el oscuro y el claro, pero con 16 bits se obtiene más precisión. Del mismo modo, se pueden utilizar más bits por píxel para aumentar la precisión, aunque con el coste de aumentar el tamaño que ocupa la imagen al ser almacenada.

Los píxeles suelen estar dispuestos en una malla cuadrada o matriz, debido a la forma de los aparatos típicos de adquisición que se suelen utilizar para adquirir las imágenes digitales. Estos aparatos, de muy reducidas dimensiones, consisten en una red cuadrada de pequeñas celdas sensibles a la luz visible (ver figura 1). Cuando la luz llega a una celda, ésta se transforma en un impulso eléctrico, que, una vez medido, se transforma en un número, obteniendo un determinado píxel de la imagen. Cuanta más luz llegue a la celda, mayor será el valor de su correspondiente píxel. Por otro lado, cuantas más celdas existan, más puntos de intensidad luminosa habrán, lo cual se puede traducir en dos opciones: un aumento de la extensión de la región de objeto o escena real representada o, si esta extensión se mantiene fija, un aumento de la precisión espacial con que se representa dicha región. Relacionándolo con el mundo fotográfico, este tipo de sensores representan la contrapartida de la película fotográfica en el mundo digital.

fig1_melenchon

Figura 1. Sensor de 12 millones de celdas para capturar intensidades luminosas y producir imágenes digitales de 12 millones de píxeles.

Una cámara digital difiere de una cámara analógica principalmente en que la primera utiliza un sensor digital; y la segunda, película fotográfica. El resto de elementos son los mismos. De este modo, los procesos de enfoque, exposición y profundidad de campo siguen las mismas reglas. La única diferencia se encuentra en que la imagen digital requiere una pantalla para poder ser observada. Inicialmente, las imágenes digitales se almacenan inicialmente en archivos con un formato llamado RAW o imágenes crudas. Éstos contienen únicamente una secuencia con los valores de cada píxel codificados con el número de bits elegido por la cámara. Sólo es necesario recordar detalles como el número de filas y columnas, y si la secuencia de píxeles se obtiene por exploración vertical u horizontal de la imagen.

La problemática del margen dinámico

La cantidad de luz que llega a las celdas del sensor se conoce como exposición, la cual depende de múltiples factores, como son: la cantidad de luz reflejada por una escena, la apertura del diafragma, el tiempo de exposición y la sensibilidad de las propias celdas. No obstante, no todos los niveles de exposición pueden ser medidos por las celdas del sensor. Éstos tienen siempre un valor mínimo y otro máximo: el primero hace referencia a la cantidad de luz necesaria para comenzar a excitar la celda; el segundo, a la cantidad de luz a partir de la cual el sensor llega a su excitación máxima. La diferencia entre estos dos valores recibe el nombre de margen o rango dinámico, el mismo concepto que aparece en el artículo de Marín asociado al número de zonas vinculado al sensor.

El margen dinámico necesario para capturar todas las posibles escenas, desde la luz de las estrellas hasta realizar una fotografía a plena luz del día, es enorme, del orden de unos pocos mililux hasta 500 kilolux (un lux es una medida de la intensidad lumínica), o las diez zonas de Adams (véase el citado artículo de Marín). Este rango de valores de intensidad es demasiado grande para los actuales sensores y pantallas, como también lo son para el papel fotográfico clásico. Para contrarrestar las limitaciones de este último, Adams propuso su sistema de zonas. Para contrarrestarlas en el mundo digital existen las diferentes técnicas asociadas a High Dynamic Resolution Imaging (HDRI), que tienen dos objetivos: primero, conseguir capturar todo el rango dinámico posible; segundo, conseguir representarlo de forma compactada. Para el primero, es imprescindible poseer un elevado número de bits por píxel para poder representar cualquier valor de intensidad con suficiente precisión; para el segundo es necesario aplicar algún tipo de transformación a la imagen que comprima su rango dinámico, adaptándolo al margen dinámico del dispositivo de presentación.

Sin las técnicas de HDRI no pueden aparecer simultáneamente los detalles de las zonas con sombras y los de las zonas muy iluminadas. Para resaltar los primeros, se debe realizar una elevada exposición, mientras que para distinguir los segundos, la exposición debe ser menor que en el primer caso. La solución pasa por realizar diferentes adquisiciones a diferentes exposiciones para después combinarlas mediante un sistema de procesamiento digital, es decir mediante un ordenador.

El histograma

Una manera resumida de representar una imagen es mediante su histograma. Consiste en una gráfica que muestra el número de píxeles para cada posible valor. Aunque el histograma no identifica inequívocamente a una imagen (ya que diferentes imágenes pueden tener el mismo histograma), ofrece información sobre la distribución de luminosidad de una imagen (ver figura 2). En una imagen de 8 bits, el eje horizontal del histograma tiene 256 valores, mientras que en una de 16 bits tiene 65.536.

fig201_melenchon fig202_melenchon

Figura 2. Dos imágenes y sus histogramas. Cada histograma tiene la distribución de valores de píxel de la imagen, estando los bajos en la izquierda y los altos en la derecha. La superior representa una imagen de baja exposición y la inferior, una de elevada exposición. Nótese los diferentes histogramas en cada caso.

Modificación local del rango dinámico

Al igual que en la fotografía analógica, también se puede contrastar y aplanar en su versión digital. Esto se consigue mediante una modificación local del rango dinámico en una fotografía. En el caso de las imágenes de la figura 2, la b es un resultado de contrastar las sombras de la a, mientras que la a es el resultado de aplanar las luces de b. En ambos casos la operación se ha realizado de forma global en la imagen. No obstante, se puede llevar a cabo en determinadas regiones utilizando imágenes máscara, las cuales permiten realizar estos efectos únicamente en un conjunto determinado de píxeles. Este tipo de técnicas requieren una manipulación de la imagen, beneficiándose de una especie de artesanía digital, de manera análoga a las técnicas de las reservas utilizadas en el positivado del laboratorio.

Para aplanar o contrastar una imagen o una región se utilizan las transformaciones puntuales. Este tipo de operaciones se basan en cambiar el valor de un píxel por otro, siguiendo una tabla de correspondencia, que se puede dibujar como una función, que suele tener forma de curva y relaciona niveles de la imagen de entrada (horizontal) con niveles de la imagen de salida (vertical). De su forma proviene el nombre que adquiere esta función en algunos editores de imágenes, por ejemplo, la herramienta curvas de Photoshop. Esta herramienta, en su versión más simplificada, se denomina niveles, ya que trata sobre el cambio de niveles o valores de los píxeles. En este editor, existen determinados procedimientos preestablecidos que también efectúan una transformación puntual, como pueden ser las opciones de mezcla de capa: multiplicar, trama, luz suave, etc.

fig3_melenchon

Figura 3. Ejemplo de transformaciones puntuales mostradas como curva, para pasar entre estas dos imágenes.

Al utilizar este tipo de transformaciones es interesante trabajar con imágenes con el mayor número de bits posible, para poder obtener una tabla de correspondencia lo más precisa que se pueda. Por ejemplo, si se compara el uso de 8 bits contra 16, se tiene que en el primer caso existen 256 niveles para representar la gradación del negro al blanco, mientras que en segundo se dispone de 65.536. Esto implica que pasar del nivel 254 al 255 en 8 bits es como pasar del nivel 65.279 al 65.535 en 16 bits: con 16 bits aún se dispone de más precisión para determinar un nivel de blanco intermedio (que no pasa con 8 bits). Este hecho tiene una implicación especial con las transformaciones puntuales: con 8 bits, los valores 254 y 255 tendrán dos valores asociados, mientras que para los mismos niveles de gris para 16 bits, el rango desde 65.279 hasta 65.535, la tabla mostrará 256 correspondencias, revelando más detalle en la transformación puntual.

En consecuencia, es recomendable trabajar a 16 bits si se desea conseguir un máximo de calidad en el proceso. Capturar en RAW y editar en 16 bits es garantía de un mayor nivel de calidad. No obstante, versiones de software de última generación permiten también un tratamiento a 32 bits. Son las denominadas imágenes de alto rango dinámico.

High Dynamic Range Imaging (HDRI)

Las imágenes de alto rango dinámico (HDRI) buscan conseguir la representación de todo el margen dinámico posible de una escena. Para ello necesita dos cosas: primera, una representación de los valores lumínicos suficientemente precisa; segunda, disponer de dispositivos sensibles a todo el rango dinámico de la escena.

La primera necesidad se puede combatir aumentando el número de bits por píxel a 32, obteniendo las imágenes de alto rango dinámico. La segunda necesidad se puede resolver capturando diferentes tomas de la misma escena con un sensor normal variando la exposición en cada una de ellas. De este modo, se aprovecha el margen dinámico del sensor para construir, por trozos, todo el margen dinámico deseado (ver figura 4). Este tipo de técnicas utiliza herramientas matemáticas de optimización para unir los diferentes histogramas de cada captura y encontrar la irradiación original de la escena, independientemente de la exposición utilizada en cada foto. La irradiación se conoce como la cantidad de luz por unidad de tiempo que irradia un punto de la escena fotografiada. Herramientas comerciales, como Photoshop, presentan implementaciones de derivaciones de este método para poder utilizarlo a nivel doméstico o profesional.

fig4_melenchon

Figura 4. Margen dinámico perceptible y margen dinámico de un sensor digital de una cámara utilizando diferentes exposiciones.

Una vez se dispone de la imagen de elevado margen dinámico, ésta se debe poder visualizar en la pantalla. No obstante, las pantallas tienen un margen dinámico reducido, con lo que el margen dinámico de la imagen debe compactarse. Para hacerlo se pueden utilizar transformaciones puntuales de compresión del margen dinámico, como puede ser la curva mostrada en la figura 5 o la operación trama de Adobe Photoshop al combinar capas.

fig5_melenchon

Figura 5. Transformación puntual para comprimir el margen dinámico. Aunque no se aprecia en el dibujo, en este caso el eje horizontal tiene las tonalidades de gris codificadas con más niveles que el eje vertical.

Las técnicas asociadas al HDRI buscan representar el elevado margen dinámico de una escena real, superando el obstáculo del limitado margen dinámico de los sensores digitales de captura. Por otra parte, las transformaciones puntuales pueden solucionar la limitación de margen dinámico asociado a los soportes de representación de información visual (pantalla, papel, etc.). Hay que tener en cuenta que para obtener una representación con suficiente precisión del margen dinámico se hace necesario utilizar codificaciones con un elevado número de bits por píxel, para poder representar con precisión suficiente valores de irradiación bajos y altos simultáneamente.

La vigencia de Ansel Adams en la esfera del new media (Antoni Marín)


Cita recomendada: MELENCHÓN MALDONADO, Javier. Tratamiento del rango dinámico en la imagen digital. Mosaic [en línea], febrero 2008, no. 63. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n63.0817.

Acerca del autor

Javier Melenchón Maldonado es Doctor por la URL en Tecnologías de la información y las comunicaciones y su gestión. Es profesor de los estudios de informática, Multimedia y Telecomunicación de la Universitat Oberta de Catalunya, profesor en el Grado en Multimedia de la UOC y director del Máster Universitario en Aplicaciones Multimedia de la UOC.

Su ámbito de trabajo cubre el tratamiento, publicación y distribución de contenidos digitales de audio, imagen y vídeo. Es autor de materiales docentes así como diversas publicaciones científicas relacionadas con este ámbito.

Es miembro del grupo de investigación ITOL (Interactive Tools for Online Learning), con cuyos miembros trabaja para mejorar la experiencia de aprendizaje online por parte de los estudiantes en las materias de tratamiento, publicación y distribución de contenidos digitales.