Marcelo Bertalmío (Montevideo, 1972) es profesor agregado de la UPF que centra su investigación en dos aspectos complementarios del mundo de la imagen: el procesado de imagen y la ciencia de la visión, todo ello, en el contexto de la aplicación para el cine.
Ha sido premiado con dos grants del European Research Council y ha obtenido varios reconocimientos como el SIAG/IS Prize de SIAM, el ICREA Academia o la beca Ramón y Cajal.
Sus publicaciones han recibido unas 9.000 citas, y entras las últimas destaca su libro Image processing for cinema. También ha dirigido dos largometrajes. “Los días con Ana” y “Ruido”, ganadores de varios premios y que han participado en varios festivales internacionales.
Marcelo, lo primero que revela la lectura de tu currículum es la pasión por el cine. ¿Desde cuándo y cuáles son la raíces de ésta pasión?
Mi pasión no es algo singular, crecí viendo películas. Disfrutaba haciéndolo, como mucha gente de mi generación, primero en la tele, en los dos canales que había. De hecho, tardé en darme cuenta que había películas malas: para mí, una película ¡siempre era buena!. Mis padres eran grandes cinéfilos y siempre me animaron a ver mucho cine, incluso engañándome; por ejemplo, mi padre, un día, hojeando el periódico me dijo: “mirá, ponen Solaris [de Tarkovski], una película de ciencia ficción.” “¡Ah! ¿como ‘La guerra de las galaxias’?” pregunté yo, que tendría unos 10 años. Él dudó y respondió “Sí…”. Ya me di cuenta después del ardid, pero disfruté mucho “Solaris” como audiovisual, aún sin entender nada. Siempre seguí viendo mucho cine, y cuando estudiaba Ingeniería Eléctrica en Uruguay hacíamos con mis amigos videos caseros y teatro aficionado, nada serio, solo por el placer de hacerlo.
¿Cómo decidiste ponerla en práctica en ámbitos tan diferentes?
No fue hasta el invierno de 1997, hace 20 años, que ocurrió algo. Estaba haciendo una estancia de unos meses en Minnesota; el día era corto, hacía un frío espantoso, estaba solo. Tuve una crisis existencial. Me dije: “¿qué coño hago aquí?”, y pensé “si pudiera hacer lo que realmente más me gustara, ¿qué sería?”. No tardé mucho en contestarme: “una película.” Entonces me compré un libro, Cómo hacer una película con lo que cuesta un coche usado, de Rick Schmidt, un libro fantástico, cuya tesis es que hacer una película no es tan difícil y lo único que se requiere es entusiasmo. Lo leí y me dije, “¡este es mi libro de cabecera!”. De vuelta a Uruguay escribí el guión de “Los días con Ana” y se lo mostré a mis amigos, estudiantes de ingeniería como yo, que aceptaron entusiasmados participar y enseguida hicieron suyo el proyecto de hacer esta película .
Queríamos que fuera una película de verdad, aunque ninguno estaba en contacto con el mundo del cine profesional. Uruguay tiene una ventaja: el grafo de personas es muy conexo; todo el mundo se conoce. Así, contactamos con gente del mundo audiovisual: no había una industria del cine, básicamente había gente ligada a la publicidad. Logramos involucrar a tres personas vinculadas profesionalmente al audiovisual, cuyo aporte fue clave pues lograron que la película se viera y escuchara bien.
La película fue rodada en …
En julio y agosto de 1998, y usábamos una cámara digital muy sencilla pero de última generación, como la que usaba Lars von Trier por esa época, ligera y manejable.
¿Y teníais financiación?
Pusimos dinero nosotros, y también mi padre, unos 3000 dólares en total, ¡que es lo que decía el libro que cuesta hacer una película!
¿Y cómo fue recibida la película?
De hecho, nosotros aspirábamos tan solo a poder enseñarla a familia y amigos, con ello ya nos hubiéramos dado por satisfechos. Pero la película fue aceptada a concurso en el festival de cine de Uruguay del año 2000 y ganó el primer premio en las tres categorías en las que participaba, con lo que además se estrenó en cine y estuvo más de un mes en cartel, y después participó en otros festivales, como la Muestra de Cine Latinoamericano de Lleida, y los festivales de cine latinoamericano de Toulouse y Londres. ¡Incluso fue aceptada en una sección en el Festival de San Sebastián!
¿Estás contento con el resultado?
¡Sí, claro!. Pensando de manera realista, teníamos muchas posibilidades de fracasar. Me recuerda lo que decía Miguel Ríos de su gira del “Rock and Ríos”: Lo hicieron porque no sabían que era imposible.
Y realizaste una segunda película:”Ruido”
Exacto. De vuelta a EEUU, haciendo el doctorado, escribí el guión, y con la repercusión de “Los días con Ana” conseguí interesar a una productora uruguaya que logró obtener financiación en una coproducción internacional con Argentina y España que incluía incluso a TV3, por lo que participaron algunos actores catalanes. El presupuesto fue mucho mayor, porque todo fue hecho de manera profesional, mientras que en “Los días con Ana” todos los actores y la mayor parte del equipo éramos aficionados, simples estudiantes de ingeniería. El rodaje fue más largo y agotador, con muchos departamentos implicados, y no lo pude disfrutar, aunque tengo claro que era difícil que fuera de otra manera, no lo digo con amargura.
¿Cuanto cuesta una producción de este tipo, más profesional?
En ese momento y lugar, 2004 en Uruguay, unos 500.000 dólares, que era mucho dinero en ese contexto y por eso la productora tardó más de tres años en conseguir toda la financiación.
¿Y cómo funcionó la película?
No funcionó con el público como pensábamos, sólo estuvo unos dos meses en cartelera en Uruguay y unas pocas semanas en Argentina y España. En cambio funcionó muy bien en festivales, como la Seminci de Valladolid, donde ganamos el premio del público en 2005, y ha participado en más de 20 festivales en todo el mundo, incluyendo los de Mar del Plata, Guadalajara, Chicago, Los Ángeles, Lleida, Tübingen (Alemania), Santiago de Chile, Vancouver, Toronto, Río de Janeiro, Biarritz, Oslo, El Cairo y Melbourne.
Paralelamente a tu actividad artística en el mundo del cine, tu ‘auténtica’ carrera profesional en el ámbito de la investigación va consolidándose, muy diferente a la trayectoria como director, pero también muy ligada al mundo del cine. Explícanos como se desarrolló y cuáles son sus orígenes, porque cuando estabas en Minnesota y se te ocurrió hacer una película, empezabas a especializarte en lo que después sería tu actividad profesional e investigadora principal.
Walter Murch, montajista de Coppola, decía en un libro que a toda la gente que conoce que trabaja en lo que le gusta, trabaja en lo que le gustaba cuando tenía 10 años. Es mi caso: cuando tenía 10 años eclosionaba el mundo de los clips musicales, y yo estaba obsesionado con eso. Siempre me ha gustado el mundo de la imagen, y haciendo ingeniería eléctrica pude canalizar esta pasión; curiosamente, mucha de la gente que se dedica a lo mismo que yo, el procesado de imagen, procede de ingeniería eléctrica, aunque no tengo del todo claro el porqué.
¿Hay algún momento decisivo, un turning point, en tu carrera profesional como investigador, como en el caso del cine?
Bueno, la parte principal de mi tesis doctoral fue un trabajo que ha tenido mucha repercusión y me ha abierto muchas puertas: un método, llamado Image inpainting, para eliminar objetos de imágenes reemplazándolos con lo que hay a su alrededor, de manera que en el resultado final no se pueda adivinar que allí antes estaba el objeto que se ha quitado (o sea, lo mismo que hacía Stalin con las fotos de sus enemigos políticos). Pero más que turning point lo que siempre he procurado es hacer lo que más me motiva, que es poder mejorar y modificar las imágenes para hacer más sencilla la labor del creador y ayudar a que las películas se vean tal como las ha concebido el director.
Veo que en este ámbito tienes dos áreas preferentes y complementarias, aunque muy diferentes: el procesamiento de imágenes tout court y la percepción de la imagen.
Sí, cierto. La cuestión es que ahora, con las nuevas cámaras, que tienen muchas más prestaciones, y con la gran variedad de formatos, pantallas y condiciones de visualización en que puede verse una película, no existen herramientas que puedan asegurar que lo que el espectador percibe al mirar su pantalla corresponde con lo que el creador decidió que se viera, la apariencia de la película decidida y fijada durante la fase de postproducción. Este es un problema que no está resuelto.
Mi aportación es la creación de métodos de procesamiento de imagen, usando sobre todo modelos matemáticos basados en modelos de la percepción visual. Porque en los rodajes se suelen poner luces artificiales para superar las limitaciones de las cámaras, no porque nuestra vista las necesite; de igual manera, en la postproducción se corrigen escena a escena los colores para adaptarlos a las limitaciones de la paleta de color de toda pantalla actual, que no son capaces de representar una gran variedad de colores que sí se pueden ver a simple vista. El trabajo que realizamos en mi equipo se dirige a automatizar estos procesos, desarrollando algoritmos que se puedan aplicar a imágenes captadas con cámaras convencionales y produzcan resultados que se puedan exhibir en pantallas convencionales, pero cuya ventaja radique en que imitan el procesamiento que hace nuestro sistema visual.
¿Quieres decir que de alguna manera el objetivo sería acabar, en cierto modo, con el proceso de posproducción, automatizándolo para cada pantalla?
No, no, la componente principal de la postproducción es artística/creativa, sólo que necesariamente hay una parte técnica orientada a que las cosas se vean como artísticamente se ha decidido que se deben ver, y es esta parte técnica no creativa la que queremos automatizar. Es algo muy complejo porque en la ciencia de la visión el problema de la percepción del color sigue abierto: nuestra percepción del color de un objeto depende de los otros objetos que hay en la escena, además de las condiciones de iluminación ambiente, lo que hemos visto anteriormente, y un sinfín de factores.
¿Y, así, el objetivo no es la pantalla, sino el ojo, o mejor dicho la percepción en el cerebro de los colores?
Exactamente. Lo que buscas es que lo que percibes en el set de rodaje o al final de la post-producción, con las modificaciones que desees, sea aquello que percibes cuando lo miras en la pantalla, en otro contexto muy diferente. Pero esto se hace actualmente en unas condiciones de laboratorio como son las de posproducción, en una sala oscura, con un monitor espectacular, mientras que el espectador podrá ver la película en una variedad cada vez mayor de condiciones: tipo de pantalla, condiciones de iluminación, etc. De esto se trata, de tener en cuenta estas condiciones prácticas de entorno y su influencia en la percepción, para optimizar al máximo los resultados de manera automatizada.
¿Podrías comentar brevemente cuáles son los resultados de tu investigación, que como vemos en tu currículum es ampliamente citada y reconocida con varios premios y grants?
En el contexto de los dos grants que tengo del consejo europeo de investigación hemos patentado un método para corregir el contraste y estamos en el proceso de patentar otro para el color. También estamos en contacto con la industria cinematográfica para introducir el primer método y aplicarlo tanto en la captura (en la cámara) como en la monitorización en rodaje y en la posproducción. Así pues, estamos cerca del uso industrial de este método. Nosotros estamos muy contentos con los resultados, no solo porque el método hace realmente lo que se le pide, sino especialmente porque está basado en mejorar modelos visuales y a su vez permite avanzar en una mejor comprensión de la percepción visual. Esto es gracias a que tenemos un modelo de la percepción: sin el modelo, no tendríamos nada.
Correcto. Esta cuestión me interesa, en este sentido: tienes un modelo explicativo de como funciona la percepción. ¿Por qué es mejor esto, que, por ejemplo, entrenar una red neuronal para que realice la mejora del contraste de la imagen, sin modelo alguno?
Las redes neuronales son fantásticas para muchas aplicaciones, pero no tanto, ni tan siquiera simplemente buenas, para muchas otras. No pueden aplicarse a todo, por ejemplo, en este caso: no veo cómo podría aplicarse el deep learning, es decir, las redes neuronales convolucionales, a esta cuestión. Es decir, en el caso concreto de nuestro método, la entrada es una imagen con un alto, o altísimo, contraste, es decir, de alto rango dinámico, que no puede representarse en pantallas convencionales, y la salida es la misma imagen con el contraste corregido, con bajo rango dinámico, para que pueda ser reproducido correctamente en estas pantallas, sin que el espectador perciba mucha diferencia entre ambas imágenes. Lo que tendrías que hacer con la red neuronal es introducir muchas, decenas de miles de imágenes de entradas con sus correspondientes salidas, para entrenar la red. Pero los ejemplos correctos, ¿cómo decides que lo son? Solo podrías hacerlo a partir de miles de experimentos con expertos, coloristas, para que crearan esta base de datos de imágenes modificadas manualmente. El coste tan solo de entrenar a tu red sería prohibitivo, nada te garantiza que la red neuronal aprendiera realmente a hacer el trabajo previsto, y, sobre todo, la red neuronal no te dará nunca un modelo de la visión, y por lo tanto, como es una caja negra, nunca sabrás en qué casos funcionará ni sabrás nunca cómo mejorarla. Mi modelo tiene limitaciones, pero como es un modelo se puede analizar, encontrar esas limitaciones y trabajar en eliminarlas, como estamos haciendo actualmente.
Pero quizá, usando procesos aleatorios de procesado de imagen por la red neuronal, valorado por expertos, también podría mejorar la propia red. ¿Por qué crees que es mejor la comprensión del proceso para la mejora de los resultados?
Es posible, pero la razón práctica es sólo un aspecto. La razón fundamental es científica: en último término, de lo que se trata es de entender los procesos que estudias, en este caso la visión, y no tan solo de obtener un producto que funcione en algunos aspectos concretos. Lo importante es entender la visión humana y tener un modelo explicativo, que hoy en día no existe, porque ello también permitirá tener una visión de conjunto que podrá aplicarse a otras muchas áreas, cosa imposible con estas cajas negras. En definitiva, es casi una cuestión de principios científicos: la ciencia debe trabajar para comprender su objeto de análisis, y no tan solo, aunque también (porque es el mejor campo de pruebas para testar si nuestra comprensión es acertada), para realizar productos que mejoren nuestra experiencia.
Una vez hemos hablado de los aspectos más destacados de tu carrera como director (ya hace 12 años de tu última película) y como investigador, podrías comentarnos tus nuevos proyectos tanto en el ámbito artístico como en el académico y si ya has empezado alguno.
En el ámbito de la dirección, tengo dos guiones para los que no he conseguido financiación, una comedia alocada sobre los servicios de inteligencia militar de una dictadura latinoamericana en 1983, y una comedia agridulce sobre dos adolescentes en Barcelona que en un fin de semana de verano quedan esposados el uno al otro y deben quitarse las esposas antes de que sus padres se enteren. Como he estado varios años buscando sin éxito levantar estos proyectos, seguramente lo que tengo que hacer es crear proyectos nuevos, escribir otros guiones.
En cuanto a la investigación, estoy empezando a trabajar en dos líneas:
- Estudiar el trabajo de profesionales de cine, en concreto directores de fotografía y coloristas, que son capaces de modificar imágenes para que tengan una apariencia “natural”, y formalizar estas técnicas para poder mejorar modelos de visión.
- Desarrollar métodos de procesamiento de imágenes que ayuden a la expresión artística de los directores de fotografía, permitiéndoles experimentar y modificar la apariencia de las imágenes en cuanto a contraste, color, textura, etc. de manera intuitiva.
Cita recomendada: MASIÀ, Ramon. Entrevista a Marcelo Bertalmío, director e investigador en procesado de imagen para el cine. Mosaic [en línea], abril 2017, no. 148. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n148.1817.