Universitat Oberta de Catalunya

Carles Espuny y Rosa María Abenza

“Dentro de los personajes virtuales hay tres tecnologías distintas. Una es la de SAM, sin intervención humana de ningún tipo; incluso la voz es completamente automática. Otro tipo de personaje virtual es el de Manolo, con cierto automatismo pero que necesita de una locución humana….”

Activa Multimedia es una empresa instalada en Barcelona que ofrece soluciones y servicios al sector audiovisual. Trabaja a nivel nacional e internacional y enmarca su actividad en cuatro grandes áreas: TV digital interactiva (TVI), producción y gestión de vídeo, software de gestión y contenidos. ¿Qué proyectos destacaríais dentro de la empresa?

Uno de los principales proyectos de Activa Multimedia es el de los caracteres virtuales. Y, dentro de ellos, presentadores para televisión, móvil, internet, o asistentes virtuales para web. Destacar también las herramientas de automatización, tanto de contenidos como de continuidad para cadenas de televisión. Y un canal meteorológico, con lo que producimos muchos contenidos de meteorología y los utilizamos para nuestro canal, que es Canal Meteo de Digital+, pero también para exportar a otros medios de comunicación.

Como una agencia de meteorología…

Somos fuertes como proveedores de contenidos meteorológicos. Los inicios fueron estos y, a raíz de estos contenidos, empezamos a crear todas las herramientas de automatismo que permitían gestionar el canal automáticamente. Luego nacieron las otras ramas como la de la televisión interactiva (TVI) o los iVACS, los personajes virtuales.

El concepto de automatización, el automatismo, es un concepto presente en muchos de vuestros proyectos.

La empresa buscaba poder llevar toda la continuidad del canal de meteorología con los recursos mínimos. Por eso desarrollamos herramientas de automatización: introducir la información en unas bases de datos que, automáticamente y con un mínimo esfuerzo humano, pudiera publicarse. Por publicación automática de contenidos nos referimos a un sistema para poder realizar una televisión completa, como lo que tenemos en Canal Meteo: publicación y edición de escaletas, que se muestren automáticamente los gráficos a partir de bases de datos de meteorología

Una vez creadas las herramientas de automatización vimos que era muy fácil venderlo para pequeñas televisiones, televisiones locales… y, de estas herramientas que habíamos creado ‘a lo grande’ para nosotros, hicimos versiones pequeñas para poderlo vender fuera: herramientas y contenido. Y hemos ido evolucionando, creando herramientas de automatización más potentes, y tenemos muchos clientes que nos compran los contenidos, y las herramientas para la publicación de estos contenidos.

Dando un paso más, disponéis de un hombre del tiempo virtual capaz de dar una previsión las 24 horas del día, los 365 días del año: SAM.

Sin descansar. SAM nace de la propuesta de tener un hombre del tiempo virtual, aprovechando todo el sistema que ya teníamos de base de datos con información meteorológica. A partir de los datos se generó un sistema, en un proyecto de colaboración con la Universitat Pompeu Fabra e Ingeniería y Arquitectura La Salle, para que, partiendo de las mismas bases de datos y sin intervención humana, acabase saliendo un presentador virtual que nos diera la previsión del tiempo.

¿Cae bien a vuestros meteorólogos, tener un compañero tan trabajador?

Sí, porque no les ha sustituido y lo que ha hecho es liberarlos. Ahora se pueden centrar más en la tarea de previsiones porque tienen que preparar menos guiones y salir menos en antena. Lo que está claro es que actualmente todavía no tenemos la tecnología para que una animación pueda sustituir completamente una persona humana.

Muchas veces llegan las tecnologías y da la sensación que vienen a sustituir, cuando vienen a complementar.

Gracias a la tecnología, también hemos conseguido, a través de la web, dar la previsión para más de 200 ciudades del mundo, a tiempo real y en diferentes idiomas. Si esto lo hiciera una persona…

Es un tema de volumen.

Exacto, sería imposible… sin contratar a más gente.

¿Cómo es el proceso de creación de SAM?

La idea pasa por un equipo de contenidos: analizan cómo tiene que ser el producto final y los grafistas y animadores diseñan el modelo. Este modelo se compatibiliza en un motor creado especialmente para la animación de los personajes virtuales.
Partiendo de las mismas bases de datos de las que parten los meteorólogos para hacer sus previsiones, interpretamos los datos y los pasamos a través de un text-to-speech, un generador sintético de voz. El sintetizador genera un diálogo, que pasa a un motor de generación de imagen 3D, donde reconoce automáticamente los movimientos que tiene que hacer —gestos y labios— y sale la predicción. Y así funciona también con los otros personajes virtuales, solo que, con SAM, no hay ningún tipo de intervención humana.

Podemos decir que la automatización es una respuesta a las nuevas formas de consumir, vídeo bajo demanda e inmediatez. Pero hay que mantener al día las bases de datos, seguir desarrollando…

Todo sale de la empresa: tenemos un departamento técnico, desarrolladores y un departamento de meteorología. Decidimos automatizar el trabajo de lectura del Meteosat, por ejemplo: los meteorólogos escribieron las cuatro fórmulas que pasaron al departamento técnico. Nosotros aplicamos las fórmulas, las programamos y lo automatizamos todo. Ahora los meteorólogos se saltan esta parte y pasan directamente al retoque humano de las previsiones que se generan.

Tenéis más personajes virtuales… La Tuixent, también meteoróloga, del programa Temps de Neu en el “Canal 33” de “Televisió de Catalunya”…

Y Manolo, que era un personaje muy divertido, que salía en la web de elsesports.cat. Manolo era un personaje nacido en Els Matins de Catalunya Ràdio, de Antoni Bassas, que era camarero en un bar de Madrid y madridista. Se llamaban por teléfono y comentaban la jornada de fútbol. Lo trasladamos a la web: la gente enviaba preguntas a Manolo y el personaje virtual las respondía.

Y otros personajes como el bonsái del ClubSuper3, o Jiménez-Losantos y Francino de El Intermedio. Pero estos últimos interaccionan con personas.

Dentro de los personajes virtuales hay tres tecnologías distintas. Una es la de SAM, sin intervención humana de ningún tipo; incluso la voz es completamente automática. Otro tipo de personaje virtual es el de Manolo, con cierto automatismo pero que necesita de una locución humana. A partir de un archivo de audio, que entraba dentro del motor generador de personajes virtuales, automáticamente y sin ningún tipo de edición de vídeo, acababa saliendo el Manolo con la voz, y con expresiones y movimientos generados automáticamente a través de variables aleatorias. Y cada vez que generaba un vídeo, salía diferente. El tercer tipo de personaje virtual, como los que comentáis, son los ‘títeres virtuales’: aquí no hay automatización, es producción en directo. Normalmente, detrás hay dos personas: un actor, que es el que pone la voz en directo, y un operador, que es el que va moviendo el personaje. El actor está con el guión y el personaje automatiza el labial en tiempo real. Mientras, el operador mediante distintos dispositivos (joysticks, teclados midi…) va controlando las expresiones, los movimientos de la cara, si camina… Es como si fuera un actor, que tiene su guión, pero en lugar de estar delante de la cámara está detrás manipulando.

¡Qué rol!

Son titiriteros. Animadores que han aprendido ese arte con mucha experiencia y horas de animar.

Con SAM no hay guiones ni escaletas…

Hay unos ‘guiones predefinidos’ y él escoge el que sea conveniente, si quiere hacer la previsión de la mañana, de la noche, del día siguiente…

¿Los iVAC (Interactive Virtual Automatic Characters) son un catálogo propio, o también exportáis el producto fuera de la empresa?

Uno de los productos que vendemos es lo que llamamos iVAC Editor. Dispones de un personaje virtual de nuestro catálogo, o uno hecho expresamente para lo que tú quieras. Y, con el editor, puedes configurar el personaje: color del pelo, los ojos, ropa, complementos… y, a partir de aquí, generar un text-to-speech o una locución, y un vídeo final: instalado en tu ordenador o vía web. Así tienes la libertad de escoger el aspecto del personaje, hacerle decir lo que quieras y utilizarlo en un portal de noticias, como asistente virtual… incluso para el móvil.

Precisamente, aunque la convergencia digital nos lleva a eliminar fronteras entre distintos medios, ¿parece que se tendría que dar un tratamiento distinto para emitir lo mismo por televisión que por web, o por un teléfono móvil?

Hay cosas a tener en cuenta, como la pantalla. En televisión puedes tener un personaje virtual en plano americano (de rodillas a cabeza) pero en el móvil necesitas un primer plano para que se puedan ver las expresiones de la cara y los movimientos de la boca. A nivel técnico, hay que tener en cuenta el formato de la salida, pero el proceso de creación y automatización es el mismo.

Se tiende hacia un contenido igual, con una distribución multiplataforma, ajustando a las características de cada medio. Ya no se producen contenidos distintos para cada medio, con guiones distintos… ¿en general?

Puede ser interesante. Por internet puede que te interese leer un texto corto, en cambio por el móvil tendrá que ser la mitad. Por tanto sí se tiene que poder adecuar a un medio o a otro: si SAM hace predicciones por la tele de 3 minutos, si lo envías por mms durará 30 segundos, resumido y con los factores clave.

O sea que hay muchos más factores. Parece que puedes partir del mismo contenido pero tienes que tener en cuenta ciertos parámetros más allá de la resolución.

Tienes que tener en cuenta el usuario y cómo está consultando la información. Si está consultando en la tele y a distancia tendrá una actitud más pasiva, por ejemplo.

Hablando de actitudes delante de la televisión, puede cambiar si la televisión interactiva empieza a ser una realidad al alcance. Aunque ya hace mucho tiempo que funciona, todavía no llega a mucha gente…

Porque empezó con los canales de pago que, como ya era en digital, además de emitir la señal de televisión, podían emitir unos datos asociados al canal. Y entre estos datos estaban las aplicaciones interactivas.

¿En qué punto está ahora la televisión interactiva, tecnológicamente hablando?¿ Con qué formatos se trabaja?

Ahora hablamos de TDT, que es la que todos recibimos en casa. Para la interactividad en la TDT se escogió un estándar, el MHP, siglas de Multimedia Home Platform, que es un lenguaje basado en Java para hacer la parte de interactividad. El problema es que se han vendido muchos receptores pero sin interactividad; básicamente, son zappers, que te permiten decodificar la imagen y el sonido, pero no interpretar estos datos asociados a los canales.

En países como Italia el estado ha apostado por el estándar y ha subvencionado todos los decodificadores con MHP. Pero en España no ha habido ninguna normativa de este estilo y claro, es mucho más económico vender decodificadores sin interactividad.

Una causa, por tanto, de que haya tan pocos usuarios de televisión interactiva puede ser ésta.

El precio de los decodificadores. Y los que hay en el mercado tampoco se publicitan como que tienen interactivos asociados, con lo que solo parecen más caros. Lo que implica que, si no hay receptores, las cadenas no invierten en hacer servicios atractivos.

Ahora, quienes utilizan la televisión interactiva, ¿para qué lo hacen?

Para consultar la programación, ver noticias, el tiempo… Por ejemplo, en el caso de TV3, exportamos todos los contenidos del portal de Televisió de Catalunya a varios medios, uno de los cuales es la televisión interactiva. De modo que cuando entras en TV3 puedes ver casi toda la información que hay en la web, también de forma interactiva, sin tener que ir al ordenador.

Se ofrece información y servicios. Incluso se puede pedir hora al médico a través de la TVI…

Hay dos tipos de interactividad. La local, en que el telespectador consulta la información en el momento que la quiere, o con interactividad asociada al programa que se está emitiendo. Por ejemplo, si estás viendo un concurso y aparece un banner diciendo que puedes participar respondiendo al concurso con el mando a distancia. En este caso, mediante el canal de retorno, que es la ADSL o el cable telefónico directamente conectado al decodificador, envías la información al servidor y este computa la participación. Es interacción con retorno.

Y después está este otro tipo de interactividad que comentáis: el poder hacer transacciones desde la televisión. Estás sentado en el sofá y quieres pedir hora al médico. Pues puedes entrar en una aplicación que, simplemente con tres clics, accedes a la agenda de tu médico y reservas la hora. Incluso, reconociendo el DNI electrónico, o pudiendo comprar entradas para el cine con una tarjeta monedero, introduciendo una tarjeta en el decodificador. O sea que la interacción, el hecho de unirla a internet, a un canal de retorno, ya permite ofrecer más servicios interactivos. Bueno, este servicio de pedir hora no está en el aire ¡todavía!

Confiáis mucho en la interactividad que la TDT puede ofrecer.

Sobre todo ahora, cuando se une con el mundo IP, el poder descargar contenidos.

Pero la TDT sola, la tecnología de la TDT, ofrece todavía una interactividad limitada porque el canal de retorno…

Porque el canal de retorno viene condicionado a otro sistema de emisión de la TDT.

¿En qué punto estáis del desarrollo de contenidos y servicios? Parece que la demanda está limitada todavía, que el despliegue tiene barreras como la que acabamos de decir pero entendemos que la tecnología es robusta y el estándar es completo. Es posible que los servicios estén ralentizados por los pocos decodificadores…

De todas formas, pensad que el mundo de la televisión interactiva sí existe pero en lo que son los operadores: Imagenio, Orange, Digital+… todos estos tienen interactividad desde el principio. Puedes comprar en el videoclub, las películas, el fútbol… puedes hacer transferencias del banco, enviar SMS… Todo esto es televisión interactiva, y aquí no hay opción de tener un decodificador sin interactividad, porque es lo que te dan.

O sea que puede que la gente esté utilizando TVI y no sea consciente de ello….

Sí. TVI es la que te permite escoger lo que quieres ver, no tan supeditado a lo que te da el broadcaster en sí, la cadena.

Y por ahora la veis muy relacionada con la TDT.

Es que la otra es la de pago, exclusiva de los canales privados. La interactiva de todos es la TDT.

Qué hay de la relación entre la televisión por internet y la TDT, ¿será una competidora?

No, son mundos paralelos y muy diferentes, no es competidora. La televisión de sofá, por ponerle un nombre, aunque últimamente se está implantando la interactividad, es mucho más pasiva. Y la televisión de internet es un concepto diferente, el youtube… son estos servicios en que eres tú el que vas a buscar lo que quieres ver. No creemos que lleguen nunca a fusionarse. La televisión de sofá es la televisión de sofá y la de internet es la de internet: la actitud del espectador es muy distinta.

Quizá la clave de la interactividad es encontrar una aplicación que sea tan sencilla, tan fácil de utilizar y tan cómoda que ni el espectador se entere de que esto es interactividad. Es encontrar un servicio agradable, intuitivo, sencillo y básico.

Quizás a través del móvil… ¿Puede que el móvil se transforme en el mando a distancia del futuro?

Puede ser, porque la usabilidad que le puedes dar a un móvil es muy diferente de la de la televisión de casa. Es del ‘yo me tiro al sofá y que me echen lo que quieran’ a, con el móvil, por ejemplo en el tren, ‘yo quiero ver, ahora, algo que me distraiga’.

O utilizar el móvil para ver, por la tele, lo que quieres. Todo el mundo ya tiene móvil: no todos tienen decodificador interactivo pero todos tienen móvil. En el fondo aquí lo que hay es la TVI y la tecnología de la TVI, cómo se terminará utilizando.

Es ofrecer todas las posibilidades al usuario.

Es llegar a concentrar medios en una sola pantalla…

Es poder acceder a más información de la que te podría ofrecer una cadena de televisión.

No es el mismo audiovisual, sino que es participativo y que, muchas veces, lo que se está emitiendo en imágenes complementa, o tiene vida coexistiendo a nivel interactivo. Es el cambio de chip; por ahora la imagen y lo interactivo van por separado en TDT, son cosas paralelas y una puede vivir sin la otra. Puede que dentro de unos años una cosa no tendrá sentido sin la otra. Tiempo al tiempo.

Como al principio de la televisión, que se comportaban como en la radio, pero los estaban filmando.

Exacto. Ahora estamos aprendiendo a convivir en el mundo digital, que nos da unas riquezas mucho más fuertes que el audiovisual pasivo. Por ejemplo, estás viendo un programa de videoclips y, para decidir el siguiente, el espectador puede votar entre tres. Escoges el que quieres ver y la tele, automáticamente, cambia la programación y visualiza otro videoclip distinto.

Los espectadores se convierten en realizadores.

La televisión 2.0. Otro ejemplo: puedes estar viendo una carrera de F1 con posibilidad de descargar todos los ángulos, todas las cámaras que puedes ver, más allá de lo que graba y emite el realizador.

Pero hay una barrera importante…

También hay que pensar que las empresas están con unos dolores de cabeza importantes con el cambio digital y la apagada analógica. Cuando ya esté hecho, la forma de conseguir que la gente continúe mirándote será ofrecer nuevos servicios más atractivos.

Además, tenemos en cuenta que en digital hay más de veinte canales. El espectador no puede verlo todo, se perderá muchas cosas: tendrá que haber servicios que permitan no perderte según qué programas, para que la gente continúe mirando tu canal.

Etiquetas:
Carles Espuny y Rosa María Abenza

Carles Espuny y Rosa María Abenza tienen un curriculum similar: los dos han estudiado Ingeniería Superior Multimedia en La Salle (URL), y los dos hace unos ocho años que trabajan en Activa Multimedia Digital. Aunque con una trayectoria distinta dentro de la empresa, los dos comenzaron a trabajar en televisión interactiva. Ahora, Carles está en el departamento de investigación y desarrollo, donde trabaja con los caracteres virtuales automáticos (iVAC). Rosa se centró en la televisión interactiva, con sus diferentes tecnologías, empezando con OpenTV y Media Highway, ahora con nuevas tecnologías MHP, hacia el mundo IP. Activa Multimedia Digital es la sección tecnológica de la Corporació Catalana de Mitjans Audiovisuals (CCMAV) dedicada, principalmente, a la investigación de lo relacionado con el mundo audiovisual.