Universitat Oberta de Catalunya

Mari Luz Congosto

Mari Luz Congosto dice de sí misma que es una mujer “curiosa e inquieta”. Asegura que lo que de verdad le gusta es investigar, por cuyas sendas ha discurrido siempre su trayectoria profesional. Actualmente, prepara su doctorado en la Carlos III de Madrid, mientras acarrea a sus espaldas “toda una experiencia acumulada” que, en lugar de pesarle “como una losa”, la llena de “ideas y ganas de hacer cosas”. Es la autora del célebre blog Barriblog.

Entraste en la blogosfera en 2004, antes de ello habías trabajado en el mundo de la investigación y del desarrollo (e incluso en la Administración Local, 1984-1986) y te defines como una espectadora de Internet. ¿En qué crees que ha cambiado la web desde que empezaste a observar? ¿Cómo ves la evolución de los flujos de datos?

La web ha cambiado en la forma de vivirla. Antes la mirábamos como si fuera un escaparate, ahora estamos dentro de él. Los flujos de datos son cada vez más heterogéneos, más fraccionados y más volátiles.

¿Qué es un “Barriblog”? ¿De dónde viene esta idea y tu interés por los blogs? ¿Qué papel tienen hoy?

Desde mi punto de vista los blogs fueron un paso evolutivo de los foros, en el que la identidad digital de los usuarios se fortaleció.  De un avatar con sus opiniones y conocimientos que debatía en un  espacio virtual común se pasó a unas tertulias distribuidas en muchos salones virtuales, cada uno con la decoración a su gusto. El propietario del blog podía definir su identidad digital con unos contenidos diferenciados, mostrando sus preferencias y socializando con otros blogs.

Barriblog se inspiró en un post de Julen Iturbe titulado Mi barrio: First Life, que despertó mi curiosidad por descubrir cuáles eran esos barrios de blogs. Buscaba sus relaciones en tres dimensiones: la  recomendación mediante el blogroll, la cita por la mención dentro del post y la conversación en los comentarios. El grado de relación entre ellos puede ofrecer un nuevo enfoque en la búsqueda de información.

Hoy día los blogs, debido al uso de Twitter, han bajado la frecuencia de publicación perdiendo parte de la inmediatez que antes tenían. Han pasado a ser una publicación más reposada, pero muy necesaria para difundir información e ideas.

Hoy día centras tus análisis en Twitter, ¿por qué? ¿Qué te interesa de esta red?

Utilizo Twitter por tres razones: la primera porque es información pública, la segunda porque proporciona un API bien documentado y fácil de usar y la tercera porque en Twitter se pueden analizar las relaciones igual que en los blogs pero de una manera mucho más sencilla.

De esta red me interesan la relaciones tanto de la red estática de los seguidores  como de la red dinámica que generan las iteraciones.

Actualmente trabajas como investigadora en la Universidad Carlos III de Madrid, ¿cuál es el foco de tu investigación?

El objetivo final es crear un método de búsqueda de información basada en la relación entre usuarios. En este momento estoy estudiando la relevancia de los usuarios en Twitter teniendo en cuenta su impacto en otros usuarios. Es una medida basada en la relación dinámica que puede facilitar la caracterización usuarios, ayudar a identificar la fiabilidad de las fuentes de información y a comprender como se propagan los mensajes.

¿Cuándo y cómo empezaste a interesarte por la visualización de datos? ¿Qué le aporta a tu investigación?

El 15 de marzo de 2007 asistí a una conferencia de José Luis de Vicente que me hizo ver las posibilidades de la visualización para la idea que tenía en la cabeza de Barriblog. La visualización me ayuda a poder analizar y a descubrir patrones de comportamiento en grandes volúmenes de datos, representar información compleja como las relaciones o generar animaciones que permitan ver la evolución en el tiempo. Por otra parte facilita la divulgación de los resultados de una investigación a personas que no tienen que ser expertas en la materia.

¿Cuál es el proceso que sigues en proyectos como el ‘Experimento #manifiesto’? ¿De dónde surge la motivación?

Estos experimentos son consecuencia del interés que me despierta la reacción social de los usuarios ante decisiones políticas. Son situaciones excepcionales que consiguen aglutinar un gran número de personas en una misma conversación y permiten analizar la relaciones en un contexto.  Por otro lado, son sucesos de gran relevancia social que pueden aportar luz al estudio de la opinión ciudadana.

¿Cómo manejas y almacenas los datos? ¿Con qué problemas te encuentras?

Como son experimentos diferentes voy creado datasets independientes en texto plano que luego posproceso. Lo problemas de grandes volúmenes de datos son el almacenamiento y el procesado. Para no agotar los recursos de disco voy fraccionando y comprimiendo los ficheros cuando alcanzan un tamaño. Para el procesado siempre diseño algoritmos escalables.

¿Qué herramientas utilizas durante el proceso de trabajo? ¿Cómo las eliges?

Para procesar utilizo el lenguaje Python porque es muy adecuado para prototipado rápido. Es muy productivo y fácil de manejar. Además tiene la ventaja de tener una gran comunidad de desarrolladores que han generado una enorme cantidad de librerías que pueden ser reutilizadas.

Para visualizar depende del experimento, la visualización tiene que dar respuesta a la preguntas que lo originan.

¿Cómo decides qué visualización usar en cada proyecto? ¿En qué nos debemos basar para escoger un tipo de visualización u otra?

Generalmente cada tipo de dato va a requerir un tipo de visualización. Para texto podemos usar las nubes de tags, si hay una componente temporal disponemos de múltiples tipos de timeline, si tenemos que representar jerarquías son muy adecuados los treemap. Para las relaciones tendremos que buscar una herramienta que visualice grafos y mapas para la información  geolocalizada. Para grafos suelo utilizar gephi, para treemaps y timelines utilizo librerías JavaScript como Google API y Protovis.

¿Cómo extraes conclusiones del análisis visual de tal cantidad de datos? ¿Qué tipo de preguntas te planteas? ¿Realizas algún tipo de análisis cualitativo?

La visualización permite ver patrones de comportamiento que quedan ocultos en las estadísticas. Por ejemplo, en el experimento de Enjut@ Mojamut@, que medía la actividad en Internet de los bloqueros y bloqueras,  al ver la propagación del meme de forma visual aparecía la falta de comunicación entre chicos y chicas.  En el experimento TijerasNO, que analizaba la reacción ante los recortes en la Ciencia, se apreciaba cómo Twitter fue el detonante que  arrancó la campaña pero que fueron los blogs con una capacidad de propagación más lenta pero más persistente los que mantuvieron la movilización durante varios días. En el experimento #manifiesto, que estudiaba la movilización contra la ley de sostenibilidad,  se apreciaba como los medios de comunicación perdían influencia sobre los usuarios a favor de los blogs y como se ratificaba esta tendencia en el 15M.

Creo que la visualización es el punto medio entre el análisis cuantitativo y cualitativo. Si la parte cuantitativa se consolida en un modelo visual será más comprensible para el especialista cualitativo. Estoy en el lado cuantitativo y puedo intuir cuál es el modelo visual para representarlo, pero un sin duda una persona del lado cualitativo aportaría más profundidad en el análisis. Cada vez son más necesarios los equipos de investigación multidisciplinares.

Muchos de los temas que abordas tienen una gran repercusión social. ¿Trabajas en colaboración con investigadores de otros centros o con organizaciones a las que les interese esta información?

He realizado algunas colaboraciones con profesionales de la comunicación y ahora estoy colaborando en un estudio de ciberdemocracia, pero a título personal. Oficialmente no pertenezco a ningún equipo multidisciplinar.

Muchas personas utilizamos nuestras redes sociales como filtros de información. Es decir, ya no acudimos a los periódicos digitales, sino que nos metemos en nuestros perfiles de Twitter y Facebook y esperamos a ver qué noticias han seleccionado nuestros seguidores o amigos. ¿Crees que las “redes de comunicación” empiezan a sustituir los medios de comunicación?

Sustituirlos no, Twitter y Facebook son unos grandes difusores de noticias de prensa. Lo que si van a perder los medios es el monopolio de la agenda informativa, ocurrió cuando no informaron del 15M y ocurrirá siempre que pretendan ocultar alguna información.

Y en este panorama de redes de comunicación ¿qué papel crees que va a tener la visualización de datos? ¿Hacia dónde camina?

Los medios de comunicación deberían encaminase hacia el periodismo de datos en los que la visualización tiene un papel fundamental. En la actualidad se pueden contar con los dedos de una mano los periódicos que están trabajando en ello de forma seria. Sin embargo, debería impulsarse porque se dan unas condiciones favorables, como la apertura de datos por los gobiernos, la inmensa cantidad de información pública que hay en la red, la mejora continua de las herramientas que procesan y visualizan datos y la aparición de nuevos perfiles profesionales especializados en visualización.

Mari Luz Congostto

M. Luz Congosto es Licenciada en Informática por la Universidad Politécnica de Madrid y Máster en Telemática por la Universidad Carlos III. Actualmente es investigadora en el Departamento de Telemática de la Universidad Carlos III, realizando una tesis sobre “Métodos de búsqueda de información basada en la relación”. Utiliza la visualización para analizar los resultados de la minería de datos de la Red. Participó en el “Visualizar-07” del Medialab Prado y en 2010 impartió un curso de Visualización en el CAMON de Madrid Anteriormente ha trabajado en entornos de investigación en Telefónica I+D, ELIOP y Fujitsu. Ha combinado su faceta técnica con la divulgación tecnológica, creando en el 2005 el Boletín de la Sociedad de la Información y en el 2006 la plataforma de blogs científicos “Creamos el futuro”, ambos para Fundación Telefónica. Su blog personal es Barriblog.com @congosto