Universitat Oberta de Catalunya

«VisionarIAs», una exposición sobre arte e inteligencia artificial, visión y visualidad en tiempos del algoritmo

En los últimos años hemos asistido a una explosión del interés por las técnicas de inteligencia artificial (IA) aplicadas a la creación, y a una consiguiente avalancha mediática acerca de este tema. La exposición «VisionarIAs» quiere cuestionar los lugares comunes y las suspicacias que surgen cuando hablamos sobre creatividad e inteligencia artificial y observar cómo la IA y la creatividad humana interactúan y hacen evolucionar el contexto artístico, cuestionando desde diferentes perspectivas nuestro vínculo con las máquinas para establecer nuevas modalidades de relación más allá de lo utilitario.

La exposición «VisionarIAs» trae a Etopia el trabajo de Anna Ridler, Aarati Akkapeddi, Helena Sarin, Patrick Tresset, Libby Heaney, Ian Gouldstone, Mónica Rikić, Mario Klingemann, Sofia Crespo y Entangled Others. Diez artistas internacionales de enorme prestigio e interés, cuyas obras se sitúan en los campos del arte generativo, la robótica y el trabajo con inteligencias artificiales. Todos ellos tienen en común un gusto por las creaciones innovadoras, disruptivas, con una gran factura técnica y trascendencia discursiva.

Anna Ridler, Let me dream Again, en «VisionarIAs», exposición en Etopia. Imagen de Julian Fallas.

En una publicación de la Sociedad Aristotélica de 1956, Walter Bryce Gallie (1912-1998) introdujo la idea del «concepto esencialmente impugnado». Esta expresión busca facilitar la comprensión de nociones cualitativamente abstractas, como «arte», «filantropía» y «justicia social», utilizadas en los campos de la estética, la ciencia política, la historia, la filosofía o la religión. La dra. Anna Jordanous [1] relaciona en su tesis doctoral la creatividad con el término «concepto esencialmente impugnado».

La creatividad humana es un concepto líquido, que resulta enormemente difícil de definir y delimitar. La noción de creatividad aplicada a la inteligencia artificial ha sido objeto de discusión constante dado que el acto creativo es considerado por muchos el último reducto de lo humano. Para poder sistematizar este concepto poroso de la creatividad y aplicarlo a la producción de las IA, se pueden establecer distintos parámetros. Según Colton, [2] para que una IA pueda considerarse creativa, el software debería exhibir comportamientos en los que se pueda proyectar: habilidad, apreciación (valoración), imaginación, intencionalidad, aprendizaje, innovación, reflexión. Dejamos al espectador reflexionar sobre estos mecanismos como una manera de abordar nuevas formas de concebir la relación creativa entre artistas e inteligencias artificiales, pudiendo hablar de cocreación o creatividad aumentada.

A la relación entre creatividad e IA queremos superponer otra dimensión y explorar los conceptos de visión y visualidad [3] en relación con la creatividad de las máquinas y su impacto en la creación artística. Los sentidos son la puerta de acceso al mundo físico y de esta experiencia del mundo tangible se nutre la creatividad: una de las funciones tradicionales del recrear la realidad. Con esta exposición nos interrogamos sobre la mirada, la visión de las máquinas y la diferencia con la visión o la mirada humana a la hora de crear o de recrear una cosmovisión.

Aarati Akkappedi, detección de objetos, estudio para After Goya.

Pinceladas sobre inteligencia artificial

La inteligencia artificial (IA) implica la automatización de comportamientos que normalmente requieren inteligencia en las personas. En 1950 el matemático británico Alan Turing publica su artículo «Pueden pensar las máquinas?» («Can machines think?») donde plantea el juego de la imitación que pasará a la historia como test de Turing. [4]. Este hecho es considerado como un primer hito en la constitución de la inteligencia artificial como disciplina científica.

El interés por el estudio de la inteligencia artificial ha sido cíclico, en momentos como el actual la IA alcanza niveles vertiginosos de atención. Se alterna con épocas donde este interés decae, estos periodos se conocen como inviernos de la IA, y ocurrieron entre 1974-1980 y 1987-1993.

Ahora la preeminencia del aprendizaje profundo (deep learning) es tal, que parece que no hayan existido otras aproximaciones. Sin embargo, a lo largo de los últimos setenta años se han sucedido diferentes modelos y técnicas en el campo de la inteligencia artificial. Si bien es cierto que la idea de aprendizaje figura ya en el artículo de Turing de 1950, esta aproximación ha coexistido con muchas otras. Durante mucho tiempo se ha entrenado a las máquinas a través de la lógica. Para hacer que una máquina detectara un ser humano, se le proporcionaba información lo más detallada posible: un ser humano tiene dos piernas, dos brazos y camina erguido, ergo si tiene dos piernas, dos brazos y camina erguido es un humano. El problema venía cuando había que explicar las excepciones, un ser humano puede tener solo una pierna. El conocimiento adquirido en nuestra relación con el mundo sensible es increíblemente difícil de modelar y sistematizar.

Mónica Rikić, La computadora que quería ser incomputable, en exposición «VisionarIAs» en Etopia. Imagen de Julian Fallas.

Machine learning, deep learning (aprendizaje automático, aprendizaje profundo y redes neuronales)

En lugar de programar estos comportamientos directamente, el aprendizaje automático es una técnica de IA que intenta aprenderlos a partir de ejemplos expresados en datos, para luego usar este aprendizaje en varias tareas. Estas tareas implican, por ejemplo, responder preguntas sobre los datos (aprendizaje supervisado), o agrupar los datos (no supervisado) y, más recientemente, generar nuevos datos que se parecen al original. El aprendizaje profundo es una forma de aprendizaje automático que implica el entrenamiento de redes neuronales artificiales basadas libremente en cerebros humanos y es responsable del reciente y espectacular aumento de capacidad de la inteligencia artificial.

La aparición de enormes cantidades de datos en los años 2000 (big data) permitió el despegue de las técnicas de aprendizaje automático que han ido obteniendo cada vez mejores resultados. En la última década, el aprendizaje automático nos ha proporcionado automóviles autónomos, reconocimiento de voz práctico, búsqueda web eficaz y una comprensión mucho mejor del genoma humano, con lo que ha pasado a formar parte de manera omnipresente de nuestra realidad. El aprendizaje profundo es una función de inteligencia artificial que imita el funcionamiento del cerebro humano en el procesamiento de datos para su uso en la detección de objetos, el reconocimiento del habla, la traducción de idiomas o la toma de decisiones. La IA de aprendizaje profundo puede aprender sin supervisión, basándose en datos que no están estructurados ni etiquetados. El sistema no se entrena a través de abstracciones o conceptos, sino que se usa la estadística, proporcionado a los modelos ingentes cantidades de datos.

Sofía Crespo y Entangled Others, Beneath the neural waves, en «VisionarIAs», en Etopia. Imagen de Julian Fallas.

Por ello no es necesario modelar el conocimiento del mundo sensible, porque el sistema aprenderá observando, incluso de manera no supervisada. Cuando los datos son imágenes, música o poemas, el aprendizaje profundo generativo puede producir nuevas piezas que, a primera vista, son casi de tan alta calidad como las que producen las personas.

Por ejemplo, se suministran al sistema millones de imágenes de un objeto determinado, codificadas en una serie de números. El sistema aprende cómo es el objeto, reconociendo los patrones numéricos contenidos en las imágenes, que constituye el set de entrenamiento. Cuando se muestra al sistema una nueva imagen del objeto estudiado, este puede determinar, con un enorme grado de precisión, si la imagen contiene el objeto o no.

De todas las técnicas de aprendizaje profundo existentes, la que sin duda ha producido resultados más espectaculares en el campo de la creatividad es la de las redes neuronales generativas adversarias, o GAN, del inglés generative adversarial networks. También se ha traducido al español como «redes antagónicas». Dado un conjunto de datos de entrenamiento, esta técnica permite generar nuevos datos con las mismas características que los datos originales. Este tipo de redes neuronales se entrenan a través de una competición y fueron diseñadas en 2014 por Ian Goodfellow. Una red llamada generador produce falsificaciones y la otra llamada discriminador adivina si son reales o no. Las GAN han sido desde su aparición utilizadas con profusión por los artistas, muchas de las obras que se muestran en esta exposición emplean esta técnica.

Pongamos que los datos de entrenamiento son imágenes, entonces el sistema generará nuevas imágenes con un grado de realismo impensable hasta hace poco. Estos modelos generativos funcionan como si de un juego se tratase, para que una red gane, la otra tiene que perder, por eso son adversarias o antagónicas. Esto básicamente significa que el generador está entrenado para engañar al discriminador, lo que a su vez permite al modelo aprender de manera no supervisada.

Mario Klingemann, Approaching Destination, en «VisionarIAs», exposición en Etopia. Imagen de Julian Fallas.

Partiendo de los conceptos de visión y visualidad, las obras seleccionadas para la exposición pueden enmarcarse en contextos específicos, todos ellos inherentes a la visión de las máquinas. Cada una de las obras explora diferencias con la visión humana como método para informar el proceso creativo. Los diferentes tipos de visualidad, vídeo, fotografía, diseño, pintura o escultura, definen cómo vemos nuestra sociedad, interpretan cómo es el mundo.

La acción de ver es sinónimo de conocimiento, vivimos en una sociedad eminentemente visual. El historiador y filósofo Martin Jay emplea el término «ocularcentrismo» para describir el papel preponderante que ocupa lo visual en el mundo contemporáneo.

A priori, la visión se refiere a una operación física, es lo que el ojo humano es fisiológicamente capaz de ver, y la visualidad se entiende más como un hecho social, es la forma en que vemos, percibimos lo visto y lo que dejamos de ver. Sin embargo, la visión tiene un componente social e histórico, y la visualidad necesita el cuerpo y la mente. La diferencia de matiz entre los dos términos señala una diferencia entre el mecanismo de la vista y sus técnicas históricas, entre el dato de visión y sus determinaciones discursivas. Todo esto da un vuelco cuando quien ve es una máquina; ya que los mecanismos de visión son diferentes y los referentes, motivos y contextos también.

Patrick Tresset, Human Study# 1, RNP, en «VisionarIAs», Etopia. Imagen de Julian Fallas.

La visión artificial es un proceso durante el cual el sistema comienza con la adquisición de las imágenes, sigue con el análisis y emplea la tecnología para extraer información de la imagen de forma automatizada. La información extraída puede llegar a ser un conjunto complejo de datos como la identidad, la posición y la orientación de cada objeto en una imagen. Los componentes de un sistema de inspección automática generalmente incluyen iluminación, una cámara u otro generador de imágenes, un procesador, software y dispositivos de salida.

Después de adquirir una imagen, se procesa. Las funciones de procesamiento central generalmente las realiza una CPU, una GPU, una FPGA o una combinación de estas. Se utilizan etapas múltiples de procesamiento. El registro de imágenes es el proceso de transformar diferentes conjuntos de datos en un sistema de coordenadas. Los datos pueden ser múltiples fotografías, datos de diferentes sensores, tiempos, profundidades o puntos de vista.

La segmentación sirve para dividir una imagen digital en varias partes, lo que simplifica la representación y la hace más fácil de analizar. A continuación, se detectan los bordes de los objetos y se analiza el color. Se pasa a la detección y extracción de manchas, proceso por el que se inspecciona la imagen en busca de manchas de píxeles conectados como puntos de referencia de la imagen.

Se termina con el procesamiento con redes neuronales que toman decisiones con variables múltiples y de forma ponderada y autodidacta. No es hasta 2019 cuando se generaliza el uso de las redes generativas antagónicas, GAN, en el procesamiento de imágenes, lo que expande significativamente las capacidades de la visión artificial. Estamos asistiendo a los primeros compases de la revolución que esta técnica de aprendizaje profundo supone en la visión de las máquinas.

Libby Heaney, Elvis, en «VisionarIAs», Etopia. Imagen de Julian Fallas.

Las obras de «VisionarIAs» son pioneras y constituyen la vanguardia de esta revolución. Aunque nos falte perspectiva histórica para evaluar el alcance y la velocidad de los cambios, el impacto en nuestras sociedades de la presente revolución tecnológica será duradero y sistémico. Incluso en este estadio temprano, podemos aventurar que supone un cambio de paradigma en nuestras relaciones interpersonales y como sociedad. A través de los trabajos de los diez artistas de «VisionarIAs» dibujamos la manera en que la visión de las máquinas impacta nuestra propia mirada. Recorriendo la exposición podemos intuir la construcción conjunta de una cosmovisión nueva, que explicará nuestro mundo a las generaciones venideras.

Estamos asistiendo a la construcción de una alteridad, cómo nos ve la tecnología, cómo la vemos nosotros y qué proyectamos en ella. La idea del otro es a menudo fuente de tensión y conflicto, por ello quizás sea un buen momento para plantear una construcción distinta de la máquina a partir de la aceptación de la diferencia.

Helena Sarin, Neurobricolage, en «VisionarIAs», exposición en Etopia. Imagen de Julian Fallas.

Documentación

[1] JORDANOUS, Anna. «Evaluating computational creativity: a standardised procedure for evaluating creative systems and its application» (2013) [en línea]. Disponible en: http://sro.sussex.ac.uk/id/eprint/44741/

[2] COLTON, Simon; PEASE, Alison; GUCKELSBERGER, Christian; MCCORMACK, Jon; LLANO, Maria Teresa. «On the Machine Condition and its Creative Expression». En:Proceedings of the International Conference on Computational Creativity (ICCC), (2020).

[3] JAY, Martin. «Scopic Regimes of Modernity, in Vision and Visuality». En FOSTER, Hal: Dia Art Foundation, Discussions in Contemporary Culture, Number 2, Bay Press, Seattle, 1988.

[4] GONZÁLEZ, Rodrigo. «El Test de Turing: dos mitos, un dogma». Centro de Lógica y Filosofía Analítica. Instituto de Filosofía, Katholieke Universiteit Leuven. Belgium.


Cita recomendada: PÉREZ FERRER, Blanca. «VisionariAs una exposición sobre arte e Inteligencia Artificial, visión y visualidad en tiempos del algoritmo». Mosaic [en línea], junio 2021, no. 194. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n194.2123

Acerca del autor

Licenciada en Historia del Arte por la Universidad de Zaragoza y máster en Mediación Cultural por la Escuela del Louvre. En París trabaja para el ayuntamiento en cultura y juventud y es responsable del servicio de la mediación y de relación con el público del Institut des Cultures d'Islam, establecimiento cultural de París. En 2016 se traslada a Reino Unido, donde trabaja en la Universidad de Falmouth y en la de Goldsmiths en Londres. Desde 2020 coordina proyectos europeos y el programa de residencias en Etopia Centro de Arte y Tecnología.

Deja un comentario