Mosaic | Todo lo que una persona pueda imaginar, la inteligencia artificial podrá hacerlo realidad

A lo largo de la historia del arte y el diseño, son numerosas las herramientas mecánicas y digitales utilizadas por los artistas y diseñadores para desarrollar tareas creativas. Desde las más antiguas máquinas de dibujar utilizando péndulos, pasando por software popular como FORTRAN, Flash, P5.js o Processing, hasta el uso de algoritmos evolutivos y las novedosas técnicas de inteligencia artificial.

El uso de software en el arte no se entendía como una herramienta más para conseguir el fin del artista, sino que ya era parcialmente responsable, y surgía con la propia idea. El arte generativo, en concreto el arte generativo computacional, es definido por Boden y Edmonds (2009) como un género en el que la obra de arte es el resultado obtenido de un programa de computadora cuando se deja ejecutar por sí mismo, con mínima o nula interferencia de un ser humano. La palabra mínimo, por supuesto, está abierta a interpretación, advierten (Boden y Edmonds, 2009). De algún modo, el artista mantiene una relación de colaboración con la computadora a la hora de crear, y, a veces, le da libertad de creación a dicha máquina para que el resultado final no recaiga en su totalidad en el artista.

La admiración que ha suscitado el arte generativo computacional, o todas aquellas creaciones realizadas con una computadora, no se produce por el reemplazo de las herramientas físicas por aplicaciones computacionales, como pueden ser las ofrecidas por Adobe Inc™, por ejemplo, sino por las obras en las que la computadora parece crear directamente el arte por sí solo. No obstante, la relativa independencia de la computadora se percibe cualitativamente diferente de las características de otras herramientas digitales en la historia del arte, y esto es lo que lo hace verdaderamente interesante y complejo de determinar. Una de las características fundamentales que encontramos en el arte generativo computacional es el poder de reproducción. Por ejemplo, en Schotter (Gravel) de 1968 de George Nees, el artista podía haber agregado miles de cuadritos o cajas con solo tener que modificar algunos cambios en el código (figura 1).

Podríamos decir que se trata de un proceso artístico automatizado. La facilidad con la que las computadoras pueden generar imágenes complejas contribuye, además, a la estética del arte generativo. De igual modo, las creaciones realizadas con las últimas técnicas de IA aplicadas a tareas de arte y diseño se basan en el proceso de reproducción, en este caso, con resultados cada vez más sofisticados e impactantes.

Figura 1. *Schotter (Gravel)* por Georg Nees (1968). Fuente: Klütsch (2007).

Los últimos avances en aprendizaje automático (machine learning) y redes neuronales (neural networks) dentro del campo de estudio de la inteligencia artificial (IA) han llevado a una rica comunidad de exploración artística, gran parte de la cual está sucediendo en la cultura visual de internet. El impacto del uso de técnicas de IA no solo supuso una nueva práctica experimental, sino que desembocó en la consolidación de un género independiente, nacido del arte generativo computacional y conocido popularmente como AI ART (artificial intelligence art). Este nuevo género lleva gestándose desde 2014: su progreso exponencial coincide con cada una de las sucesivas publicaciones en papers de técnicas de IA para generar imágenes y texto. Técnicas con las que los artistas podían, entre otras cosas, analizar y visualizar datos, usar técnicas de generación directa de imágenes, visualizar características o realizar transferencias de estilo.

Entre las técnicas más populares detrás de la llamada «época dorada del AI Art» (Bogost, 2019) destacan: DeepDream (Mordvintsev et al., 2015), con aquellas populares y virales imágenes psicodélicas; Style Transfer (Gatys et al., 2016), modelo capaz de reproducir una fotografía o una escena arbitraria con cierto estilo pictórico, manteniendo su contenido original; o las populares Generative Adversarial Networks (GANs) (Goodfellow et al., 2014), con las que se pueden generar nuevas imágenes (realistas o no) de una calidad cada vez más excepcional. Muchos fueron los artistas y programadores que paulatinamente utilizaron dichas técnicas para crear arte. Comenzaba así una nueva generación de artistas interesados en utilizar cada una de las técnicas novedosas que se popularizaban. El auge residía en la utilización de la técnica: resulta comprensible que la intencionalidad que reside en el AI Art haya quedado en que la novedad técnica prime sobre cualquier valor material y conceptual.

No obstante, dentro de la corriente del AI Art se pueden observar varias tendencias estéticas y discursos. Por ejemplo, el debate de la autoría y la presencia de la máquina en el desarrollo de la obra, que, aunque se trata de una controversia que en el arte lleva debatiéndose desde años atrás, con la inteligencia artificial esta discusión se agrava. La participación de la máquina en el proceso es la base fundamental en el AI Art, un hecho que se vuelve determinante: ¿quién es el autor de la obra?, ¿el humano o la IA? Muchos artistas aprovechan la utilización de estos algoritmos para basar la obra en la justificación del impacto que supone pensar que está hecha «por sí sola» con una IA, que ha sido la IA quien ha creado la obra. Sin embargo, a la hora de proclamarse autores, este dato cambia: el humano sigue proclamándose el artista, por encima de la máquina, aunque utilice a esta como cebo para impresionar.

Figura 2. Ejemplo de cocreación entre artista y máquina. La artista Sougwen Chung trabajando en su estudio de Brooklyn, fotografiada por Celeste Sloman para *The Washington Post*. Fuente: Kaufman (2020).

En este punto actual de la historia del arte contemporáneo y el campo del diseño, cobran verdadero sentido los seis niveles descritos por Mallary, ya que describen fielmente el transcurso de la relación en el arte entre el humano y la máquina. Con la inteligencia artificial se ha llegado al quinto nivel, en el que la máquina o la computadora se consideran entes autónomos. No obstante, Mallary augura un futuro más atrevido en su sexto nivel: «donde el artista o escultor ya no es necesario para la creación, la máquina ya habrá alcanzado algún tipo de existencia orgánica y autorreplicante, o se habrá convertido en un estado de puro desarrollo energético o espiritual» (Mallary, 1969).

Todos los enfoques extraídos de los discursos y conceptos vistos en las obras de los artistas del AI Art son, como poco, interesantes. Cuando se le proporciona a la IA una masiva cantidad de datos de nuestra realidad para que aprenda a generar otros datos basados en lo que ha aprendido, nos muestra qué ve y cómo lo ve: que es básicamente el mundo real bajo la mirada de la máquina, donde los sesgos y problemáticas son visibilizadas. Además, existe otra vertiente de pensamiento más conceptual: cuando se generan imágenes con técnicas que se fundamentan en redes neuronales artificiales, se consideran estos resultados como si fueran el sueño, la alucinación o la imaginación de la máquina. Metáforas que surgen de un conjunto de mapeos y asociaciones entre lo artificial y lo natural, la computación y la mente (ciencias cognitivas), entre la creatividad y la autoría, entre el aprendizaje y los sesgos.

Figura 3. Pasos desde la imagen generada con GAN hasta el boceto y el modelo físico posteriormente creado por un humano. En este caso el diseño lo realiza la IA y el humano pasa a tener el papel de construirlo manualmente, como si se intercambiasen los papeles. Fuente: Schmitt y Weiß (2018).

La corriente del AI Art tuvo varios puntos álgidos, según avanzaban las técnicas y las obras se iban poco a poco incorporando al mundo del arte: congresos, mercados, festivales, ferias, museos, galerías, subastas, entre otros. Hasta el punto de dedicar espacios concretos destinados a este arte. Tanto el género del AI Art como las técnicas utilizadas desde 2014 hasta prácticamente la actualidad han sido mainstream.

Recientemente, varias técnicas publicadas irrumpieron con fuerza y dejaron en la sombra a las anteriores utilizadas. Se trata de las novedosas GPT (con sus distintas versiones), Dall-e, Stable Difussion y Midjourney: nuevos modelos basados en técnicas de Procesamiento del Lenguaje Natural (PLN) que han avanzado notablemente. Con estas técnicas citadas se pueden crear imágenes a partir de descripciones textuales. No solo se obtienen imágenes de una calidad muy alta, o un realismo que llega a veces incluso a confundirnos, sino que lo extraordinario y lo que genera tanto furor es que puedes crear «casi todo» lo que imagines, como por ejemplo objetos que no existen en la realidad.

Existe una clara diferencia entre el primer grupo de ejemplo de técnicas usadas para generar imágenes (Deep Dream, Style Transfer y GAN) –que desembocó en un nuevo grupo de artistas que utilizaban técnicas de IA mayoritariamente como herramienta de experimentación para crear arte nuevo– y el segundo grupo (Dall-e, Stable Difussion y Midjourney). En el caso del segundo grupo de técnicas citadas, la inmediatez con la que se puede llegar a crear cualquier diseño e imagen lo aísla de intenciones artísticas. Al campo del diseño es al que le ha salido, de algún modo, «competencia»: a largo plazo, los modelos citados podrían utilizarse para generar diseños para prácticamente cualquier cosa. Desde las industrias creativas, los medios de comunicación y la publicidad hasta la moda, la arquitectura o el marketing, por ejemplo.

Por supuesto, las reticencias ante estos nuevos modelos que amenazan el trabajo de artistas y, sobre todo, de diseñadores no han tardado en aflorar. Este discurso de rivalidad humano-máquina se remonta a siglos atrás, y alcanza su punto álgido en la Revolución Industrial. El trabajo manual sustituido por una máquina es un hecho al que el ser humano poco a poco se ha ido acostumbrando. Las reticencias se deben, precisamente, a los trabajos creativos. No resulta sencillo ceder ante la idea de que una IA pudiera ser creativa, producir diseños y obras e incorporarse al mercado del arte como un artista más. Las actividades creativas siempre se han considerado muy humanas.

El verdadero problema o el miedo que genera se debe a la capacidad de dichos modelos de realizar diseños a partir de descripciones de manera más rápida o eficiente que una persona, cuando estas técnicas se incorporan al mercado laboral, cuando se empieza a pensar que van a sustituir a la persona que ocupa un puesto creativo: aquella que compone, que diseña, que esculpe, que dibuja y, en definitiva, que crea. Cuando al empresario le salga más barato comprar un software que realice cientos de diseños en menos tiempo.

Figura 4. Imagen realizada con Midjourney con la siguiente descripción: «Diseño UX/UI para una revista digital llamada *Mosaic*».

Además, se presentan como una tecnología que puede otorgar creatividad, –o más bien con la habilidad de plasmar digitalmente ideas–, a todos con solo tener que componer unas frases descriptivas. Es así como se automatiza la imaginación. Las personas se están dando cuenta de que la falta de técnica, de habilidad o de destreza manual ya no es un inconveniente para crear un diseño, ahora solo cuenta la capacidad de imaginar o idear. El boceto que se genera en el cerebro humano la inteligencia artificial lo consigue crear de manera digital. Este avance supone un puente de comunicación entre humanos y máquinas de tal nivel que lo que el cerebro humano piensa la IA lo plasma en el lienzo digital.

Debemos dejar claro que la IA no decide crear por sí sola, no toma la determinación, no tiene la iniciativa ni mucho menos la necesidad de crear. Somos los humanos los que tomamos la decisión y ponemos los medios para que, de alguna manera, la IA pueda crear diseños e imágenes de todo tipo de cosas. Son las personas las que hacen las preguntas a Chat GPT-3 (Generative Pre-trained Transformer 3) para que nos responda y, de igual modo, le pedimos a Midjourney o Stable Disfussion que nos genere una imagen basándose en nuestras peticiones.

Aun así, no podemos negar que ha supuesto una revolución para la generación de imágenes y, por ende, para las industrias creativas. Parafraseando a Julio Verne: «Todo lo que una persona puede imaginar la inteligencia artificial podrá hacerlo realidad».

Documentación:

BODEN, Margaret; EDMONDS, Ernest A. (2009). «What is generative art?». Digital Creativity, vol. 20. no. 1-2, pp. 21-46. DOI: https://doi.org/10.1080/14626260902867915

BOGOST, Ian (2019). «The AI-Art Gold Rush Is Here». The Atlantic [en línea]. [Fecha de consulta: 20 de enero de 2023]. Disponible en: https://www.theatlantic.com/technology/archive/2019/03/ai-created-art-invades-chelsea-gallery-scene/584134/

DE PROPIOS MARTÍNEZ, Cristina (2022). Arte e Inteligencia artificial: técnicas de aprendizaje automático en el arte generativo actual. Tesis doctoral. Universidad Complutense de Madrid.

GATYS, Leon; ECKER, Alexander; BETHGE, Matthias (2016). «Image style transfer using convolutional neural networks». En: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2414-2423. https://doi.org/10.1109/CVPR.2016.265

GOODFELLOW, Ian; POUGET-ABADIE, Jean; MIRZA, Mehdi; XU, Bing; WARDE-FARLEY, David; OZAIR, Sherjil; COURVILLE, Aaron; BENGIO, Yoshua (2014). En: Z. Ghahramani, M. Welling, C. Cortes, N. Lawrence y K.Q. Weinberger (eds.). Generative Adversarial Nets. Advances in Neural Information Processing Systems, 27.

KAUFMAN, Sarah. L. (2020). «Artist Sougwen Chung wanted collaborators. So she designed and built her own AI robots». Washington Post [en línea]. [Fecha de consulta: 30 de enero de 2023]. Disponible en: https://www.washingtonpost.com/business/2020/11/05/ai-artificial-intelligence-art-sougwen-chung/

KLÜTSCH, Christoph (2007). «Computer graphic-aesthetic experiments between two cultures». Leonardo, vol. 40, no. 5, pp. 421-453. DOI: https://doi.org/10.1162/leon.2007.40.5.421

MALLARY, Robert (1969). «Computer Sculpture: Six Levels of Cybernetics». ArtForum, vol. VII, no. 9, pp. 29-36.

MORDVINTSEV, Alexander; OLAH, Christopher; TYKA, Mike (2015a). «Deepdream-a code example for visualizing neural networks». Google Research, vol. 2, no. 5.

MORDVINTSEV, Alexander; OLAH, Christopher; TYKA, Mike (2015b). «Inceptionism: Going Deeper into Neural Networks» [en línea]. [Fecha de consulta: 2 de febrero de 2023]. Disponible en: http://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html

RAMESH, Aditya; PAVLOV, Mikhail; GOH, Gabriel; GRAY, Scott; VOSS, Chelsea; RADFORD, Alec; CHEN, Mark; SUTSKEVER, Ilya (2021, julio). «Zero-shot text-to-image generation». En: International Conference on Machine Learning, pp. 8821-8831. PMLR. DOI: https://doi.org/10.48550/arXiv.2102.12092

SCHMITT, Philipp; Weiß, Steffen (2018). «The Chair Project: A Case-Study for using Generative Machine Learning as Automatism». En: 32nd Conference on Neural Information Processing Systems (NIPS) [en línea]. Disponible en: https://nips2018creativity.github.io/doc/the_chair_project.pdf

Otros enlaces de interés:

Dall-e: https://openai.com/blog/dall-e/

Stable Diffusion: repositorio de GitHub

Deep Dream Generator: https://deepdreamgenerator.com/

TensorFlow: tutorial

Cita recomendada: DE PROPIOS, Cristina. Todo lo que una persona pueda imaginar, la inteligencia artificial podrá hacerlo realidad. Mosaic [en línea], marzo 2023, no. 198. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n198.2305

Documentación:

Otros enlaces de interés:

Artículos relacionados

La cuestión de la inteligencia: una breve historia del arte basado en IA

Equipos multidisciplinares de desarrollo de producto digital

Cómo mejorar las experiencias de lectura en dispositivos digitales

Deja un comentario