Universitat Oberta de Catalunya

Tot el que una persona pugui imaginar, la intel·ligència artificial podrà fer-ho realitat

Al llarg de la història de l’art i el disseny, són nombroses les eines mecàniques i digitals utilitzades pels artistes i dissenyadors per desenvolupar tasques creatives. Des de les màquines de dibuixar més antigues que utilitzaven pèndols, passant per programari popular com FORTRAN, Flash, P5.js o Processing, fins a l’ús d’algorismes evolutius i les noves tècniques d’intel·ligència artificial.

L’ús de programari en l’art no s’entenia com una eina més per aconseguir la finalitat de l’artista, sinó que ja era parcialment responsable, i sorgia amb la mateixa idea. L’art generatiu, en concret l’art generatiu computacional, és definit per Boden i Edmonds (2009) com un gènere en el qual l’obra d’art és el resultat obtingut d’un programa de computadora quan es deixa executar per si mateix, amb mínima o nul·la interferència d’un ésser humà. La paraula mínim, per descomptat, està oberta a interpretació, adverteixen (Boden i Edmonds, 2009). D’alguna manera, l’artista manté una relació de col·laboració amb la computadora a l’hora de crear, i, a vegades, li dona llibertat de creació a aquesta màquina perquè el resultat final no recaigui íntegrament en l’artista.

L’admiració que ha suscitat l’art generatiu computacional, o totes les creacions realitzades amb una computadora, no es produeix per la substitució de les eines físiques per aplicacions computacionals, com poden ser les ofertes per Adobe Inc™, per exemple, sinó per les obres en les quals la computadora sembla que creï directament l’art. No obstant això, la relativa independència de la computadora es percep qualitativament diferent de les característiques d’altres eines digitals en la història de l’art, i això és el que ho fa veritablement interessant i complex de determinar. Una de les característiques fonamentals que trobem en l’art generatiu computacional és el poder de reproducció. Per exemple, a Schotter (Gravel) del 1968 de George Nees, l’artista podia haver afegit milers de quadrets o caixes només modificant alguns canvis en el codi (figura 1).

Podríem dir que es tracta d’un procés artístic automatitzat. La facilitat amb la qual les computadores poden generar imatges complexes contribueix, a més, a l’estètica de l’art generatiu. De la mateixa manera, les creacions realitzades amb les últimes tècniques d’IA aplicades a tasques d’art i disseny es basen en el procés de reproducció, en aquest cas, amb resultats cada vegada més sofisticats i impactants.

Figura 1. Schotter (Gravel) per Georg Nees (1968). Font: Klütsch (2007).

Els últims avenços en aprenentatge automàtic (machine learning) i xarxes neuronals (neural networks) dins del camp d’estudi de la intel·ligència artificial (IA) han afavorit l’aparició d’una rica comunitat d’exploració artística, gran part de la qual s’està produint en la cultura visual d’internet. L’impacte de l’ús de tècniques de IA no tan sols va significar una nova pràctica experimental, sinó que va desembocar en la consolidació d’un gènere independent, nascut de l’art generatiu computacional i conegut popularment com AI ART (artificial intelligence art). Aquest nou gènere s’està gestant des del 2014: el seu progrés exponencial coincideix amb cadascuna de les successives publicacions en papers de tècniques d’IA per generar imatges i text. Tècniques amb les quals els artistes podien, entre altres coses, analitzar i visualitzar dades, usar tècniques de generació directa d’imatges, visualitzar característiques o fer transferències d’estil.

Entre les tècniques més populars darrere l’anomenada «època daurada de l’AI Art» (Bogost, 2019) destaquen: DeepDream (Mordvintsev et al., 2015), amb aquelles populars i virals imatges psicodèliques; Style Transfer (Gatys et al., 2016), model capaç de reproduir una fotografia o una escena arbitrària amb un determinat estil pictòric, mantenint el contingut original; o les populars Generative Adversarial Networks (GANs) (Goodfellow et al., 2014), amb les quals es poden generar noves imatges (realistes o no) d’una qualitat cada vegada més excepcional. Molts artistes i programadors van anar utilitzant aquestes tècniques per crear art. Començava, així, una nova generació d’artistes interessats a fer servir cada una de les tècniques noves que es popularitzaven. L’auge era en l’ús de la tècnica: és comprensible que la intencionalitat que hi ha en l’AI Art hagi quedat en el fet que la novetat tècnica prevalgui sobre qualsevol valor material i conceptual.

No obstant això, dins del corrent de l’AI Art es poden observar diverses tendències estètiques i discursos. Per exemple, el debat de l’autoria l’autoria i la presència de la màquina en el desenvolupament de l’obra, que, encara que es tracta d’una controvèrsia que en l’art fa anys que es debat, amb la intel·ligència artificial aquesta discussió s’agreuja. La participació de la màquina en el procés és la base fonamental en l’AI Art, un fet que esdevé determinant: qui és l’autor de l’obra?, l’humà o la IA? Molts artistes aprofiten l’ús d’aquests algorismes per basar l’obra en la justificació de l’impacte que representa pensar que està feta «per si sola» amb una IA, que ha estat la IA qui ha creat l’obra. No obstant això, a l’hora de proclamar-se autors, aquesta dada canvia: l’humà es continua proclamant l’artista, per sobre de la màquina, encara que la utilitzi com a esquer per impressionar.

Figura 2. Exemple de cocreació entre artista i màquina. L’artista Sougwen Chung treballant a l’estudi que té a Brooklyn, fotografiada per Celeste Sloman per a The Washington Post. Font: Kaufman (2020).

En el punt actual de la història de l’art contemporani i el camp del disseny, guanyen veritable sentit els sis nivells descrits per Mallary, ja que descriuen fidelment el transcurs de la relació en l’art entre l’humà i la màquina. Amb la intel·ligència artificial s’ha arribat al cinquè nivell, en el qual la màquina o la computadora es consideren ens autònoms. Malgrat això, Mallary augura un futur més atrevit en el sisè nivell: «on l’artista o escultor ja no és necessari per a la creació, la màquina ja haurà aconseguit algun tipus d’existència orgànica i autoreplicant, o s’haurà convertit en un estat de pur desenvolupament energètic o espiritual» (Mallary, 1969).

Tots els enfocaments extrets dels discursos i conceptes vistos en les obres dels artistes de l’AI Art són, com a mínim, interessants. Quan es proporciona a la IA una quantitat de dades massiva de la nostra realitat perquè aprengui a generar altres dades basades en el que ha après, ens mostra què veu i com ho veu: que és bàsicament el món real segons la mirada de la màquina, on els biaixos i les problemàtiques són visibilitzats. A més, hi ha un altre vessant de pensament més conceptual: quan es generen imatges amb tècniques que es fonamenten en xarxes neuronals artificials, es consideren resultats com si fossin el somni, l’al·lucinació o la imaginació de la màquina. Metàfores que sorgeixen d’un conjunt de mapatges i associacions entre el que és artificial i el que és natural, la computació i la ment (ciències cognitives), entre la creativitat i l’autoria, entre l’aprenentatge i els biaixos.

Figura 3. Passos des de la imatge generada amb GAN fins a l’esbós i el model físic posteriorment creat per un humà. En aquest cas, el disseny el realitza la IA i l’humà passa a tenir el paper de construir-lo manualment, com si s’intercanviessin els papers. Font: Schmitt i Weiß (2018).

El corrent de l’AI Art va viure diversos punts àlgids, a mesura que avançaven les tècniques i les obres s’anaven incorporant a poc a poc al món de l’art: congressos, mercats, festivals, fires, museus, galeries, subhastes, entre altres. Fins al punt de dedicar espais concrets destinats a aquest art. Tant el gènere de l’AI Art com les tècniques utilitzades des del 2014 fins pràcticament a l’actualitat han estat mainstream.

Recentment, diverses tècniques publicades van irrompre amb força i van deixar a l’ombra les anteriors utilitzades. Es tracta de les noves GPT (amb les diferents versions), Dall-e, Stable Difussion i Midjourney: nous models basats en tècniques de processament del llenguatge Natural (PLN) que han avançat notablement. Amb aquestes tècniques es poden crear imatges a partir de descripcions textuals. No tan sols s’obtenen imatges d’una qualitat molt alta, o un realisme que de vegades arriba fins i tot a confondre’ns, sinó que el més extraordinari i el que genera tant de furor és que pots crear «gairebé tot» el que imaginis, com, per exemple, objectes que no existeixen en la realitat.

Hi ha una clara diferència entre el primer grup d’exemple de tècniques usades per generar imatges (Deep Dream, Style Transfer i GAN) –que va desembocar en un nou grup d’artistes que utilitzaven tècniques d’IA majoritàriament com a eina d’experimentació per crear art nou– i el segon grup (Dall-e, Stable Difussion i Midjourney). En el cas del segon grup de tècniques, la immediatesa amb la qual es pot arribar a crear qualsevol disseny i imatge l’aïlla d’intencions artístiques. El camp del disseny és al qual li ha sortit, d’alguna manera, «competència»: a llarg termini, els models esmentats podrien utilitzar-se per generar dissenys per a pràcticament qualsevol cosa. Des de les indústries creatives, passant pels mitjans de comunicació i la publicitat fins a la moda, l’arquitectura o el màrqueting, per exemple.

Per descomptat, les reticències davant aquests nous models que amenacen la feina d’artistes i, sobretot, de dissenyadors no han trigat a aflorar. Aquest discurs de rivalitat humà-màquina es remunta a segles enrere, i arriba al punt àlgid amb la revolució industrial. El treball manual substituït per una màquina és un fet al qual l’ésser humà s’ha anat acostumant a poc a poc. Les reticències es deuen, precisament, als treballs creatius. No és senzill cedir davant la idea que una IA pugui ser creativa, produir dissenys i obres i incorporar-se al mercat de l’art com un artista més. Les activitats creatives sempre s’han considerat molt humanes.

El problema real o la por que genera es deu a la capacitat d’aquests models de realitzar dissenys a partir de descripcions de manera més ràpida o eficient que una persona, quan aquestes tècniques s’incorporen al mercat laboral, quan es comença a pensar que substituiran la persona que ocupa un lloc creatiu: aquella que compon, que dissenya, que esculpeix, que dibuixa i, en definitiva, que crea. Quan a l’empresari li surti més barat comprar un programari que faci centenars de dissenys en menys temps.

Figura 4. Imatge realitzada amb Midjourney amb la descripció següent: «Disseny UX/UI per a una revista digital anomenada Mosaic».

A més, es presenten com una tecnologia que pot atorgar creativitat –o més aviat amb l’habilitat de plasmar idees digitalment– a tothom només escrivint unes frases descriptives. És així com s’automatitza la imaginació. Les persones s’estan adonant que la falta de tècnica, d’habilitat o de destresa manual ja no és un inconvenient per crear un disseny, ara només compta la capacitat d’imaginar o idear. L’esbós que es genera en el cervell humà la intel·ligència artificial l’aconsegueix crear de manera digital. Aquest avenç significa un pont de comunicació entre humans i màquines de tal nivell que allò que el cervell humà pensa la IA ho plasma en el llenç digital.

Hem de deixar clar que la IA no decideix crear per si sola, no pren la determinació, no té la iniciativa, ni molt menys la necessitat de crear. Som els humans els que prenem la decisió i posem els mitjans perquè, d’alguna manera, la IA pugui crear dissenys i imatges de tota mena de coses. Són les persones les que fan les preguntes a Chat GPT-3 (Generative Pre-trained Transformer 3) perquè ens respongui i, de la mateixa manera, demanem a Midjourney o Stable Disfussion que ens generi una imatge basant-se en les nostres peticions.

Tot i així, no podem negar que ha representat una revolució per a la generació d’imatges i, per tant, per a les indústries creatives. Parafrasejant Jules Verne: «Tot el que una persona pot imaginar la intel·ligència artificial podrà fer-ho realitat».

Documentació:

BODEN, Margaret; EDMONDS, Ernest A. (2009). «What is generative art?». Digital Creativity, vol. 20. no. 1-2, pp. 21-46. DOI: https://doi.org/10.1080/14626260902867915

BOGOST, Ian (2019). «The AI-Art Gold Rush Is Here». The Atlantic [en línia]. [Data de consulta: 20 de gener de 2023]. Disponible a: https://www.theatlantic.com/technology/archive/2019/03/ai-created-art-invades-chelsea-gallery-scene/584134/

DE PROPIOS MARTÍNEZ, Cristina (2022). Arte e Inteligencia artificial: técnicas de aprendizaje automático en el arte generativo actual. Tèsi doctoral. Universitat Complutense de Madrid.

GATYS, Leon; ECKER, Alexander; BETHGE, Matthias (2016). «Image style transfer using convolutional neural networks». A: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2414-2423. https://doi.org/10.1109/CVPR.2016.265

GOODFELLOW, Ian; POUGET-ABADIE, Jean; MIRZA, Mehdi; XU, Bing; WARDE-FARLEY, David; OZAIR, Sherjil; COURVILLE, Aaron; BENGIO, Yoshua (2014). A: Z. Ghahramani, M. Welling, C. Cortes, N. Lawrence i K.Q. Weinberger (eds.). Generative Adversarial Nets. Advances in Neural Information Processing Systems, 27.

KAUFMAN, Sarah. L. (2020). «Artist Sougwen Chung wanted collaborators. So she designed and built her own AI robots». Washington Post [en línia]. [Data de consulta: 30 de enero de 2023]. Disponible a: https://www.washingtonpost.com/business/2020/11/05/ai-artificial-intelligence-art-sougwen-chung/

KLÜTSCH, Christoph (2007). «Computer graphic-aesthetic experiments between two cultures». Leonardo, vol. 40, no. 5, pp. 421-453. DOI: https://doi.org/10.1162/leon.2007.40.5.421

MALLARY, Robert (1969). «Computer Sculpture: Six Levels of Cybernetics». ArtForum, vol. VII, no. 9, pp. 29-36.

MORDVINTSEV, Alexander; OLAH, Christopher; TYKA, Mike (2015a). «Deepdream-a code example for visualizing neural networks». Google Research, vol. 2, no. 5.

MORDVINTSEV, Alexander; OLAH, Christopher; TYKA, Mike (2015b). «Inceptionism: Going Deeper into Neural Networks» [en línia]. [Data de consulta: 2 de febrer de 2023]. Disponible a: http://ai.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html

RAMESH, Aditya; PAVLOV, Mikhail; GOH, Gabriel; GRAY, Scott; VOSS, Chelsea; RADFORD, Alec; CHEN, Mark; SUTSKEVER, Ilya (2021, juliol). «Zero-shot text-to-image generation». A: International Conference on Machine Learning, pp. 8821-8831. PMLR. DOI: https://doi.org/10.48550/arXiv.2102.12092

SCHMITT, Philipp; Weiß, Steffen (2018). «The Chair Project: A Case-Study for using Generative Machine Learning as Automatism». En: 32nd Conference on Neural Information Processing Systems (NIPS) [en línia]. Disponible a: https://nips2018creativity.github.io/doc/the_chair_project.pdf

Altres enllaços d’interès:

Dall-e: https://openai.com/blog/dall-e/

Stable Diffusion: repositori de GitHub

Deep Dream Generator: https://deepdreamgenerator.com/

TensorFlow: tutorial


Cita recomanada: DE PROPIOS, Cristina. Tot el que una persona pugui imaginar, la intel·ligència artificial podrà fer-ho realitat. Mosaic [en línia], març 2023, no. 198. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n198.2305

Acerca del autor

Doctora en Bellas Artes por la Universidad Complutense de Madrid, especializada en arte e inteligencia artificial y creatividad computacional. Es profesora universitaria, artista y diseñadora. Investigadora y colaboradora en Artificia.pro, que promueve la creatividad aumentada a través de la inteligencia artificial y las artes. Imparte talleres sobre arte, diseño e inteligencia artificial y participa activamente como ponente en distintos eventos de ciencia y tecnología. Sus trabajos sobre la intersección entre arte, vida artificial e inteligencia artificial se han publicado en conferencias prestigiosas como NeurIPS (Conference on Neural Information Processing Systems). www.depropios.com. @de_propios

Deja un comentario