El maig de 2023, més de 350 executius, investigadors i enginyers que treballen en intel·ligència artificial (IA) van signar una carta oberta publicada per l’organització sense ànim de lucre Center for AI Safety, en la qual afirmaven que mitigar el risc d’extinció de la humanitat a causa de la IA hauria de tractar-se com una prioritat global. La declaració va cristal·litzar diverses tensions entorn de les tecnologies d’IA en un moment fonamental en la seva evolució. De 2021 a 2023, diversos models de llenguatge extensos (LLM en anglès de Large Language Model) que permeten el processament de grans conjunts de dades textuals a través de la IA, juntament amb models de text a imatge que generen imatges a través d’indicacions de llenguatge natural, es van posar a la disposició del públic i van afectar nombrosos sectors, des del comerç i la política fins a l’art i l’entreteniment. Les tensions que sustenten la consideració de la IA com un risc social global són complexes i tenen una llarga història. Inclouen la dicotomia de percebre la tecnologia com un vehicle per a la salvació o extinció humanes; el problema d’assignar responsabilitats per a establir barreres per al desenvolupament tecnològic; i els desafiaments implicats en la definició de consciència, intel·ligència i, per consegüent, el que significa ser humà. Al llarg de les dècades, l’art basat en IA ha explorat de manera crítica aquestes tensions i desafiaments en relació amb les tecnologies d’IA a mesura que han desenvolupat, provat i refinat els sistemes a la vegada que destaquen les seves característiques i valors inherents.
Cal destacar que els signataris de la carta oberta incloïen a alts executius d’empreses líders d’IA, com Sam Altman, director executiu d’OpenAI; Demis Hassabis, director executiu de Google DeepMind; i Dario Amodei, director executiu d’Anthropic, fundada per antics membres d’OpenAI. Les mateixes empreses que van desenvolupar les tecnologies contra les quals estaven advertint van triar llançar-les i vendre-les, malgrat les seves pròpies preocupacions sobre les implicacions i l’escalabilitat. Aquest advertiment, per tant, hauria de considerar-se com un moviment calculat per a posicionar a les empreses com a possibles salvadores mentre negocien les responsabilitats de les possibles conseqüències de la IA buscant regulacions governamentals i legislatives per a salvaguardar la IA corporativa. No és d’estranyar que les preocupacions sobre l’extinció de la humanitat a penes s’esmentessin quan l’administració Trump va revelar plans per al projecte Stargate, una inversió de 500.000 milions de dòlars en infraestructura d’IA, en les primeres setmanes de 2025.
Els artistes han explorat el potencial i l’impacte de la IA des d’almenys principis de la dècada de 1970, quinze anys després que el camp es formalitzés en el Projecte de Recerca d’Estiu de Dartmouth de 1956 sobre intel·ligència artificial. Han investigat les seves possibilitats creatives i han abordat la seva ètica i els seus prejudicis, juntament amb els seus efectes sobre les ecologies i el treball, sovint desenvolupant els seus propis models i arquitectures híbrids.
La pràctica artística en el camp va guanyar un nou impuls amb el llançament del model de llenguatge extens d’OpenAI, ChatGPT, el 30 de novembre de 2022, juntament amb eines de text a imatge com DALL-E (2021) i DALL-E 2 (2022) d’OpenAI, Midjourney de Midjourney Inc. (2022) i Stable Diffusion d’Stability AI (2022). La publicitat que envoltava els models de text a imatge va conduir ràpidament a un debat polaritzat, amb afirmacions que la IA reemplaçaria permanentment els artistes, per un costat, i el descart d’aquestes eines com mers motors insta-kitsch sense valor estètic per l’altre. Si bé la primera posició sembla mancar del vocabulari estètic necessari per a avaluar l’art, aquesta última passa per alt el compromís més matisat dels artistes amb aquestes eines de IA. Ambdues perspectives tendeixen a reduir l’art basat en IA a imatges creades a través de senzilles seleccions dinàmiques de text. Per a centrar la conversa, és essencial considerar l’evolució de l’art basat en IA i rastrejar els canvis en els enfocaments dels artistes per a col·laborar amb, modificar, manipular i/o criticar els sistemes d’IA. En el cor d’aquest art es troba la capacitat dels humans i les màquines per a adquirir i aplicar habilitats i coneixements, la qual cosa planteja la qüestió del que la codificació d’«intel·ligència» podria significar per a ser humà. En els últims anys, els artistes també han mirat més enllà de les relacions entre allò humà, el maquinari informàtic i el programari per a explorar com la IA podria transcendir els models antropocèntrics de creació de coneixements. Per exemple, en la seva exposició Distributed Consciousness (2024) a la Gallery QI de Sant Diego, l’artista i tecnòleg creatiu Memo Akten s’inspira en la cognició dels cefalòpodes, que tenen la majoria de les seves neurones distribuïdes per tot el seu cos en lloc de en un cervell central, per a crear un manifest generat per IA, juxtaposant la naturalesa descentralitzada amb la intel·ligència sintètica.
El terme «art basat en IA» s’entén comunament com a referència a l’art que empra tecnologies d’IA en la seva creació, però aquesta concepció demana un examen addicional. No distingeix entre l’ús de la IA com a eina enfront del seu ús com a mitjà i passa per alt el compromís conceptual de l’obra d’art amb la IA. L’art basat en IA pot definir-se com una subcategoria d’art digital o computacional, entès com aquell que utilitza eines i mitjans digitals per a crear i contextualitzar l’art: incorpora tecnologies d’intel·ligència artificial tant com a eina com a mitjà, interactuant amb ell de manera pràctica i conceptual. El simple fet d’emprar un prompt de text per a generar una imatge mitjançant programari comercial de text a imatge no classifica automàticament la imatge resultant com art basat en IA. L’ús de la IA com a mitjà —aplicant els seus sistemes i característiques inherents— de manera conscient sobre la base d’un enfocament conceptual distingeix un treball com a art realitzat mitjançant IA. L’art computacional i la seva estètica es reconeixen com a camps establerts però en constant evolució. Com a subconjunt de l’art computacional generatiu, l’art basat en IA requereix una reavaluació contínua dels seus models i expressions. El que segueix se centrarà en els moments clau de la història de l’art basat en IA, rastrejant el seu desenvolupament en relació amb els avanços tecnològics i investigant el potencial de l’art per a contribuir al discurs crític que ha sorgit entorn de l’estètica de les tecnologies d’IA, així com els impactes culturals, sociopolítics i ètics d’aquestes.
La col·laboració està en el cor d’un dels primers programes d’intel·ligència artificial per a la creació d’art: AARON (1928-2016) de Harold Cohen, un dels projectes en curs més antics de l’art contemporani. Cohen, un pintor britànic reconegut, va començar a explorar el potencial del programari per a la creació d’art el 1968 quan es va convertir en professor convidat a la Universitat de Califòrnia, Sant Diego (UCSD). Va anomenar oficialment AARON al seu programa el 1973, després de ser convidat al Laboratori d’Intel·ligència Artificial de la Universitat d’Stanford.1 A diferència de l’IA estadística actual, que ha estat entrenada en grans conjunts de dades d’imatges, AARON va ser una forma d’IA simbòlica que encapsulava «coneixements» sobre dibuix i composició, codificada en llenguatges de programació dissenyats per Cohen. AARON no implica l’estandardització, la mitjana i l’optimització empleats en els models actuals, que estan entrenats en enormes conjunts de dades d’imatges existents. Més aviat, AARON es va veure influenciat per la pròpia estètica de Cohen, ja que va desenvolupar contínuament el programari fins a la seva mort i va experimentar amb canvis d’estil, des de formes simples i evocadores fins a figures i entorns selvàtics, i va passar de la producció monocromàtica a la producció en color. Des de la dècada de 1970 fins a la de 1990, Cohen va construir les seves pròpies màquines de dibuix i pintura que traçaven i creaven les obres d’AARON, i en la dècada de 2000, va canviar a presentacions purament basades en pantalla.
Després de les primeres exploracions artístiques d’IA representades per AARON, l’art basat en IA va evolucionar en tres fases principals des de la dècada de 1990 fins a principis de 2020, canviant el seu enfocament a explorar i investigar els desenvolupaments tecnològics a mesura que sorgien.
En els anys 90 i principis del 2000, els artistes van crear sistemes d’IA que es comprometien de manera crítica amb l’aparició d’agents de programari, aplicacions que executaven tasques automatitzades a internet per a filtrar o imitar accions humanes, així com xatbots. Els aspectes problemàtics del filtrat d’informació impulsat per programari i la codificació de la comunicació humana, juntament amb la «personalitat» dels bots, es van convertir en una àrea activa d’exploració. El xatbot de Lynn Hershman Leeson, Agent Ruby, publicat el 2000, va examinar els xatbots com a éssers essencialment socials, personatges autònoms amb vides pròpies, mentre que MrMind de Peggy Weil (1998-2014) es va dissenyar específicament per a destacar les diferències entre humans i màquines. La sèrie The Bush Soul (1997-1999) de Rebecca Allen va investigar la comunicació entre usuaris i criatures autònomes en un entorn virtual i va establir les bases per a projectes més recents que involucraven formes de vida impulsades per IA, com les obres d’art de Ian Cheng.
La dècada de 2010 va ser testimoni d’un canvi en la pràctica artística basada en IA, responent a una nova era d’anàlisi de big data i xarxes neuronals, que es van originar en la dècada de 1920 i ara es beneficien d’un ampli processament de dades, així com de l’aparició de xarxes generatives adversatives (GAN en anglès, de Generative Adversarial Network) i transformadors generatius preentrenats (GPT en anglès, de Generative Pre-trained Transformer). Els artistes s’enfrontaven cada vegada més als biaixos en els conjunts de big data i als dilemes ètics derivats del processament algorítmic. Les dimensions sensociopolítiques del reconeixement de patrons i l’apofènia, la percepció d’un patró significatiu entre elements no relacionats o aleatoris,2 va exercir un paper significatiu en el discurs crític i l’art que explora conjunts de dades a gran escala. Stephanie Dinkins va contrarestar directament la noció dels beneficis del big data utilitzant un conjunt de dades clarament petit, examinant la IA en el context de la raça amb Not The Only One (N’TOO) (2018), un narrador escultural d’IA entrenat en dades proporcionats per tres generacions de dones d’una família afroamericana, destacant un conjunt de dades dràsticament infrarepresentat. Dinkins també va investigar els conjunts de dades i el procés d’aprenentatge d’una IA en Conversations with Bina4 (2014 – present). Aquesta obra documenta els diàlegs continus de l’artista amb Bina48 (nom que deriva de «Breakthrough Intelligence via Neural Architecture, 48 exaflops per second» [Intel·ligència innovadora a través de l’arquitectura neuronal, 48 exaflops per segon]), un robot «social» intel·ligent inspirat en una dona negra, creat per la Fundació Terasem Movement. Les Conversations with Bina4 de Dinkins aprofundeixen en què signifiquen la identitat, la raça i els parentius per a la intel·ligència artificial i si podem establir relacions sostingudes amb el creixent nombre d’entitats no humanes que ens envolten.
Si bé el compromís de l’art basat en IA amb les GAN i els transformadors GPT pot variar significativament en enfocament, el problema central d’aquestes formes d’IA estadística continua sent l’automatització de la generació d’imatges i text a través de conjunts de dades que contenen biaixos integrats. Les GAN són xarxes neuronals que aprenen en les quals els algorismes generatius, entrenats en un conjunt de dades específic, produeixen noves característiques d’intercanvi d’imatges originals amb el conjunt d’entrenament. A continuació, aquestes imatges s’avaluen mitjançant algorismes discriminatoris que, basant-se en la seva pròpia formació, avaluen si les dades recentment produïdes semblen autèntiques. Les GAN, en particular, han donat lloc a una explosió de projectes artístics que exploren el seu potencial per a la generació d’imatges basant-se en conjunts de formació específics i objectius estètics. Els treballs menys reeixits s’han mantingut al nivell del «joc de la imitació», examinant l’estètica de las GAN i les capacitats del programari d’IA per a reproduir imatges amb l’estil d’un període artístic reconegut. Pel contrari, Origin Story [Grace:AI] de Mary Flanagan (2019) es centra en l’estètica d’utilitzar un conjunt de dades amb biaix de gènere deliberat. Flanagan va entrenar una GAN en milers d’imatges de pintures i dibuixos només d’artistes femenines, i després va encarregar al programari la creació de la seva «història original» analitzant 20.000 imatges en línia del monstre de Frankenstein per a produir el seu retrat. [Grace:AI] al·ludeix tant a la crítica feminista de Mary Shelley sobre la vida artificial com a la creació dominada per homes a Frankenstein mentre investiga si un conjunt de dades d’entrenament amb biaix de gènere produeix un estil distintiu.
Els artistes no sols van explorar l’estètica de les eines d’IA, sinó que també van començar a respondre a l’aparició de paradigmes de gestió mediambiental, enginyeria i intervenció estratègica. Deep Swamp (2018) de Tega Brain critica de manera humorística l’optimització mediambiental a través d’un tríptic de ecosistemes d’aiguamolls semiinundats poblats per agents d’intel·ligència artificial amb objectius diferents. Mentrestant, Asunder (2019), creat per Tega Brain, Julian Oliver i Bengt Sjölén, examina els possibles avantatges i desavantatges d’un «gerent mediambiental» fictici controlat per IA que proposa i simula futures modificacions en el planeta per a mantenir la seva seguretat dins dels límits de la Terra.
A partir de 2021, la IA i l’art basat en IA van passar al domini públic amb el llançament de ChatGPT i les eines de text a imatge. Aquests últims models utilitzen amplis conjunts de dades d’imatges amb text associat i, a través de metodologies d’aprenentatge profund, generen imatges digitals amb diversos estils i atributs basats en els prompts de text dels usuaris o descripcions de llenguatge natural. Encara que els mitjans de comunicació no especialitzats debatien si aquestes capacitats farien que els artistes humans quedessin obsolets, la pràctica real de l’art digital va revelar tant els defectes com el potencial de les eines d’IA, destacant el treball intens i els rigorosos processos necessaris per a crear obres sofisticades. La fase de text a imatge de l’art basat en IA ha constituït probablement el canvi més significatiu fins al moment, amb eines com DALL-E, Midjourney i Stable Diffusion que fan que les imatges estiguin subordinades a la classificació de l’idioma. Aquestes eines fusionen profundament els elements visuals amb un registre lèxic, aprofitant les dependències preexistents. Produeixen el seu resultat visual basat en la classificació textual del conjunt d’entrenament i les dades font. A continuació, les seves creacions visuals es determinen mitjançant l’alineació de prompts dels usuaris amb el text preassociat amb les imatges, la qual cosa genera resultats en capes de taxonomies existents. Els artistes han començat a explorar els aspectes potencials i problemàtics d’aquests nous marcs semàntics de formes específiques segons el mitjà, avaluant el seu impacte en la pintura, la fotografia i el cinema. Bennett Miller, per exemple, va establir paral·lelismes entre l’aparició de la fotografia i els primers dies del poder transformador dels models de text a imatge en la seva exposició d’impressions de 2023 a la galeria Gagosian de Nova York. Les imatges, que ocupen un delicat llindar entre allò familiar i allò estrany, romanen inquietantment separades d’un subjecte intel·ligible. Estan suspeses en una realitat alternativa que captura l’essència d’una etapa distintiva de la IA i destaca les diferències entre els processos fotogràfics i les imatges generades en un estil fotogràfic per models de text a imatge. Tot i que la IA actual pot veure’s com el resultat d’una llarga evolució de l’«aprenentatge automàtic» en lloc d’un nou tipus de tecnologia, també qüestiona radicalment les definicions tradicionals de les formes d’expressió dels mitjans.
L’enfocament del compromís dels artistes amb els programes d’IA de text a imatge és variat: alguns utilitzen el programari més com eina en la creació de projectes que depenen de múltiples tecnologies digitals durant el seu procés de creació; uns altres el centren com un punt focal per a les exploracions estètiques i conceptuals. Tot i que el discurs sobre l’art basat en IA en els mitjans de comunicació convencionals s’ha concentrat en els perills que els artistes siguin substituïts per «creadors» d’IA, els artistes que aborden de manera crítica les tecnologies d’IA estan investigant els desafiaments plantejats a la creativitat mitjançant la classificació, estandardització i optimització inherents de les eines d’IA que sorgeixen de la seva base normativa. Els models de text a imatge empren bilions d’imatges existents a les quals les empreses tenen accés, moltes d’elles imatges de catàleg, el que significa que operen dins d’una cambra de ressò des del principi. El text associat amb aquestes imatges es va crear originalment amb finalitats de màrqueting, inscrivint una agenda específica. Actualment, els artistes i altres creadors no reben compensació per l’ús de les seves imatges, mentre que les eines de text a imatge generen una versió cada vegada més diluïda del seu estil. Segons les dades publicades per AI Secrets a la fi de 2023, la IA genera aproximadament 34 milions d’imatges al dia, que posteriorment alimenten de nou als conjunts de dades d’entrenament, la qual cosa ens acosta cada vegada més a l’estat de «col·lapse del model», en el qual la IA s’entrenarà únicament en imatges de la seva pròpia creació.
L’art digital sempre ha estat a l’avantguarda de la interacció crítica amb les tecnologies que empra, i l’art basat en IA pot exercir un paper crucial en l’avaluació de l’impacte estètic i sociopolític de les eines que donen forma al nostre futur. Els debats públics, així com aquells dins de la indústria, amb freqüència recorren a narratives polaritzades d’extinció enfront de salvació, sovint impulsades per una agenda comercial o concepcions simplistes d’intel·ligència i sintiència. L’art basat en IA sovint proporciona una revisió mèdica de la realitat molt necessària, desafiant suposicions simplistes i ajustant o desmuntant els sistemes per a plantejar preguntes més profundes sobre la intel·ligència humana i altres formes d’intel·ligència.
Publicat originalment a October, núm. 189 (estiu de 2024). The MIT Press. DOI: https://doi.org/10.1162/octo_a_00533
1. Cohen va continuar desenvolupant el programari fins a la seva mort el 2016 i, al llarg de les dècades, va experimentar canvis en l’estil de treball i un canvi de la producció monocromàtica a la producció en color. Des de la dècada de 1970 fins a la de 1990, també va construir els seus propis dispositius de sortida, des de màquines de dibuix fins a una tortuga, un dispositiu de dibuix robòtic utilitzat originalment en enginyeria mecànica i una màquina de pintura, i, en la dècada de 2000, va canviar a una presentació purament basada en pantalla.
2. Consulteu: Hito Steyerl (2016, abril). «A Sea of Data: Apophenia and Pattern (Mis-)Recognition». e-flux Journal, no. 72 [en línia]. Disponible a: https://www.e-flux.com/journal/72/60480/a-sea-of-data-apophenia-and-pattern-mis-recognition/
Cita recomanada: PAUL, Christiane. La qüestió de la intel·ligència: una breu història de l’art basat en IA. Mosaic [en línia], abril 2025, no. 203. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n203.2502
Deja un comentario