Universitat Oberta de Catalunya

L’inquietant art de la IA

Entrenament de models d’IA i infracció de drets d’autor

Quan es tracta d’art generat per IA (o «art»), és difícil trobar una posició matisada que respecti els drets laborals dels treballadors creatius, la lliure expressió, les excepcions i limitacions vitals de la llei de drets d’autor i l’estètica.

En general, estic en contra de l’art generat per IA, però hi ha algunes excepcions importants per a aquesta posició. Per començar, des del punt de vista legal crec que és inequívocament erroni dir que el rasplat (scrapping) d’obres per entrenar un model amb les dades obtingudes infringeix els drets d’autor. Aquesta no és una postura moral (arribarem a això en un moment), sinó més aviat una qüestió tècnica. Si es desglossen els passos de la creació d’un model per a entrenar IA, ràpidament es fa evident per què tècnicament és incorrecte considerar-ho una infracció de drets d’autor. En primer lloc, l’acte de fer còpies temporals d’obres, fins i tot de milers de milions d’obres, és inequívocament un ús just. Tret que es cregui que els motors de cerca i Internet Arxive no haurien d’existir, s’hauria d’estar a favor de la recol·lecció de dades a gran escala. I tret que es cregui que Facebook hauria de poder utilitzar la llei per a bloquejar projectes com Ad Observer, que recopila mostres de desinformació política pagada, llavors s’hauria de donar suport a la recol·lecció de dades a gran escala, fins i tot quan el lloc del qual s’estan extraient dades s’hi oposi (almenys en algunes ocasions):

Després de fer còpies temporals de moltes obres, el següent pas per a entrenar una IA és sotmetre-les a anàlisis matemàtiques. De nou, això no és una violació dels drets d’autor.

Fer observacions quantitatives sobre les obres és una eina important,respectada i llargament practicada per a la crítica, l’anàlisi, l’arxivat i els nous actes de creació. Mesurar la contracció constant del vocabulari en les successives novel·les d’Agatha Christie ofereix una fascinant finestra a la seva demència.

L’anàlisi programàtica del discurs en línia extret també és fonamental per a les creixents anàlisis formals del llenguatge parlat per les minories, la qual cosa produeix un relat vibrant de la rigorosa gramàtica dels dialectes que des de fa molt temps s’han titllat d’«argot».

Des de 1988, l’UCL Survey of English Language ha mantingut el seu projecte International Corpus of English, i els acadèmics l’han usat a fons per a extreure conclusions importants sobre l’àmplia varietat de formes de l’anglès que es parlen a tot el món, especialment en els països de parla anglesa postcolonial.

L’últim pas en el procés d’entrenament d’un model és publicar les conclusions de l’anàlisi quantitativa dels documents copiats temporalment en forma de codi de programari. El codi en sí és una discurs expressiu, i aquesta expressivitat és clau en la lluita per la privacitat perquè el fet que el codi sigui una expressió limita la capacitat dels governs per censurar el programari.

Estan cometent els models algun tipus d’infracció? Bé, sens dubte podrien estar fent-ho. En alguns casos, és clar que els models «van memoritzar» algunes de les dades usades pel seu entrenament, convertint la còpia transitòria d’ús just en una còpia permanent infractora. Això es considera generalment el resultat d’un error de programació, i sens dubte podria evitar-se (per exemple, comparant el model amb les dades de formació i eliminant qualsevol memorització que aparegui).

No obstant això, no tots els actes que semblen una memorització ho són realment. Encara que els models específics varien molt, la quantitat de dades de cada element retinguda pel model és mínima. Per exemple, Midjourney conserva aproximadament un byte d’informació de cada imatge en les seves dades d’entrenament. Si parlem d’una imatge web típica de baixa resolució de, per exemple, 300 kb, això seria unes tres-centes mil·lèsimes parts (0,0000033 %) de la imatge original.

Normalment, en les converses sobre drets d’autor, quan una obra conté el 0,0000033 % d’una altra, ni tan sols plantegem la qüestió de l’ús legítim. Més aviat, descartem l’ús com de minimis (abreviatura de de minimis non curat lex o «La llei no espreocupa de minúcies»).

Acusar algú d’infringir drets d’autor a algú per apropiar-se del 0,0000033 % del teu treball és com denunciar per entrada il·legal a algú perquè la punta de la seva sabata frega un bri de gespa del teu jardí.

Però algunes obres o parts d’aquestes apareixen en línia moltes vegades. Per exemple, la marca d’aigua de Getty Images apareix en milions d’imatges similars de persones dempeus sobre catifes vermelles i passarel·les, per la qual cosa un model que prengui tan sols una mostra infinitesimal de cadascuna d’aquestes obres podria acabar sent capaç de produir una marca d’aigua completa i recognoscible de Getty Images.

El mateix ocorre amb els articles d’agències de notícies o altres textos àmpliament sindicats: pot haver dotzenes o fins i tot centenars de còpies d’aquestes obres en les dades usades per a entrenar els models, la qual cosa podria dur a que es memoritzin extensos passatges d’aquests textos. Això podria ser una infracció (estem entrant en un territori confús i sense precedents aquí), però de nou, encara que sigui així, no seria una gran dificultat per als fabricants de models postprocessar els seus models comparant-los amb el conjunt d’entrenament, eliminant qualsevol memorització inadvertida. Fins i tot si el model resultant no tingués capmemorització, això no faria res per a alleujar les preocupacions (legítimes) dels treballadors creatius sobre la creació i l’ús d’aquests models.

El debat sobre l’art generat per IA

Aquest és el primer matís en el debat de l’art generat per IA: des d’un punt de vista tècnic, entrenar un model no és una infracció de drets d’autor. Els treballadors creatius que esperen utilitzar la llei de drets d’autor per a evitar que la IA canviï el mercat laboral creatiu probablement se sentiran molt decebuts als tribunals. Però la llei de drets d’autor no és una entitat fixa i eterna. Escrivim noves lleis de drets d’autor costantment. Si la legislació actual en matèria de drets d’autor no impedeix la creació de models, ho faria una futura legislació de drets d’autor?

Bé, clar, és una possibilitat. El primer que s’ha de tenir en compte és el possible mal col·lateral d’una llei així. L’espai legal per a la recol·lecció de dades permet una àmplia gamma de finalitats acadèmiques, arxivístiques, organitzatives i crítiques. Hauríem de tenir molta cura amb no prohibir inadvertidament, per exemple, la recol·lecció de dades del lloc web de la campanya d’un polític, tret que vulguem permetre que els mentiders es presentin a les eleccions i reneguin de les seves promeses insistint en que mai les van fer. No ens agradaria eliminar els motors decerca ni impedir que els creadors recuperin els seus treballs de llocs web que estan desapareixent o canviant els seus termes de servei. Ara bé, quant a l’anàlisi quantitativa: el recompte de paraules i el mesurament de píxels no són activitats per a les quals hauria de necessitar-se permís, amb ordinador o sense, fins i tot si la persona les paraules o els píxels de la qual s’estan comptant no vol que es faci. S’hauria de poder mirar tant com es vulgui els píxels de les fotos familiars de la Kate Middleton o fer un seguiment de l’auge i la caiguda de la coma d’Oxford sense necessitar el permís de ningú per a fer-ho.

Finalment, està el problema de publicar el model. Existeixen moltes anàlisis matemàtiques publicades de grans corpus que són útils i inobjectables.M’encanta un bon N-gram de Google.

I els models de llenguatge extensos (MLE i també coneguts com a LLM) s’usen en tota mena de nínxols com el treball basat en LLM del Human Rights Data Analysis Group que ajuda al Projecte Innocence Nova Orleans (IPNO) a extreure dades d’arxivaments de casos de condemnes injustes.

Entrenament de models d‘IA i protecció de treballs creatius

Aquest és el matís número dos: si decidim crear una nova llei de drets d’autor, hem d’assegurar-nos de no aixafar accidentalment aquestes activitats beneficioses que no perjudiquen les activitats artístiques en el mercat laboral.

Això em porta al punt més important: aprovar una nova llei de drets d’autor que requereixi permís per a entrenar a una IA no ajudarà al fet que els treballadors creatius siguin remunerats ni a protegir les nostres feines.

Getty Images paga als fotògrafs el menys que pot. Els contractes dels editors s’han transformat en uns horribles i quilomètrics artefactesper a retallar drets que li ho lleven tot als escriptors, però tot i així fan recaure sobre ells els riscos legals.

Editors com el New York Times s’oposen amargament als sindicats dels seus escriptors.

Aquestes grans corporacions ja controlen els drets d’autor d’enormes quantitats de dades d’entrenament i tenen els mitjans, el motiu i l’oportunitat de fer-ho. Estan fent-ho en aquest moment.

Els grans estudis de videojocs ja estan actuant com si hi hagués un copyright en les dades d’entrenament i requereixen que els seus actors de veu comencin cada sessió d’enregistrament amb les paraules «Per la present dono permís per a entrenar una IA amb la meva veu», i si no t’agrada, pots marxar.

Si ets un treballador creatiu que espera pagar les seves factures, no importa si el teu salari es veu erosionat per un model entrenat sense pagar al teu ocupador pel dret a fer-ho o si el teu ocupador obté benefici per partida doble venent el teu treball a una empresa d’IA per a entrenar un model i després usa aquest model per a acomiadar-te o reduir el teu salari.

Els treballadors creatius individuals rares vegades tenim poder de negociació davant les corporacions que llicencien els nostres drets d’autor. Per això, l’ampliació dels drets d’autor durant els darrers quaranta anys (en durada, abast i danys legals) ha donat lloc a empreses d’entreteniment més grans i més rendibles i a pagaments més baixos, en termes reals i com a part dels ingressos generats pel seu treball, als treballadors creatius.

Com Rebecca Giblin i jo mateix escrivim en el nostre llibre Chokepoint Capitalism, donar als treballadors creatius més drets per a negociar amb corporacions gegants que controlen l’accés al nostre públic és com donar-li a un nen que sofreix abús escolar diners extres per a l’esmorzar; és només una manera detransferir aquests diners als assetjadors.

El precedent de la indústria musical

Existeix un precedent històric per a aquesta lluita: la lluita sobre el mostreig (sampling) en la música. Fa quaranta anys, no era clar si la mostra requeria una llicència de copyright, i els primers artistes de hip-hop van agafar mostres sense permís, de la mateixa manera en què en una improvisació en directe un músic podia deixar caure un parell de notes d’una cançó coneguda.

Molts artistes s’enfadaven per això amb raó. Els «heritage acts» (l’eufemisme de la indústria musical per referir-se a «persones negres») que van ser més samplejats havien tingut molt mals contractes i havien rebut molt poc de les fortunes generades pel seu treball creatiu. Molts d’ells es trobaven en situació d’extrema pobresa malgrat haver fet guanyar milions als seus segells discogràfics. Quan altres músics van començar a guanyar diners amb aquest treball, van encolerir.

En les següents dècades, el sistema de mostreig va canviar, en part a causa de casos judicials i en part pels termes comercials establerts pels Tres Grans segells discogràfics: Sony, Warner i Universal, que controlen el 70 % de tots els enregistraments de música. Avui dia, en general, no es poden usar mostres sense haver signat amb un dels Tres Grans (ja que es mostren poc inclinats a tractar amb segells independents), i això significa acceptar el seu acord estàndard, que és molt desfavorable i a més implica cedir el teu dret a controlar les teves mostres.

Per tant, un músic que vol crear mostres ha de signar els mals termes oferts per qualsevol dels Tres Grans segells discogràfics i després lliurar 500 $ del seu avançament a un d’ells per a la llicència de la mostra. En general, aquests diners no van a un altre artista, sinó al segell, que els comparteix entre els seus executius i inversors. Aquest sistema empobreix a tots els artistes.

Però la cosa empitjora. Posar un preu a les mostres canvia el tipus de música que pot ser econòmicament viable. Si volguessis pagar totes les mostres d’un àlbum com It Takes a Nation of Millions To Hold Us Back de Public Enemy o Paul’s Boutique de Beastie Boys, hauries de vendre cada CD per 150 $ només per a cobrir costos.

Les llicències de samplejat no només empitjoren la situació financera de tots els artistes, sinó que també eviten la creació d’un tipus de música que milions de persones gaudeixen. Però la situació empitjora encara més. Part de la música antiga, rica en samplejats, no pot ser utilitzada. La major part del catàleg de De La Soul no va estar disponible durant quinze anys i, tot i que part de la seva seminal música va tornar el març de 2022, el líder de la banda, Trugoy the Dove, no va viure per a veure-ho; va morir el febrer de 2022.

Reflexions sobre l’art generat per IA

Aquest és el tercer matís: fins i tot si podem crear un sistema de drets d’autor que prohibeixi els models d’IA sense atrapar massa innocents en la seva xarxa encara podria empobrir més els artistes. Quan va començar el samplejat no era clar si alguna vegada es consideraria artísticament important. El samplejat primerenc va ser cru i experimental. Els músics quees van formar durant anys per a dominar un instrument van rebutjar la ideaque fer clic en un ratolí era «fer música». Avui dia, la majoria denosaltres no qüestionem la idea que el samplejat pot produir artsignificatiu, fins i tot músics que creuen que s’hauria de pagar drets perl’ús de mostres.

Després de viure aquesta època, estic preparat per a creure que tal vegada miri cap endarrere a l’«art» generat per IA i digui: «maleït sigui, mai vaig pensar que podria ser art de debò».

Però no apostaria per això.

No m’agrada l’art generat per IA. Em sembla anodí i avorrit. Com escriu Henry Farrell, és inquietant i no en el bon sentit.

L’analogia de Farrell que compara els resultats generats per la intel·ligència artificial amb el moviment del punter d’una taula de la ouija ofereix una metàfora convincent sobre com operen els sistemes d’IA. En aquesta comparació, Farrell suggereix que els sistemes d’IA, igual que la ouija, semblen produir resultats de manera autònoma, com si tinguessin vida pròpia. No obstant això, aquests resultats no són veritablement independents o creacions conscients sinó el resultat d’entrades col·lectives humanes, similar a com el moviment del punter és influït pels subtils i involuntaris moviments dels participants.

En descriure aquest fenomen com a «acció fantasmal en primer pla», Farrell invoca la idea d’accions misterioses i aparentment no intencionades que ocorren en un context molt íntim o directe. En el cas de la IA, les entrades col·lectives (com a enormes quantitats de dades i les interaccions entre els models i els usuaris) es transformen en resultats que semblen coherents, deliberats i sovint inquietantment específics. No obstant això, aquests resultats no són producte de cap intenció individual o conscient, sinó més aviat propietats emergents de sistemes complexos.

Aquesta analogia destaca la naturalesa paradoxal de la IA: els resultats que genera poden semblar intencionats i amb vida pròpia, encara que provenen de processos subjacents basats en el comportament humà agregat i les dades. La metàfora capta com els sistemes d’IA difuminen la línia entre allò que és creat conscientment i allò que emergeix de la interacció de moltes forces inconscients.

Mireu, l’art és irracional en el sentit que ens parla a un nivell irracional o subracional. Preocupar-se per les tribulacions de persones imaginàries o fascinar-se per les imatges de coses que no existeixen (o que ni tan sols són recognoscibles) no té sentit. Hi ha una forma en la qual tot l’art és com una il·lusió òptica per a la nostra cognició, una cosa imaginària que ens captura de la forma en què ho podria fer una cosa real.

Però l’art és sorprenent. Fer art i experimentar l’art ens fa sentir emocions grans, espirituals i irreductibles. Fer art em manté mentalment sa. Experimentar l’art és una condició prèvia per a tota l’alegria de la meva vida. Després d’haver passat la major part de la meva vida com a artista, he arribat a la conclusió que el motiu és que l’art transmet una aproximació d’algunes emocions grans i transcendents de la ment d’un artista a la nostra. És per això que l’art és sorprenent.

La IA no té ment. No té intenció. Les eleccions estètiques realitzades per les IA no són eleccions, són mitjanes. Com escriu Farrell, «l’art dels LLM a vegades sembla comunicar un missatge, igual que l’art, però no és clar d’on prové aquest missatge o què significa. Si té algun significat, és un significat que no sorgeix d’organitzar la intenció» (l’èmfasi és meu).

Farrell cita The Weird and the Eerie, de Mark Fisher que defineix estrany (weird) en termes fàcils d’entendre («allò que no encaixa») però té més dubtes amb inquietant (eerie).

Per a Fisher, allò inquietant és «quan hi ha una cosa present on no hauria d’haver-hi res, o quan no hi ha res present on hauria d’haver-hi alguna cosa». L’art generat per IA produeix l’aparença d’intenció sense intenció de res. Sembla ser un agent, però no té agència. És inquietant.

Fisher parla del capitalisme com quelcom inquietant. El capital es «conjura del no-res», però «exerceix més influència que qualsevol entitat suposadament substancial». La «mà invisible» dona forma a les nostres vides més que qualsevol altra persona. La mà invisible és inquietant. El capitalisme és un sistema en el qual les coses no substancials, les corporacions, semblen actuar amb intenció, sovint en desacord amb les intencions dels éssers humans que duen a terme aquestes accions.

Llavors, serà l’art generat per IA alguna vegada art? No ho sé. Existeix una llarga tradició d’utilitzar entrades aleatòries, irracionals o impersonals com a punt de partida per als actes humans de creativitat artística. Pensa en l’endevinació.

O les Estratègies obliqües de Brian Eno.

M’encanta fer els meus petits collages per a Pluralistic tot i que no els anomenaria art important. No obstant això, ajuntar fragments d’obres d’altres persones pot produir obres fantàstiques i amb rellevància històrica, com els collages antifeixistes de John Heartfield.

Tot i que retallar meticulosament petits elements d’imatges d’altres pot ser una experiència meditativa i educativa, no crec que l’ús de tisores diminutes o l’eina de llaç sigui allò que defineixi l’«art» en el collage. Malgrat que es pugui automatitzar part d’aquest procés, encara podria ser art.

Conclusions

Això és el que . Crear drets d’autor negociables individuals sobre les dades amb què s’entrena els models no millorarà les condicions materials de la vida dels artistes: tot el que farà serà canviar les proporcions relatives del valor que creem, traspassant part d’aquest valor d’empreses tecnològiques que ens odien i volen que passem gana a empreses d’entreteniment que ens odien i volen que passem gana.

Com a artista, estic fermament en contra de qualsevol cosa que s’interposi en el camí de la creació artística. Com a treballador artístic, estic totalment compromès amb allò que ajudi els treballadors a obtenir una part justa dels diners que genera el seu treball per a poder així alimentar a les seves famílies i pagar el seu lloguer.

Crec que l’art generat per IA d’avui és dolent, i crec que l’art generat per IA de demà probablement serà dolent, però fins i tot si no estàs d’acord (amb qualsevol de les afirmacions), espero que estiguis d’acord que hauríem de centrar-nos a garantir que fer art sigui legal i a que es pagui els artistes.

Només perquè els drets d’autor no arreglaran el mercat laboral creatiu, no vol dir que res ho farà. Si ens preocupen els problemes laborals, podem recórrer a la legislació laboral per a millorar les nostres condicions. Això és el que van fer els escriptors de Hollywood en la seva innovadora vaga de 2023.

Ara bé, els guionistes tenien un avantatge: podien participar en una «negociació sectorial», on un sindicat negocia amb tots els principals ocupadors alhora. Això és il·legal en gairebé qualsevol altre tipus de mercat laboral. Però si estem disposats a contemplar la possibilitat que s’aprovi una nova llei de drets d’autor (que no millorarà les condicions dels artistes), per què no la possibilitat d’aprovar una novallei laboral (que sí ho faria)? Per descomptat, els nostres caps no pressionaran al costat de nosaltres perquè obtinguem més protecció laboral de la mateixa manera que ho farien per a obtenir més drets d’autor (pensa per un moment en què diu això diu sobre qui es beneficia dels drets d’autor enfront de l’expansió de la legislació laboral).

Però tots els treballadors es beneficien d’una major protecció aboral. En lloc d’anar al Congrés dels Diputats juntament amb els nostres caps dels estudis, de les editorials i dels segells musicals per a exigir més drets d’autor, podríem anar al Congrés dels Diputats junt a a tota mena de treballadors, des de dependents de menjar ràpid fins a assistents de publicació i conductors de camions, per a exigir el dret a la negociació sectorial. Aquesta sí que seria una coalició poderosa.

I si volem canviar la forma en què funciona el copyright quant a l’entrenament dels models, vegem les llicències col·lectives, que no poden ser negociades ni eliminades en lloc dels drets individuals que poden ser retinguts quan entren en les oficines dels nostres editors, segells discogràfics o estudis. Aquestes llicències col·lectives han estat un gran èxit en la protecció dels treballadors creatius.

Després està el comodí més salvatge dels drets d’autor: l’Oficina de Drets d’Autor dels EUA ha declarat repetidament que les obres realitzades per IA no poden tenir drets d’autor, ja que aquest és exclusiu de les obres d’autoria humana. Això ha estat confirmat pels tribunals.

Ni les empreses d’IA ni les empreses d’entreteniment pagaran als treballadors creatius si no estan obligades a fer-ho. Però per a qualsevol empresa que consideri vendre un treball generat per IA, el fet que neixi en el domini públic representa un obstacle substancial perquè qualsevol altra persona és lliure de prendre aquesta obra i vendre-la o regalar-la.

El fet que l’«art» generat per IA arribarà a ser un bon art no és en el que pensen els nostres caps quan paguen les llicències d’IA: en el seu lloc, calculen que tenen tant poder de mercat que poden vendre qualsevol cosa mediocre que faci la IA i pagar menys per la llicència d’IA del que pagarien per l’obra d’un artista humà. Com en tots els sectors, la IA no pot fer el treball d’un artista, però un venedor d’IA pot convèncer al cap d’un artista d’acomiadar al treballador creatiu i substituir-lo per IA.

No els importa si és una porqueria, només es preocupen dels resultats econòmics. Un executiu d’estudi que cancel·la una pel·lícula molt esperada abans del seu llançament per a obtenir un benefici fiscal no està pensant en la integritat artística. Només els preocupa una cosa: els diners. El fet que les obres generades per IA puguin copiar-se, vendre’s o regalar-se lliurement pot no significar molt per a un treballador creatiu que realment crea el seu propi art, però t’asseguro que és l’únic que importa als nostres caps.

Bilbiografia

ARAMANDO ARIFIN, Jose; INDRA DEWI, Ienneke (2023). «Lexicogrammatical Analysis on African-American Vernacular English Spoken by African-American You-Tubers». E3S Web of Conferences, vol, 426. DOI: https://doi.org/10.1051/e3sconf/202342601055


Cita recomanada: DOCTOROW, Cory. L’inquietant art de la IA. Mosaic [en línia], setembre 2024, no. 201. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n201.2402

Deja un comentario