Universitat Oberta de Catalunya

El inquietante arte de la IA

Entrenamiento de modelos e infracción de derechos de autor

Cuando se trata de arte generado por IA (o «arte»), es difícil encontrar una posición matizada que respete los derechos laborales de los trabajadores creativos, la libre expresión, las excepciones y limitaciones vitales de la ley de derechos de autor y la estética.

En general, estoy en contra del arte generado por IA, pero hay algunas salvedades importantes para esa posición. Para empezar, desde el punto de vista legal creo que es inequívocamente erróneo decir que el raspado (scrapping) de obras para entrenar un modelo con los datos obtenidos infringe los derechos de autor. Esta no es una postura moral (llegaré a eso en un momento), sino más bien una cuestión técnica. Si se desglosan los pasos de la creación de un modelo para entrenar IA, rápidamente se hace evidente por qué técnicamente es incorrecto llamarlo una infracción de derechos de autor. En primer lugar, el acto de hacer copias temporales de obras, incluso de miles de millones de obras, es inequívocamente un uso justo. A menos que se crea que los motores de búsqueda e Internet Archive no deberían existir, se debería estar a favor de la recolección de datos a gran escala. Y a menos que se crea que Facebook debería poder utilizar la ley para bloquear proyectos como Ad Observer, que recopila muestras de desinformación política pagada, entonces se debería apoyar la recolección de datos a gran escala, incluso cuando el sitio del cual se están extrayendo datos se oponga (al menos en algunas ocasiones):

Después de hacer copias temporales de muchas obras, el siguiente paso para entrenar una IA es someterlas a análisis matemáticos. De nuevo, esto no es una violación de los derechos de autor.

Hacer observaciones cuantitativas sobre las obras es una herramienta importante, respetada y largamente practicada para la crítica, el análisis, el archivado y los nuevos actos de creación. Medir la contracción constante del vocabulario en las sucesivas novelas de Agatha Christie ofrece una fascinante ventana a su demencia.

El análisis programático del discurso en línea extraído también es fundamental para los crecientes análisis formales del lenguaje hablado por las minorías, lo que produce un relato vibrante de la rigurosa gramática de los dialectos que desde hace mucho tiempo se han tachado de «argot».

Desde 1988, el UCL Survey of English Language ha mantenido su proyecto International Corpus of English, y los académicos lo han usado a fondo para extraer conclusiones importantes sobre la amplia variedad de formas del inglés que se hablan en todo el mundo, especialmente en los países de habla inglesa poscolonial.

El último paso en el proceso de entrenamiento de un modelo es publicar las conclusiones del análisis cuantitativo de los documentos copiados temporalmente en forma de código de software. El código en sí es un discurso expresivo, y esa expresividad es clave en la lucha por la privacidad, porque el hecho de que el código sea una expresión limita la capacidad de los gobiernos para censurar el software.

¿Están cometiendo los modelos algún tipo de infracción? Bueno, sin duda podrían estar haciéndolo. En algunos casos, está claro que los modelos «memorizaron» algunos de los datos usados para su entrenamiento, convirtiendo la copia transitoria de uso justo en una copia permanente infractora. Esto se considera generalmente el resultado de un error de programación, y sin duda podría evitarse (por ejemplo, comparando el modelo con los datos de formación y eliminando cualquier memorización que aparezca).

Sin embargo, no todos los actos que parecen una memorización lo son realmente. Aunque los modelos específicos varían mucho, la cantidad de datos de cada elemento retenida por el modelo es mínima. Por ejemplo, Midjourney conserva aproximadamente un byte de información de cada imagen en sus datos de entrenamiento. Si hablamos de una imagen web típica de baja resolución de, por ejemplo, 300 kb, eso sería unas trescientas milésimas partes (0,0000033 %) de la imagen original.

Normalmente, en las conversaciones sobre derechos de autor, cuando una obra contiene el 0,0000033 % de otra, ni siquiera planteamos la cuestión del uso legítimo. Más bien, descartamos el uso como de minimis (abreviatura de minimis non curat lex o «La ley no se preocupa de minucias»).

Acusar a alguien de infringir derechos de autor por apropiarse del 0,0000033 % de tu trabajo es como denunciar por allanamiento a alguien porque la punta de su zapato roza una brizna de césped de tu jardín.

Pero algunas obras o partes de estas aparecen en línea muchas veces. Por ejemplo, la marca de agua de Getty Images aparece en millones de imágenes similares de personas de pie sobre alfombras rojas y pasarelas, por lo que un modelo que tome siquiera una muestra infinitesimal de cada una de esas obras podría terminar siendo capaz de producir una marca de agua completa y reconocible de Getty Images.

Lo mismo ocurre con los artículos de agencias de noticias u otros textos ampliamente sindicados: puede haber docenas o incluso cientos de copias de estas obras en los datos usados para entrenar a los modelos, lo que podría llevar a que se memoricen extensos pasajes de dichos textos. Esto podría ser una infracción (estamos entrando en un territorio confuso y sin precedentes aquí), pero de nuevo, aunque sea así, no sería una gran dificultad para los fabricantes de modelos posprocesar sus modelos comparándolos con el conjunto de entrenamiento, eliminando cualquier memorización inadvertida. Incluso si el modelo resultante no tuviera ninguna memorización, esto no haría nada para aliviar las preocupaciones (legítimas) de los trabajadores creativos sobre la creación y el uso de estos modelos.

El debate sobre arte generado por IA

Este es el primer matiz en el debate del arte generado por IA: desde un punto de vista técnico, entrenar un modelo no es una infracción de derechos de autor. Los trabajadores creativos que esperan utilizar la ley de derechos de autor para evitar que la IA cambie el mercado laboral creativo probablemente se sentirán muy decepcionados en los tribunales. Pero la ley de derechos de autor no es una entidad fija y eterna. Escribimos nuevas leyes de derechos de autor en todo momento. Si la legislación actual en materia de derechos de autor no impide la creación de modelos, ¿lo haría una futura legislación de derechos de autor?

Bueno, claro, es una posibilidad. Lo primero que se debe tener en cuenta es el posible daño colateral de una ley así. El espacio legal para la recolección de datos permite una amplia gama de fines académicos, archivísticos, organizativos y críticos. Deberíamos tener mucho cuidado con no prohibir inadvertidamente, por ejemplo, la recolección de datos del sitio web de la campaña de un político, a no ser que queramos permitir que los mentirosos se presenten a las elecciones y renieguen de sus promesas insistiendo en que nunca las hicieron. No nos gustaría eliminar los motores de búsqueda ni impedir que los creadores recuperen su propio trabajo de páginas web que están desapareciendo o cambiando sus términos de servicio. Ahora, en cuanto al análisis cuantitativo: el recuento de palabras y la medición de píxeles no son actividades para las que debería necesitarse permiso, con o sin ordenador, incluso si la persona cuyas palabras o píxeles se están contando no quiere que se haga. Se debería poder mirar tanto como se quiera los píxeles de las fotos familiares de Kate Middleton o hacer un seguimiento del auge y la caída de la coma de Oxford sin necesitar el permiso de nadie para hacerlo.

Por último, está el problema de publicar el modelo. Existen muchos análisis matemáticos publicados de grandes corpus que son útiles e inobjetables. Me encanta un buen N-gram de Google.

Y los modelos de lenguaje de gran tamaño (LLM) se usan en todo tipo de nichos como el trabajo basado en LLM del Human Rights Data Analysis Group que ayuda al Proyecto Innocence New Orleans (IPNO) a extraer datos de archivos de casos de condenas infjustas.

Entrenamiento de modelos de IA y protección de trabajos creativos

Ese es el matiz número dos: si decidimos crear una nueva ley de derechos de autor, debemos asegurarnos de no aplastar accidentalmente estas actividades beneficiosas que no perjudican a las actividades artísticas en el mercado laboral.

Esto me lleva al punto más importante: aprobar una nueva ley de derechos de autor que requiera permiso para entrenar a una IA no ayudará a que los trabajadores creativos sean remunerados ni a proteger nuestros puestos de trabajo.

Getty Images paga a los fotógrafos lo menos que puede. Los contratos de los editores se han transformado en unos horrendos y kilométricos artilugios para recortar derechos que se lo quitan todo a los escritores, pero aun así hacen recaer sobre ellos los riesgos legales.

Editores como el New York Times se oponen amargamente a los sindicatos de sus escritores.

Estas grandes corporaciones ya controlan los derechos de autor de enormes cantidades de datos de entrenamiento y tienen los medios, el motivo y la oportunidad de hacerlo. Están haciéndolo en este momento.

Los grandes estudios de videojuegos ya están actuando como si hubiera un copyright en los datos de entrenamiento y requieren que sus actores de voz comiencen cada sesión de grabación con las palabras «Por la presente otorgo permiso para entrenar una IA con mi voz», y si no te gusta puedes irte.

Si eres un trabajador creativo que espera pagar sus facturas, no importa si tu salario se ve erosionado por un modelo entrenado sin pagar a tu empleador por el derecho a hacerlo o si tu empleador obtiene doble beneficio vendiendo tu trabajo a una empresa de IA para entrenar un modelo y luego usa ese modelo para despedirte o reducir tu salario.

Los trabajadores creativos individuales rara vez tenemos poder de negociación ante las corporaciones que licencian nuestros derechos de autor. Por eso, la ampliación de los derechos de autor durante los últimos 40 años (en duración, alcance y daños legales) ha dado lugar a empresas de entretenimiento más grandes y más rentables y a pagos más bajos, en términos reales y como parte de los ingresos generados por su trabajo, a los trabajadores creativos.

Como Rebecca Giblin y yo mismo escribimos en nuestro libro Chokepoint Capitalism, dar a los trabajadores creativos más derechos para negociar con corporaciones gigantes que controlan el acceso a nuestro público es como darle a un niño que sufre abuso escolar dinero extra para el almuerzo; es solo una forma de transferir ese dinero a los acosadores.

El precedente de la industria musical

Existe un precedente histórico para esta lucha: la lucha sobre el muestreo (sampling) en la música. Hace cuarenta años, no estaba claro si la muestra requería una licencia de copyright, y los primeros artistas del hiphop tomaron muestras sin permiso, del mismo modo en que en una improvisación en directo un músico podía dejar caer un par de notas de una canción conocida.

Muchos artistas se enfadaban por esto con razón. Los «heritage acts» (el eufemismo de la industria musical para referirse a «personas negras») que fueron más sampleados habían tenido muy malos contratos y habían recibido muy poco de las fortunas generadas por su trabajo creativo. Muchos de ellos estaban en situación de extrema probreza a pesar de haber hecho ganar millones a sus sellos discográficos. Cuando otros músicos empezaron a ganar dinero con ese trabajo, se enfurecieron.

En las siguientes décadas, el sistema de muestreo cambió, en parte debido a casos judiciales y en parte por los términos comerciales establecidos por los Tres Grandes sellos discográficos: Sony, Warner y Universal, que controlan el 70 % de todas las grabaciones de música. Hoy en día, por lo general, no se pueden usar muestras sin haber firmado con uno de los Tres Grandes (ya que se muestran reacios a tratar con sellos independientes), y eso significa aceptar su acuerdo estándar, que es muy desfavorable, y además ceder tu derecho a controlar tus muestras.

Por lo tanto, un músico que quiere crear muestras tiene que firmar los malos términos ofrecidos por cualquiera de los Tres Grandes sellos discográficos y luego entregar 500 $ de su adelanto a uno de ellos para la licencia de la muestra. Por lo general, este dinero no va a otro artista, sino al sello, que los comparte entre sus ejecutivos e inversores. Este sistema empobrece a todos los artistas.

Pero la cosa empeora. Poner un precio a las muestras cambia el tipo de música que puede ser económicamente viable. Si quisieras pagar todas las muestras de un álbum como It Takes a Nation of Millions To Hold Us Back de Public Enemy o Paul’s Boutique de Beastie Boys, tendrías que vender cada CD por 150 $ solo para cubrir costes.

Las licencias de samples no solo empeoran la situación financiera de todos los artistas, sino que también evitan la creación de un tipo de música que millones de personas disfrutan. Pero la situación empeora aún más. Parte de la música antigua, rica en samples, no puede ser utilizada. La mayor parte del catálogo de De La Soul no estuvo disponible durante 15 años y, aunque parte de su seminal música volvió en marzo de 2022, el líder de la banda, Trugoy the Dove, no vivió para verlo; falleció en febrero de 2022.

Reflexiones sobre el arte generado por IA

Este es el tercer matiz: incluso si podemos crear un sistema de derechos de autor que prohíba los modelos de IA sin atrapar muchos inocentes en su red aún podría empobrecer más a los artistas. Cuando comenzó el sampling, no estaba claro si alguna vez se consideraría artísticamente importante. El muestreo temprano fue crudo y experimental. Los músicos que se formaron durante años para dominar un instrumento rechazaron la idea de que hacer clic en un ratón era «hacer música». Hoy en día, la mayoría de nosotros no cuestionamos la idea de que el sampling puede producir arte significativo, incluso músicos que creen que se debería pagar derechos por el uso de muestras.

Después de vivir esa época, estoy preparado para creer que tal vez mire hacia atrás al «arte» generado por IA y diga: «maldita sea, nunca pensé que podría ser arte de verdad».

Pero no apostaría por ello.

No me gusta el arte generado por IA. Me parece anodino y aburrido. Como escribe Henry Farrell, es inquietante y no en el buen sentido.

La analogía de Farrell que compara los resultados generados por la inteligencia artificial con el movimiento del puntero de una tabla Ouija ofrece una metáfora convincente sobre cómo operan los sistemas de IA. En esta comparación, Farrell sugiere que los sistemas de IA, al igual que la Ouija, parecen producir resultados de manera autónoma, como si tuvieran vida propia. Sin embargo, estos resultados no son verdaderamente independientes o creaciones conscientes sino el resultado de entradas colectivas humanas, similar a cómo el movimiento del puntero es influido por los sutiles e involuntarios movimientos de los participantes.

Al describir este fenómeno como «acción fantasmal en primer plano», Farrell invoca la idea de acciones misteriosas y aparentemente no intencionadas que ocurren en un contexto muy íntimo o directo. En el caso de la IA, las entradas colectivas (como enormes cantidades de datos y las interacciones entre los modelos y los usuarios) se transforman en resultados que parecen coherentes, deliberados y a menudo inquietantemente específicos. Sin embargo, estos resultados no son producto de ninguna intención individual o consciente, sino más bien propiedades emergentes de sistemas complejos.

Esta analogía destaca la naturaleza paradójica de la IA: los resultados que genera pueden parecer intencionados y con vida propia, aunque provienen de procesos subyacentes basados en el comportamiento humano agregado y los datos. La metáfora capta cómo los sistemas de IA difuminan la línea entre lo que es creado conscientemente y lo que emerge de la interacción de muchas fuerzas inconscientes.

Mirad, el arte es irracional en el sentido de que nos habla a un nivel irracional o subracional. Preocuparse por las tribulaciones de personas imaginarias o fascinarse por las imágenes de cosas que no existen (o que ni siquiera son reconocibles) no tiene sentido. Hay una forma en la que todo el arte es como una ilusión óptica para nuestra cognición, una cosa imaginaria que nos captura de la forma en que lo podría hacer una cosa real.

Pero el arte es asombroso. Hacer arte y experimentar el arte nos hace sentir emociones grandes, numinosas e irreducibles. Hacer arte me mantiene cuerdo. Experimentar el arte es una condición previa para toda la alegría de mi vida. Tras haber pasado la mayor parte de mi vida como artista, he llegado a la conclusión de que el motivo es que el arte transmite una aproximación de algunas emociones grandes y transcendentes de la mente de un artista a la nuestra. Es por eso por lo que el arte es asombroso.

La IA no tiene mente. No tiene intención. Las elecciones estéticas realizadas por las IA no son elecciones, son promedios. Como escribe Farrell, «el arte de los LLM a veces parece comunicar un mensaje, al igual que el arte, pero no está claro de dónde proviene ese mensaje o qué significa. Si tiene algún significado, es un significado que no surge de organizar la intención» (el énfasis es mío).

Farrell cita The Weird and the Eerie, de Mark Fisher que define extraña (weird) en términos fáciles de entender («aquello que no encaja») pero tiene más dudas con inquietante (eerie).

Para Fisher, lo inquietante es «cuando hay algo presente donde no debería haber nada, o cuando no hay nada presente donde debería haber algo». El arte generado por IA produce la apariencia de intención sin intención de nada. Parece ser un agente, pero no tiene agencia. Es inquietante.

Fisher habla del capitalismo como algo inquietante. El capital se «conjura de la nada», pero «ejerce más influencia que cualquier entidad supuestamente sustancial». La «mano invisible» da forma a nuestras vidas más que cualquier otra persona. La mano invisible es inquietante. El capitalismo es un sistema en el que las cosas no sustanciales, las corporaciones, parecen actuar con intención, a menudo en desacuerdo con las intenciones de los seres humanos que llevan a cabo esas acciones.

Entonces, ¿será el arte generado por IA alguna vez arte? No lo sé. Existe una larga tradición de utilizar entradas aleatorias, irracionales o impersonales como punto de partida para los actos humanos de creatividad artística. Piensa en la adivinación.

O las Estrategias oblicuas de Brian Eno.

Me encanta hacer mis pequeños collages para Pluralistic aunque no los llamaría arte importante. Sin embargo, unir fragmentos del trabajo de otras personas puede producir obras fantásticas e importantes con relevancia histórica, como los collages antifascistas de John Heartfield

Aunque recortar minuciosamente pequeños elementos de imágenes de otros puede ser una experiencia meditativa y educativa, no creo que el uso de tijeras diminutas o la herramienta de lazo sea lo que define el «arte» en el collage. Aunque se pueda automatizar parte de este proceso, aún podría ser arte.

Conclusiones

Esto es lo que sé. Crear derechos de autor negociables individuales sobre los datos con que se entrena a los modelos no mejorará las condiciones materiales de vida de los artistas: todo lo que hará será cambiar las proporciones relativas del valor que creamos, traspasando parte de ese valor de empresas tecnológicas que nos odian y quieren que pasemos hambre a empresas de entretenimiento que nos odian y quieren que pasemos hambre.

Como artista, estoy firmemente en contra de cualquier cosa que se interponga en el camino de la creación artística. Como trabajador artístico, estoy totalmente comprometido con aquello que ayude a los trabajadores a obtener una parte justa del dinero que genera su trabajo para poder así alimentar a sus familias y pagar su alquiler.

Creo que el arte generado por IA de hoy es malo, y creo que el arte generado por IA de mañana probablemente será malo, pero incluso si no estás de acuerdo (con cualquiera de las afirmaciones), espero que estés de acuerdo en que deberíamos centrarnos en garantizar que hacer arte sea legal y en que se pague a los artistas.

Solo porque los derechos de autor no arreglarán el mercado laboral creativo, no significa que nada lo hará. Si nos preocupan los problemas laborales, podemos recurrir a la legislación laboral para mejorar nuestras condiciones. Eso es lo que hicieron los escritores de Hollywood en su innovadora huelga de 2023.

Ahora bien, los guionistas tenían una ventaja: podían participar en una «negociación sectorial», donde un sindicato negocia con todos los principales empleadores al mismo tiempo. Esto es ilegal en casi cualquier otro tipo de mercado laboral. Pero si estamos dispuestos a contemplar la posibilidad de que se apruebe una nueva ley de derechos de autor (que no mejorará las condiciones de los artistas), ¿por qué no la posibilidad de aprobar una nueva ley laboral (que sí lo haría)? Por supuesto, nuestros jefes no presionarán junto a nosotros para que obtengamos más protección laboral de la misma manera que lo harían para obtener más derechos de autor (piensa por un momento en lo que eso dice sobre quién se beneficia de los derechos de autor frente a la expansión de la legislación laboral).

Pero todos los trabajadores se benefician de una mayor protección laboral. En lugar de ir al Congreso de los Diputados junto con nuestros jefes de los estudios, de las editoriales y de los sellos musicales para exigir más derechos de autor, podríamos ir al Congreso de los Diputados junto a todo tipo de trabajadores, desde dependientes de comida rápida hasta asistentes de publicación y conductores de camiones, para exigir el derecho a la negociación sectorial. Esa sí que sería una coalición poderosa.

Y si queremos cambiar la forma en que funciona el copyright en cuanto al entrenamiento de los modelos, veamos las licencias colectivas, que no pueden ser negociadas ni eliminadas en lugar de los derechos individuales que pueden ser retenidos en cuanto entran en las oficinas de nuestros editores, sellos discográficos o estudios. Estas licencias colectivas han sido un gran éxito en la protección de los trabajadores creativos.

Luego está el comodín más salvaje de los derechos de autor: la Oficina de Derechos de Autor de EE.UU. ha declarado repetidamente que las obras realizadas por IA no pueden tener derechos de autor, ya que este es exclusivo de las obras de autoría humana. Esto ha sido confirmado por los tribunales.

Ni las empresas de IA ni las empresas de entretenimiento pagarán a los trabajadores creativos si no están obligadas a hacerlo. Pero para cualquier empresa que considere vender un trabajo generado por IA, el hecho de que nazca en el dominio público representa un obstáculo sustancial porque cualquier otra persona es libre de tomar esa obra y venderla o regalarla.

El hecho de que el «arte» generado por IA llegará a ser un buen arte no es en lo que nuestros jefes piensan cuando pagan las licencias de IA: en su lugar, calculan que tienen tanto poder de mercado que pueden vender cualquier cosa mediocre que haga la IA y pagar menos por la licencia de IA de lo que pagarían por la obra de un artista humano. Como en todos los sectores, la IA no puede hacer el trabajo de un artista, pero un vendedor de IA puede convencer al jefe de un artista para despedir al trabajador creativo y sustituirlo por IA.

No les importa si es una porquería, solo se preocupan por los resultados económicos. Un ejecutivo de estudio que cancela una película muy esperada antes de su lanzamiento para obtener un beneficio fiscal no está pensando en la integridad artística. Solo les preocupa una cosa: el dinero. El hecho de que las obras generadas por IA puedan copiarse, venderse o regalarse libremente puede no significar mucho para un trabajador creativo que realmente crea su propio arte, pero te aseguro que es lo único que importa a nuestros jefes.

Bilbiografía

ARAMANDO ARIFIN, Jose; INDRA DEWI, Ienneke (2023). «Lexicogrammatical Analysis on African-American Vernacular English Spoken by African-American You-Tubers». E3S Web of Conferences, vol, 426. DOI: https://doi.org/10.1051/e3sconf/202342601055


Cita recomendada: DOCTOROW, Cory. El inquietante arte de la IA. Mosaic [en línea], septiembre 2024, no. 201. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n201.2402

Deja un comentario