Universitat Oberta de Catalunya

Tensiones e intersecciones entre aprendizaje automático y creación artística

Las innovaciones tecnológicas imparables que ha sido capaz de producir la especie más «inteligente» de la tierra han cambiado la faz del planeta. La creatividad no está limitada a los artistas, pero a través de sus obras pueden comunicar emociones, pensamientos y experiencias personales, así como explorar temas desafiantes y provocativos, generando preguntas y reflexiones críticas sobre la sociedad y la vida.

En estos momentos, la humanidad, en general, y los artistas, en especial, se enfrentan a un «invento» transformador que ha experimentado un crecimiento exponencial en los últimos años; la inteligencia artificial (IA). A partir del año 2000, la IA resurgió con avances en el aprendizaje automático (machine learning – ML) y las redes neuronales artificiales, lo que revolucionó áreas como las de la visión por computadora y el procesamiento del lenguaje natural (Russell y Norvig, 2016).

Concretamente, en 2014, surgió una innovadora técnica de generación de imágenes llamada redes generativas antagónicas (Generative Adversarial Networks– GAN) que implica entrenar dos redes neuronales en competencia. Una red, la generativa, experimenta con combinaciones en un espacio latente para producir imágenes candidatas similares a las de la base de datos. La otra red, la discriminadora, evalúa las candidatas utilizando datos originales para determinar qué imágenes son genuinas y cuáles son artificiales. Esta rivalidad entre las redes mejora constantemente la calidad y el realismo de las imágenes generadas (Goodfellow et al., 2014).

En 2016, Radford y su equipo ampliaron esta técnica al utilizar redes neuronales convolucionales profundas (Deep Convolutional Generative Adversarial Networks– DCGAN) para generar rostros. Las GAN han evolucionado y se han diversificado en múltiples variantes desde 2014, hasta convertirse en un modelo generativo poderoso que abarca aplicaciones en procesamiento de imágenes, visión por computadora, procesamiento de lenguaje natural, música, voz, ámbito médico, etc.

Por otro lado, existen enfoques como el Neural Style Transfer (NST) (Gatys et al., 2015) que permite combinar el estilo de una imagen con el contenido de otra. También se introdujo el modelo Pix2Pix en 2017, una GAN condicional que utiliza una imagen real para guiar la generación en lugar de partir de ruido (Isola et al., 2017).

En 2019, Karras y su equipo implementaron el método de entrenamiento StyleGAN. Esta técnica progresiva permite un crecimiento gradual tanto del generador como del discriminador, partiendo de resoluciones bajas y añadiendo capas para capturar detalles más finos a medida que avanza el entrenamiento. Esta metodología ha llevado a una notable mejora en la resolución y calidad de las imágenes generadas por las GAN.

Además de las redes convolucionales, que requieren codificadores y decodificadores, se han desarrollado modelos más eficientes que conectan estos componentes mediante mecanismo de «atención». Una arquitectura destacada es el transformer, que se basa únicamente en mecanismos de atención, eliminando la necesidad de recurrencias y convoluciones (Vaswani et al., 2017). Un ejemplo de transformer muy conocido es el ChatGPT (Chat Generative Pre-Trained Transformer) (Brown, 2020). Los transformers son, en definitiva, un tipo importante de modelo generativo que ha despertado un creciente interés también en la síntesis de imágenes (Caron et al., 2021; Esser et al., 2021).

La problematización de la creatividad en el contexto de los algoritmos generativos es un tema fascinante y complejo que ha generado debates y reflexiones en diversas áreas, como el arte, la tecnología o la ética. Los algoritmos generativos pueden producir contenidos que antes se asociaban principalmente al proceso creativo humano. Esto plantea interrogantes sobre si estas creaciones automáticas pueden considerarse verdaderamente «artísticas» en el sentido tradicional.

Frente a las perspectivas apocalípticas, algunos argumentamos que los algoritmos generativos no reemplazan la creatividad humana, sino que ofrecen nuevas formas de colaboración entre humanos y máquinas . Los artistas y diseñadores pueden usar estos algoritmos como herramientas para explorar nuevas ideas y expresiones, combinando sus propias habilidades con las capacidades del ML (Rosado-Rodrigo y Reverter, 2020). Además, el uso y la reflexión crítica sobre las perspectivas artísticas y humanísticas del aprendizaje automático proporcionan narrativas alternativas a las de las ciencias de la computación, que facilitan una comprensión interdisciplinaria.

La investigadora y autora destacada en inteligencia artificial y creatividad Margaret Boden ha explorado ampliamente en su trabajo cómo las máquinas pueden ser consideradas creativas y su relación con la creatividad humana. En el contexto de la inteligencia artificial, sostiene que las máquinas pueden ser creativas al generar nuevas combinaciones y explorar posibilidades inéditas que resulten valiosas en un contexto específico. Sin embargo, subraya que la creatividad humana involucra aspectos emocionales, contextuales y culturales aún no replicados completamente por las máquinas (Boden, 2004).

Las diferencias clave entre el aprendizaje en computadoras y humanos se refieren a la naturaleza del aprendizaje y a la capacidad de generalización. Las computadoras aprenden a través de algoritmos y modelos matemáticos basados en cálculos, mientras que los humanos aprenden a través de la experiencia y la reflexión. Las computadoras pueden generalizar patrones con datos similares, pero los humanos tienen una capacidad más flexible para aplicar conceptos a situaciones nuevas.

Benjamins y Salazar especulan sobre el futuro de la humanidad respecto a temas como la toma de decisiones autónomas, la privacidad, la relación entre máquinas y personas, la computación cuántica y la posibilidad de almacenar información en moléculas de ADN, reflexionando sobre otras tecnologías importantes, además de la IA, como la biotecnología, neurotecnología o nanotecnología (estas plantean cuestiones similares a las de la IA, pero no desde el punto de vista de una máquina, sino desde la perspectiva de los humanos «mejorados» o «intervenidos»). Remarcan el peligro de la pérdida de privacidad de los pensamientos, ya que se están realizando pruebas para leer la actividad cerebral y descifrarla como palabras e imágenes; estos trabajos abrirían la puerta a manipular los pensamientos de las personas a través de señales eléctricas (Benjamins y Salazar, 2020, pág. 280).

Otros autores, como Byung-Chul Han, nos invitan a reflexionar y cuestionar el mundo tecnológico en que vivimos. Opinan que «hoy estamos en la transición de la era de las cosas a la era de las no-cosas. No son las cosas, sino la información, lo que determina el mundo en que vivimos» (Han, 2021, pág. 13). Han tiene una visión crítica sobre la IA y aboga por recuperar la magia de lo sólido y lo tangible, reflexionando sobre el silencio que se pierde con el ruido de la información.

Desde otro punto de vista, Miller, en su libro The artist in the machine de 2019, explica que nosotros mismos somos máquinas biológicas y nos dirigimos a hibridarnos con máquinas basadas en el silicio. Del mismo modo que las computadoras, nosotros también buscamos patrones en los datos para nuestra propia supervivencia, y estos patrones puedes ser también bellos.

Al igual que ocurrió con la aparición de la fotografía, donde se debatió ampliamente sobre el papel que desempeña la cámara en el proceso fotográfico, minimizando muchas veces el del fotógrafo, las imágenes producidas mediante ML han sido enmarcadas como expresiones de las capacidades de los algoritmos, obviando al creador. Pero es un hecho innegable que las exploraciones de los artistas, a menudo presentando perspectivas poco ortodoxas sobre cómo se puede usar el aprendizaje automático, proporcionan perspectivas enriquecedoras para el debate.

Como apunta Wasielewski, mientras que «interdisciplinariedad» sigue siendo una palabra de moda en el mundo académico, cualquier comunicación entre disciplinas suele estar plagada de malentendidos epistemológicos (Wasielewski, 2023). Las ciencias de la computación y el arte hablan «idiomas diferentes» y utilizan metodologías diferentes. Importar epistemologías de las ciencias de la computación al ámbito de la creación artística puede producir que los artistas que trabajen en las fronteras de estas disciplinas se encuentren empantanados ingenuamente en problemas recursivos o preocupaciones que el ámbito del arte tenga superados largamente a lo largo de su historia; el simple hecho de generar un tipo de imagen, reproducir un determinado estilo o apariencia no es suficiente para calificar el producto como obra de arte.

En el escenario descrito, la enseñanza artística superior enfrenta el desafío de integrar de manera efectiva los avances en algoritmos de aprendizaje automático en el proceso formativo, y a la vez fomentar la originalidad, la autenticidad y el pensamiento crítico entre los estudiantes. Algunos de los retos importantes incluyen lograr un equilibrio entre creatividad humana y automatización, revisar los planes de estudio para incluir conceptos de IA y ayudar a los alumnos a comprender cómo utilizar estas herramientas en su trabajo creativo, integrando estas habilidades técnicas en su formación artística. Además, es conveniente incluir discusiones sobre la ética de la IA en el contexto artístico, formar a los artistas para trabajar en equipo con expertos en IA, mantener los programas de enseñanza actualizados y promover una adaptación constante del profesorado a la rápida evolución de la tecnología.

Finalmente, destacamos que todavía los modelos de aprendizaje automático generativo no son sistemas creativos completamente autónomos, no pueden formular intenciones ni evaluar sus propios resultados. Al incorporar estos procesos «inteligentes» en nuestros protocolos creativos, si nos centramos en el aprendizaje para la perfección, perderemos otros resultados interesantes en la creación artística. Para concluir, defendemos el potencial de los algoritmos de ML, desde la perspectiva del arte, para proporcionar nuevos imaginarios formales y conceptuales, y ponemos en valor la forma en la que el aprendizaje automático puede ampliar nuestra comprensión de las imágenes.

Bibliografía:

BENJAMINS, Richard; SALAZAR, Inma (2020). El mito del algoritmo. Ediciones Anaya.

BODEN, Margareth (2004). The Creative Mind: Myths and Mechanisms (2a. ed). Routledge. DOI: https://doi.org/10.4324/9780203508527

BROWN, Tom; MANN, Ben; RYDER, Nick; SUBBIAH, Melanie; KAPLAN, Jared D.; DHARIWAL, Prafulla; NEELAKANTAN, Arvind; SHYAM, Pranav; SASTRY, Girish; ASKELL, Amanda; AGARWAL, Sandhini; HERBERT-VOSS, Aliya; KRUEGER, Gretchen; HENIGHAN, Tom; CHILD, Rewon; RAMESH, Aditya; ZIEGLER, Daniel M; WU, Jeffrey; WINTER, Clemens; HESSE, Chris; CHEN, Mark; SIGLER, Eric; LITWIN, Mateen; GRAY, Scott; CHESS, Benjamin; CLARK, Jack; BERNER, Christopher; McCANDLISH, SAM; RADFORD, Alec; SUTSKEVER, Ilya; AMODEI Dario (2020). «Language models are few-shot learners». Advances in neural information processing systems, n.º 33, págs. 1877-1901. DOI: https://doi.org/10.48550/arXiv.2005.14165

CARON, Mathilde; TOUVRON, Hugo; MISRA, Ishan; JÉGOU, Hervé; MAIRAL, Julien; BOJANOWSKI, Piotr; JOULIN, Armand (2021). «Emerging properties in self-supervised vision Transformers». Proceedings of the IEEE/CVF international conference on computer vision, págs. 9650-9660). DOI: https://doi.org/10.1109/ICCV48922.2021.00951

ESSER, Patrick; ROMBACH, Robin; OMMER, Björn (2021). «Taming transformers for high-resolution image synthesis». Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, págs. 12873-12883). DOI: https://doi.org/10.1109/CVPR46437.2021.01268

GATYS, Leon A.; ECKER, Alexander S.; BETHGE, Matthias (2015, 26 agosto). «A Neural Algorithm of Artistic Style». arXiv. DOI: https://doi.org/10.48550/arXiv.1508.06576

GOODFELLOW, Ian; POUGET-ABADIE, Jean; MIRZA, Mehdi; XU, Bing; WARDER-FARLEY, David; OZAIR, Sherjil; COURVILLE, Aaron; BENGIO, Yoshua (2014). «Generative Adversarial Nets». Advances in neural information processing systems, 27 (NIPS 2014) [en líniea]. Disponible en: https://papers.nips.cc/paper_files/paper/2014/hash/5ca3e9b122f61f8f06494c97b1afccf3-Abstract.html

HAN, Byung Chul (2021). No-cosas. Quiebras del mundo de hoy. Taurus.

ISOLA, Phillip; ZHU, Jun-Yan; ZHOU, Tinghui; EFROS, Alexei A. «Image-to-image translation with conditional adversarial networks». Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, págs. 1125-1134.

KARRAS, Tero; LAINE, Samuli; AILA, Timo (2019). «A Style-Based Generator Architecture for Generative Adversarial Networks». Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, págs. 4401-4410. DOI: https://doi.org/10.1109/CVPR.2019.00453

MILLER, Arthur I. (2019). The artist in the machine: the world of AI-powered creativity. Massachusetts: The MIT press. DOI: https://doi.org/10.7551/mitpress/11585.001.0001

RADFORD, Alec; METZ, Luke; CHINTALA, Soumith (2016). «Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks». arXiv. DOI: https://doi.org/10.48550/arXiv.1511.06434

ROSADO RODRIGO, Pilar; REVERTER COMES, Francesc (2020). «Panoramic views on the collective visual heritage through convolutional neural networks. The exhibitions Revolutionary Arkive and Mnemosyne 2.0 by Pilar Rosado». Artnodes, n.º 26, págs. 1-12. DOI: https://doi.org/10.7238/a.v0i26.3354

ROSADO RODRIGO, Pilar; REVERTER COMES, Francesc (2023). «The Art of the Masses: Overviews on the Collective Visual Heritage through Convolutional Neural Networks». Big Data and Cognitive Computing, vol. 7, n.º 1, pág. 33. DOI: https://doi.org/10.3390/bdcc7010033

RUSSELL, Stuart J.; NORVIG, Pete (2016). Artificial Intelligence: A Modern Approach. Pearson.

VASWANI, Ashish; SHAZEER, Noam; PARMAR, Niki; USZKOREIT, Jakob; JONES, Lukasz; GOMEZ, Aidan. N.; POLOSUKHIN, Illia (2017). «Attention is all you need». 31st Conference on Neural Information Processing Systems (NIPS 2017) [en líniea]. Disponible en: https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf

WASIELEWSKI, Adam (2023). Computational formalism. Art history and machine learning. Massachusetts: The MIT press. DOI: https://doi.org/10.7551/mitpress/14268.001.0001

Cita recomendada: ROSADO, Pilar. Tensiones e intersecciones entre aprendizaje automático y creación artística. Mosaic [en línea], marzo 2024, no. 200. ISSN: 1696-3296. DOI: https://doi.org/10.7238/m.n200.2313

Deja un comentario