Estamos presenciando una oleada de aplicaciones de IA generativa en diversos campos creativos que ha sucedido en paralelo desde hace varios años e incluso décadas.
La inteligencia artificial (IA) es una rama de la computación que comenzó a definirse claramente en los años 50, prácticamente desde los inicios de la computación industrial y comercial. Para comprender su evolución, es de rigor referirse al artículo fundacional de Alan Turing y a la reunión celebrada en Dartmouth College cinco años después, en la que se establecieron preguntas que aún guían la investigación en IA.
Hoy en día, cuando hablamos de IA, nos referimos a una etapa en la que el acceso a estas herramientas ha cambiado de manera dramática. En un pasado no distante, los proyectos de IA eran principalmente investigaciones avanzadas confinadas a laboratorios especializados. Sin embargo, a partir de 2017, la situación cambió, esta transformación se debe a tres desarrollos fundamentales:
- La publicación por parte de Google del artículo “Atención es todo lo que Necesitas” en 2017 que introdujo el concepto de “transformers”, detallando una arquitectura para una nueva generación de aplicaciones de IA. Este documento marcó un avance significativo en el uso de técnicas de aprendizaje automático y procesamiento estadístico.
- En 2018, tres científicos, Yoshua Bengio, Geoffrey Hinton y Yann LeCun, recibieron el Premio Turing de la ACM (equivalente al Nobel en la computación) por sus contribuciones a las redes neuronales artificiales lo que tuvo un impacto fundamental en los algoritmos de aprendizaje automático e inteligencia artificial.
- La aparición en 2022 de un servicio Chat Generative Pre-Trained Transformer ó Chat GPT basado en modelos de lenguaje extensos (large language models) que democratizó el acceso a la IA, permitiendo que cualquier usuario en el mundo, a través de computadoras portátiles o teléfonos, pudiera experimentar sus capacidades.
En parte visibilizados por esos desarrollos, estamos presenciando una oleada de aplicaciones de IA generativa en diversos campos del arte, el diseño, el cine y la arquitectura que ha sucedido en paralelo desde hace varios años, e incluso décadas. Ejemplos recientes ilustran cómo estas herramientas están redefiniendo la interacción entre humanos y máquinas con respecto a la producción de imágenes, sonidos, películas y espacios virtuales; ilustremos con ejemplos del cine. En el campo de la escritura de guiones, ya en el 2016 el corto “Sunspring” sorprendió con una historia creada enteramente con IA y entrenada gracias a un corpus de guiones de ciencia ficción. En el ámbito del sonido, en el 2022 la serie documental “The Andy Warhol Diaries” sobre la vida Andy Warhol, usa una voz sintética generada con Resemble AI’s synthetic speech engine que usó la voz del artista para leer los diarios basado en un modelo entrenado con su propia voz. Más recientemente, 2023, films como “/Imagine” usan herramientas de IA generativa en todo el proceso de creación y producción del cortometraje; Runway es una herramienta prominente en el campo del video generativo pero existen muchas alternativas. Entre ellas destacan herramientas sorprendentes por la capacidad de articulación de diferentes medios a través de avanzadas paradigmas computacionales como Omniverse que puede integrar herramientas para la producción de imagen, audio y de entornos virtuales generados por IA, en una sóla plataforma permitiendo incluso la creación de gemelos digitales de espacios o de seres humanos.
Gran parte del progreso en IA actual proviene de avances en campos creativos, especialmente en gráficos por computadora y videojuegos.
En el contexto de SIGGRAPH 2024, el científico neozelandés Mark Sagar presentó su investigación sobre humanos digitales, mostrando su proyecto “Baby X”, que ha estado en desarrollo durante una década. Baby X es un gemelo digital (es decir un modelo computacional a nivel visual, espacial y cognitivo de un ser humano) de su propia hija durante las etapas críticas del aprendizaje del lenguaje y la locomoción. Este proyecto es importante porque explora cómo una representación tridimensional del rostro puede proporcionar información sobre el estado emocional de la niña virtual y su relación con los procesos cognitivos en desarrollo en la realidad. Durante la conferencia, Jordi Alonso, tuvo la oportunidad de entrevistar a Mark Sagar para discutir el papel de la representación facial y los desafíos éticos, cognitivos y sociales asociados con dar una “cara humana” a la inteligencia artificial.
En este punto me gustaría detenerme en dos aspectos que considero son de vital importancia y que usualmente se dejan de lado al hablar de IA, el primero tiene que ver con el hardware y el segundo con la reconfiguración del trabajo.
Un aspecto menos conocido y en mi opinión determinante en el desarrollo actual de la inteligencia artificial depende tanto de innovaciones en software como en hardware. Esto sucedió porque uno de los motores de la evolución en IA ha sido la necesidad de mejorar la calidad de las imágenes en las computadoras, lo que fue inicialmente impulsado por el campo de los videojuegos. Las GPUs (unidades de procesamiento gráfico), diseñadas originalmente para el procesamiento de imágenes, han demostrado ser más rápidas que las CPUs tradicionales y se han vuelto irremplazables en la ejecución de algoritmos de IA. Sin la potencia de procesamiento de las GPUs (enormes conjuntos de GPUs) los grandes servicios de IA que tienen interfaces de usuario en las computadoras y dispositivos móviles no podrían alcanzar la velocidad y eficiencia requeridas. En este contexto, la relación entre creatividad e inteligencia artificial es sorprendente, justamente una necesidad creativa por mejorar gráficas pavimento la vía técnica de la IA. Dicho en otras palabras, gran parte del progreso en IA actual proviene de avances en campos creativos, especialmente en gráficos por computadora y videojuegos. Las tarjetas gráficas, que incorporan nuevos principios de diseño en microcontroladores, han transformado radicalmente la velocidad y capacidad del procesamiento de aplicaciones de IA.
Por otro lado, muchos expertos coinciden en que estamos viviendo una revolución industrial gracias a la inteligencia artificial. Sin embargo, es importante considerar qué cambios culturales deben ocurrir para que esta revolución sea comparable a revoluciones industriales del pasado. Una respuesta clara se ubica en las prácticas laborales, la pregunta si las herramientas generativas para guión, imagen, sonido y entornos virtuales están produciendo impactos en el mundo del trabajo, tal como ha sucedido en revoluciones industriales anteriores que afectaron las rutinas laborales y los perfiles profesionales de otras esferas de la cultura. Este cambio parece estar presente en el uso de herramientas de IA a escala industrial en Hollywood, lo que muestra cómo la IA está reemplazando o complementando ciertos trabajos creativos, redefiniendo las habilidades requeridas en la industria y reconfigurando la demanda laboral. Evaluar cuál es el peso del uso de la IA a nivel masivo por la industria en la meca del cine Hollywood es difícil, sin embargo entender lo que está pasando en este campo puede ser de gran utilidad porque puede dar luces sobre lo que serán los conflictos sociales del futuro cercano.
En Cataluña existen varias iniciativas interesantes que aportan al campo desde diferentes lugares, una de ellas es el festival de cine, animación e IA +RAIN, proyectos periodísticos como (PARÉNTESIS MEDia) que documentan de manera elocuente el día a día de la evolución e impacto de la IA. El campo del arte ha sido activo en discutir el uso ético además de creativo de estas herramientas entre ellos podemos destacar el trabajo de Joana Moll y Joan Soller, y es clave recordar que el CCCB dedicó una exposición comprensiva al tema en el 2023, la cual está bien documentada en línea.