Cuentan que un amigo de George Bernard Shaw le pidió consejo para poner título a su libro. El Premio Nobel de Literatura le hizo unas preguntas. “¿Hay pífanos?”. “No”, contestó el otro. “¿Hay tambores?”. “No”, de nuevo. “Entonces llámalo: Ni pífanos ni tambores”, concluyó Shaw.
La Inteligencia Artificial generativa más avanzada se basa en la tecnología GAN (siglas en inglés de Redes Generativas Antagónicas) y su base teórica se centra precisamente en lo que no es. Ni pífanos, ni tambores. El proceso lógico es similar al descrito en la anécdota anterior: si pedimos a una IA dibujar un caballo, la máquina descarta todo aquello que no es un caballo. En este proceso, se ponen en marcha dos computadoras enfrentadas: la generadora y la discriminadora. Llamamos a estas máquinas redes neuronales adversas. Funcionarían así:
Aunque obtenemos el resultado en tan solo unos segundos, este proceso se repite miles, millones de veces, hasta que finalmente…:
Y es entonces cuando el usuario recibe la imagen original e inédita de un caballo, que no existía hace unos segundos. Se trata de un dibujo generado a partir de los caballos que no son.
Además, la máquina aprende e incorpora esta información a su base de datos. Así consigue no repetir los mismos errores y optimizar este proceso en cada nueva operación. Es la tecnología machine learning, o aprendizaje automatizado.
Cuando navegamos por Internet, los usuarios constantemente alimentamos a este cerebro. Uno de los ejemplos más conocidos son los reCAPTCHA, compañía propiedad de Alphabet, matriz de Google. Al enviar un formulario web, a menudo se nos pide identificar imágenes para clasificarlas en grupos y distinguir entre lo que es y lo que no es. Si solucionamos el acertijo correctamente, la web entiende que no soy un robot. De este modo, al seleccionar aquellas imágenes que contienen, por ejemplo, un semáforo, estamos ejerciendo el papel de discriminadores y entrenando a la IA a identificar qué es un semáforo.
Centrar el proceso creativo en lo que no es para llegar al objeto, es una técnica conocida entre los aprendices de dibujo. Es interesante que la IA siga estos mismos patrones. Una de las lecciones que Edwin Catmull (2014) fundador y presidente de Disney-Pixar Studios, enseña a sus estudiantes, es que aprendan a dibujar una silla, centrándose en lo que no es la silla. “El truco consiste en pedir a los estudiantes que se concentren en los espacios negativos. Por ejemplo, al dibujar una silla, dibujarían lo que no es la silla: los espacios entre las patas de la silla, por ejemplo. La razón es que, si bien el cerebro reconoce una silla como tal, no asigna ningún significado a la forma de los espacios entre las patas de la silla. Que los artistas hayan aprendido a emplear estas formas de ver no significa que no vean también lo que nosotros vemos. Simplemente ven más porque han aprendido a desactivar la tendencia de sus mentes a sacar conclusiones precipitadas”.
Al centrarse en estos espacios negativos, el dibujante se libera de la idea de silla preconcebida que tiene en la mente. Dibujando lo que no es la silla, llegará a una representación más exacta y fidedigna del objeto. En la tríada de Peirce, siguiendo este atajo, el representamen se acerca al objeto y se aleja del interpretante o imagen mental.
La famosa pipa de Magritte en La traición de las imágenes (1928-1929) se centra en la importancia de lo que no es.
Resulta curioso que este proceso creativo de la tecnología, nos traslade a perspectivas filosóficas centradas en la lógica del diálogo y en la importancia de lo que no es. Bien sea un diálogo implícito (entre dos redes neuronales), o explícitos (como los que tenemos con ChatGPT), lo cierto es que la IA generativa se basa en el diálogo para llegar al objeto.
De otro lado, resulta lógico que así sea. Nuestro principal medio para alcanzar el conocimiento, es el diálogo. De Platón a Galileo, el diálogo es camino a la verdad.
Aunque quizá sea en la filosofía Zen donde encontramos una mejor combinación entre diálogo y no ser. Uno de los textos clásicos del Zen se titula justamente: “La puerta que no es puerta”. Cuando el aprendiz se inicia en esta disciplina, el maestro propone un koan: un problema en forma de paradoja que el discípulo tendrá que resolver mediante la meditación. Se toman de una colección tradicional. “Usa tu espada, que está en tus manos vacías” o “¿Cuál es el sonido de una palmada con una sola mano?”. Meditando durante horas, días, semanas, el discípulo va incubando su tarea, hasta que finalmente se presenta ante el maestro. Tiene derecho a consultarlo una vez por día. El maestro escucha, menea la cabeza y sin una palabra de explicación remite al confundido discípulo nuevamente al recinto de meditación. También puede que siquiera le permita pronunciar palabra, enviándolo de vuelta no bien abra la puerta. Este proceso se repite innumerables veces, hasta que finalmente el discípulo alcanza el satori, iluminación. “Es como si viera el bosque a pesar de tantos árboles” (Galbiati, 2000). No ve otras cosas diferentes de las de antes. Ve las cosas de otra manera. Su visión se ha modificado, probablemente, él mismo se ha transmutado.
Así, funcionan exactamente las redes generativas antagónicas, siendo el generador nuestro aprendiz y el discriminador el maestro. Un juego de suma cero en el que finalmente se obtiene un resultado único. Además, la red neuronal aprende. Se transforma como el discípulo Zen tras la meditación. El diálogo y el no ser, como vehículo hacia la creación.
Paolo Fabbri (1998), describe en El giro semiótico el descubrimiento científico de la estrella de neutrones, donde dos investigadores (que luego ganarían el Nobel), en una conversación, se ponen de acuerdo sobre la existencia de un objeto:
El descubrimiento no es hasta que se convierte en relato. La conversación germina la ciencia y el texto la construye.
Tampoco es el arte sin el diálogo del autor con su obra: “La escultura ya estaba dentro de la piedra. Yo, únicamente, he debido eliminar el mármol que le sobraba”, apuntó un joven Miguel Ángel al ser preguntado sobre la perfección formal de La Piedad. Allí nació su leyenda. De nuevo, los espacios negativos y la importancia de lo que no es.
Existen teorías que afirman que la corporeidad es el límite de la IA. El cuerpo físico sería, por tanto, la frontera final entre humano y máquina. Por tanto, el espacio alosemiótico o de traducción entre semiosferas, en términos de Lotman. Sin embargo, algunos lingüistas (Lakoff, por ejemplo) han pensado que este espacio intermedio podría estar ocupado por la metáfora. “Si las metáforas, como se puede demostrar, contienen una descripción simuladora de fenómenos de corporeidad, no habrá que dotar a los ordenadores de palabras o léxicos, sino de metáforas, unas metáforas que incluyan las dimensiones del cuerpo”.
La cultura científica no avanza sólo por inferencias lógicas, sino también, y, sobre todo, por extensiones laterales del conocimiento debidas a fenómenos parabólicos o metafóricos. En este sentido, nuestra IA es lógica y dialógica. Si se quiere silogística. También, por supuesto, se basa en probabilidades. Como hemos visto, su proceso creativo se centra en lo que no es, en la negación del ser y hemos visto ejemplos de cómo este recurso es ampliamente utilizado en la búsqueda del saber.
Pero no es metafórica. La IA no piensa en metáforas y este es por el momento su gran debilidad.
La palabra griega metaforá (µεταφορά) no se refiere sólo a la metáfora literaria, sino que significa también “transporte”, “traslado”. De ahí que el autobús en griego sea un medio de metáfora.
Sin este medio de transporte que es la metáfora, la Inteligencia Artificial queda limitada a deducciones lógicas, pero jamás podrá imaginar. René Magritte nos mostró qué no es una pipa. Para la IA ésta es la pipa que no es.
Resultado en DALL·E mini (generador de imágenes basado en IA) al pedir que no cree una pipa. Se introduce el prompt NOT “pipe”.
En la imagen anterior se observa el objeto que para la IA no es una pipa. Si se quiere, se trata de la deconstrucción de una pipa y, de hecho, se observan partes y elementos de este objeto. Pero no existe transporte o metáfora.
Al pedir a la IA que genere la imagen de una pipa, identifica los elementos que la conforman, la descompone y la vuelve a unir. Cualquier cosa que no fuera una pipa hubiera sido metafórica. Lo que la IA no puede hacer, es el viaje de ida y vuelta que propone Magritte.
El matemático Norton Lorenz, fundador de la Teoría del Caos, decía que “todas las metáforas son verdad”. Se puede utilizar la metáfora como extensión del conocimiento y tenemos ante nosotros quizá la mayor oportunidad de extender nuestros límites como nunca antes habíamos imaginado.
Decía McLuhan que cada tecnología es una extensión del ser humano. “Los medios tecnológicos extienden las habilidades humanas, del mismo modo que una bicicleta o un automóvil son una extensión de nuestros pies”. Si la tecnología es una prolongación de nuestro cuerpo y nuestros sentidos, la IA es la extensión definitiva. Para cumplir su promesa habrá de centrarse, como lo hace, en lo que no es. En lo invisible y periférico. Además, será dialógica y no lineal. Por último, para trascender nuestros propios límites, será no solo lógica sino, sobre todo, metafórica.
La revolución en la IA, quizá la singularidad tecnológica, pasa por la negación del ser Heideggeriana y por el pensamiento metafórico. Ese es el País de las Maravillas y, como decía Alicia (1951): “En mi mundo todo sería lo que no es y entonces al revés, lo que es, no sería y lo que no podría ser, sí sería. ¿Entiendes?”.
El pífano. Édouard Manet (1866).
Catmull, E., & Wallace, A. (2014). Creativity, Inc. (The Expanded Edition): Overcoming the Unseen Forces That Stand in the Way of True Inspiration. Random House.
Fabbri, P. (1998). La svolta semiótica. Laterza.
Galbiati, L. (2000). El Zen y la crisis del hombre. Editorial Ahimsa
Francisco José García Ull es profesor de Marketing en la Universidad Europea de Valencia