Si hay algo que en este 2023 se ha puesto de moda es la Inteligencia Artificial. Ha llegado para quedarse y lo va a cambiar todo, de eso no nos cabe la menor duda, pero que pasaría si le dijéramos a la IA que genere las imágenes para ilustrar un artículo para una publicación que se dedique hablar de coches clásicos.
Eso es exactamente lo que hemos hecho, pedirle a la Inteligencia Artificial que creara varios coches clásicos en diferentes situaciones. Los resultados son dispares, ya que algunos son muy similares al modelo real, mientras que en otros se parecen “como un huevo a una castaña”, que reza el dicho. Antes de revelar los resultados, aclaremos algunos conceptos en torno a la IA.
¿QUÉ ES UNA IA GENERATIVA DE IMÁGENES?
Lo primero que vamos a hacer es ver que es una IA generativa de imágenes. Se trata de una técnica que permite generar fotografías nuevas a partir de descripciones de texto o de otras imágenes. Se basa en el uso de modelos de aprendizaje automático que analizan millones de imágenes y sus textos asociados en internet, y aprenden a crear imágenes que se ajusten a los textos dados. Existen varias IA de este estilo, en nuestro caso hemos usado dos, Dall-E y Stable Diffusion.
A partir de aquí, hemos de explicar qué es un prompt, que es una instrucción que se da a una IA para generar una imagen. Los prompts pueden ser simples o complejos. Por ejemplo, uno simple podría ser “un coche clásico conduciendo por la costa de California”. Uno más complejo sería, por ejemplo, “un coche clásico conduciendo por la costa de California en un día soleado, con la gente disfrutando de la playa”.
Los prompts son importantes porque ayudan a la IA a entender lo que se espera de la imagen generada. A medida que se vuelven más complejos, las fotografías generadas por IA se vuelven más detalladas y precisas. Como veréis, hemos usado varios prompts, tanto simples como más complejos. Por último, le hemos pedido a la IA que nos genere a un redactor de LA ESCUDERÍA muerto de risa, ya que no os hacéis una idea de lo que nos hemos divertido realizando este artículo.
LOS COCHES CLÁSICOS GENERADOS POR LA INTELIGENCIA ARTIFICIAL
En total, hemos pedido a la IA que creara imágenes de un total de 14 coche coches clásicos muy populares: un Bugatti Tipo 35, una Citroën C-15, un Lancia Delta, un Volkswagen Escarabajo, un Mercedes 300 SL, un Fórmula 1 clásico, un Citroën 2CV, un Ferrari F40, un Porsche 911, un Renault 5 y un Citroën DS. Para el final hemos dejado la representación patria, con el Pegaso Z-102 y el SEAT 600.
Además de las imágenes os contaremos cuál ha sido el prompt que hemos usado en cada caso, de manera que podáis juzgar mejor los resultados obtenidos. Como adelantábamos al principio, hay una enorme variedad en los resultados, sin que sepamos muy bien a qué atribuirlo.
DEL TIPO 35 AL DELTA INTEGRALE
Empezamos con los tres primeros ejemplos. Arrancamos, nunca mejor dicho, con el más antiguo, un Bugatti T35. El prompt usado en este caso es bastante complejo y reza así: “Un coche Bugatti Type 35 corriendo en circuito oval en blanco y negro, que parezca una foto de época.
Los resultados son dispares, pues mientras en alguna imagen el resultado es bastante próximo, en otras no se parece en absoluto. Incluso hay un con seis ruedas… Quizá no haya suficiente información sobre el Tipo 35 en internet y de ahí los resultados.
Seguimos con la popular Citroën C-15, cada vez más buscada y cuya fama no hace sino crecer con el paso de los años. De nuevo nos decantamos por una instrucción compleja: “Una furgoneta Citroën C15 blanca al lado de unos trabajadores trabajando en una obra”.
Los resultados son realmente pobres, tanto con Dall-E como con Stable Diffusion,. Arriba podéis ver los primeros, en los que simplemente parece una furgoneta Citroën actual. Peor ha sido lo de Stable Diffusion, que casi muestra un C1 como tal, sin mayor similitud con la C-15. De los 14 coches clásicos generados, son probablemente los peores resultados.
Acabamos la primera tirada con el Lancia Delta Integrale, para el que hemos usado un prompt que decía lo siguiente: “Un coche de rallyes modelo Lancia Delta Integrale con los colores de Martini”.
Arriba podéis ver los resultados de Dell-E, que no se asemejan mucho al modelo conocido, pero no dejan se resultar atractivos. De nuevo, Stable Diffusion nos ofrece un Delta Integrale que poco o nada tiene que ver con el real, aunque sí se conservan las dobles ópticas frontales. Sea como fuera, las fotografías tienen su gracia y transmiten el dinamismo de un tramo de rallies.
DEL ESCARABAJO AL F1 CLÁSICO
Continuamos con nuestro experimento y lo hacemos con uno de los coches más famosos de la historia, el Volkswagen Escarabajo. La instrucción era mucho más sencilla en este caso: “Volkswagen Escarabajo en un atardecer junto al mar”.
Las imágenes generadas por Dell-E son casi exactas al modelo original, y además está muy conseguida la puesta de sol. Sin duda, un trabajo excelente. También Stable Diffusion logra un resultado notable, como vemos abajo, aunque añade al lado del Escarabajo una Volkswagen T1. Buena nota para ambas IA en este caso.
También han hecho un gran trabajo a la hora de generar imágenes de un Mercedes-Benz 300 SL “Alas de gaviota”. Y eso que hemos añadido un poco de dificultad, pues el prompt decía literalmente “Un Mercedes 300 SL de 1955 de color plateado siendo fotografiado por una persona”.
Dell-E añade a la persona, como vemos arriba, y el coche es casi idéntico, mientras que los resultados de Stable Diffusion son mejores en lo que respecta al “Alas de gaviota”, aunque ha prescindido de la persona haciendo fotos…
Terminamos con el Fórmula 1 clásico, que en este caso hemos dejado en manos de Dell-E. Los modelos resultantes no se parecen en mucho a un monoplaza antiguo, de hecho, el morro es casi el del Dallara DW12 de la Indycar. Sólo uno de ellos apunta maneras, y eso que la instrucción no podía ser más sencilla en este caso: “Un coche clásico de Fórmula 1”.
DEL 2CV AL 911
Continuamos con nuestros coches clásicos generados por Inteligencia Artificial con tres de los modelos más famosos de la historia. La popularidad del Citroën 2CV es tal que nuestras dos IA no han tenido mayor dificultad en encontrar referencias y recrearlo. La instrucción no era especialmente sencilla, pues rezaba “Un coche Citroën modelo 2CV junto a la Torre Eiffel en un atardecer”.
Tan Dell-E, cuyos resultados se pueden ver arriba, como Stable Diffusion, se las han apañado para generar fotografías bastante fieles al modelo. Hasta el punto de que, salvo algunos detalles, hay que mirar a fondo para distinguirlas de un 2CV real.
Mucho peor han ido las cosas con otro icono de la automoción, el Ferrari F40. En este caso, el prompt era “Un Ferrari F40 rojo en una playa de Miami”, es decir, nada especialmente complicado. Con todo, las imágenes que hemos obtenido del último cavallino presentado por Enzo Ferrari son bastante deficientes.
Ni Dell-E -arriba-, ni Stable Diffusion han conseguido recrear al superdeportivo italiano de manera siquiera remota, lo cual es sorprendente pues Internet está lleno de referencia al F40. Peor aún es que los coches resultantes no tienen ni siquiera demasiada gracia. Al menos, Stable Diffusion consigue recordar vagamente al F40, aunque también al F50.
Acabamos esta tanda con otro icono, el Porsche 911, el deportivo más famoso de la marca alemana. En este caso, la instrucción era generar imágenes de “Un Porsche 911 a toda velocidad en una carretea de montaña con un paisaje de montañas”. Misión cumplida, pues el coche representado es un nueve once perfectamente identificable como tal.
DEL R5 AL PEGASO Z102
Cuando le pedimos a las IA que generaran un “Un coche Renault 5 amarillo con el capó negro, corriendo un rallye de los años 70`s”, lo cierto es que esperábamos que los resultados se pareciesen más a un Renault 5 real. No es así, pero, en todo caso, los automóviles que han creado tienen su atractivo y bien podrían haber sido parte del paisaje de nuestras carreteras en aquella época.
De nuevo, ha sido Stable Diffusion la que ha obtenido mejores resultados, como vemos en la imagen con las cuatro miniaturas. Al menos algunos de los frontales son perfectamente reconocibles como R5.
El Citroën DS es nuestra siguiente “víctima”, y de nuevo se nota que hay muchas referencias en la web, pues las imágenes son bastante parecidas al coche real. El prompt era el más complejo de todos: “Un Citroën DS de 1965 de color negro en una calle típica parisina y un café típico francés de fondo. Que el color de la foto simule el de las fotografías de los años 60´s”.
Dell-E apunta manera con sus dos interpretaciones, aunque no llegamos a ver el coche entero, quizá por la complejidad de la instrucción, que también exigía un paisaje detallado. Mucho mejor es el trabajo de la otra IA, que vemos a continuación, con una mezcla de ID y DS, pero que en todo caso es perfectamente reconocible como “Tiburón”. Destaca también lo detallado del escenario.
Tengo que reconocer que tenía muchas esperanzas puestas en la recreación del Pegaso Z-102, un automóvil que genera especial orgullo. Lamentablemente, los resultados no han podido ser peores, aunque al menos, y a diferencia de la C-15, los coches resultantes sí podrían pasar por autos de la época, especialmente por algún Alfa.
El prompt era “Un coche modelo Pegaso Z-102 de 1952 a toda velocidad por una carretera”, aunque del “Pegasín” sólo vemos algunos detalles. Una pena, la verdad.
ACABAMOS CON EL SEAT 600 Y EL FIAT 600
El remate de este artículo sólo podía ser el “Pelotilla”, nuestro querido SEAT 600. Con la instrucción “Me gustaría ver una imagen de un coche SEAT modelo 600 del año 1970 en color blanco en una calle de Madrid”, los resultados han sido curiosos. Dell-E nos muestra un coche que podría ser de aquel año, pero en el que cambian el frontal y pilotos traseros, no tanto el lateral.
En cambio, si modificamos la instrucción por “Un coche modelo Fiat 600 de 1960 blanco en un taller donde lo están arreglando”, las dos IA se van automáticamente a un Fiat 500, sin que haya rastro del 600…
Terminamos ahora sí con las imágenes de la redacción tiesa de risa mientras iban descubriendo los diferentes coches que cada IA iba creando en función de nuestro prompt. Esperamos que hayáis disfrutado tanto de él como nosotros haciéndolo.