J’ai créé une bande dessinée avec l’IA, et elle ne remplacera pas les artistes de sitôt
J’ai essayé de créer une bande dessinée avec un chatbot et un générateur d’images. Malgré l’échec de mon projet, j’ai été étonné de la qualité des résultats.
Ces personnages ne ressemblent pas à des scientifiques, et Scarlet Shadow, mon anti-héroïne, n’a pas du tout l’air d’être mi-femme, mi-démon ! J’ai abandonné mon projet de création d’une bande dessinée à l’aide d’outils d’intelligence artificielle (IA) au bout de quelques jours à peine. Il avait pourtant bien commencé.
Les chatbots et les générateurs d’images intelligents sont à la fois fascinants et effrayants. Ils ont l’air étonnamment créatifs et semblent produire des contenus à partir de rien. « Semblent », j’insiste sur ce mot, car ces images sont générées à partir de modèles d’informations et d’images tirés d’un fonds d’échantillons. Ils font apparaître des problématiques comme la citation des sources et le droit d’auteur sur lesquels mes collègues Michelle Brändle et Coya Vallejo, par exemple, se sont penchées. Je me suis concentré sur la faisabilité de mon projet, et non sur les aspects légaux et la définition de l’art.
J’ai besoin d’une héroïne
Je suis un grand fan de comics, malheureusement je n’ai ni le talent ni la motivation pour en dessiner moi-même. Vais-je réaliser mon rêve avec les nouveaux outils comme Midjourney et ChatGPT ? Midjourney est un programme d’IA qui génère des images à partir de saisies de texte. Il est en phase bêta, on peut le tester via le logiciel de chat Discord. Il me suffit de taper la commande /imagine suivie de mes mots préférés dans une fenêtre de chat et de le laisser générer des images.
Pour commencer, il me faut un scénario et un personnage principal. Le chatbot ChatGPT s’en charge. Comme le documentaire Mike Mignola: Drawing Monsters a réveillé ma passion pour « Hellboy », je prends le célèbre démon rouge comme exemple. Je tape donc :
I need a main character for a comic. She’s part-human, part-demon. She’s inspired by Mike Mignola’s Hellboy (J’ai besoin d’un personnage principal pour un comic ; c’est un mélange d’humain et de monstre, qui s’inspire de Hellboy, créé par Mike Mignola)
Le résultat ? Scarlet Shadow, mi-femme, mi-démon, à la fourrure écarlate, aux oreilles pointues, et dotée d’une queue. Elle a été créée par un sorcier malveillant, qui voulait faire d’elle une arme. L’idée ne lui plaisait pas, alors elle s’est retournée contre lui et a intégré le camp des gentils. Elle a été trouvée par une équipe d’enquêteurs qui travaillent sur des affaires paranormales, et elle les aide à combattre les menaces surnaturelles.
Jusque là, on reste dans la veine de Hellboy, mais les pouvoirs surnaturels de Scarlet et la possibilité de modifier ma créature me donnent quelques possibilités intéressantes. C’est un bon point de départ. Passons au scénario. J’essaie avec le texte suivant :
Tell me a story with Scarlet Shadow to create a 15 to 20-pages long comic (raconte-moi une histoire avec Scarlet Shadow pour créer un comic de 15 à 20 pages). L’histoire se déroule dans les années 80, elle doit contenir des éléments supernaturels, des éléments de science-fiction, et se dérouler en Suisse.
Je change le titre. À la place de « Les Alpes éternelles », j’opte pour « Les Immortels ». Le reste de l’histoire est du grand n’importe quoi. Elle met en scène un groupe de scientifiques qui se font attaquer et kidnapper par des inconnus alors qu’ils enquêtent sur un phénomène paranormal dans les Alpes suisses. Scarlet Shadow patrouille à proximité. Elle entend du bruit et part voir ce qui se passe. Elle découvre une organisation secrète, les Immortels, dont les membres croient être les descendants d’une ancienne civilisation alpine et sont impliqués dans un conflit avec des extraterrestres.
Quand je saisis d’autres commandes, ChatGPT me fournit, au besoin, des détails sur la manière dont Scarlet Shadow délivre les scientifiques et vient à bout aussi bien des extraterrestres que des Immortels.
Une image, par pitié
Toutes ces informations devraient être plus que suffisantes pour générer les premières images de mon comic. Midjourney laisse vraiment libre cours à mon imagination. Je commence avec une description par mots clefs de Scarlet Shadow, le personnage suggéré par ChatGPT.
imagine/ woman with scarlet fur instead of skin, she is a mixture of human and demon, the woman has long, pointed ears and a long tail. (> imagine/ une femme au pelage écarlate à la place de la peau. Elle est à la fois humaine et démone, elle a de longues oreilles pointues et une longue queue.) Elle a aussi de puissantes griffes et se sert de ses dents pour attaquer l’ennemi.
Pour le style, je me fie à mes goûts personnels. Je complète ma saisie par : 80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2 (style artistique sci-fi futuriste des années 80, écarlate, bande dessinée, --ar 3:2) Pour terminer, je dois choisir un paramètre de format d’image.
Il m’a fallu au moins 30 minutes pour obtenir cette image. Chaque tâche prend environ une à deux minutes. J’ai pris un abonnement à 30 dollars qui me permet de commander jusqu’à trois tâches en parallèle. Durant ces 30 minutes, j’ai testé plusieurs mots, placés dans des ordres différents. Je ne sais pas très bien à quels mots Midjourney accorde la priorité. Ce que j’aimerais, c’est que Scarlet Shadow ait un pelage écarlate. Dans le meilleur des cas, Midjourney me dessine une femme portant une écharpe de fourrure autour du cou, ou arborant un chat perché sur son épaule. Que dire... Je suis satisfait de l’image de couverture, c’est déjà ça.
Un style homogène, par pitié
Le challenge, c’est de créer un comic complet dans le même style, dont l’héroïne garde son apparence jusqu’à la fin. Un designer américain a justement eu ce problème. Il a créé un livre pour enfants avec ces outils et l’a proposé sur Amazon. Ses personnages ne sont pas identiques, et il s’est limité la plupart du temps à une image par page. Mon objectif est de créer un vrai comic, avec plusieurs cases sur chaque page.
Pour maintenir un style aussi homogène que possible, j’entre la commande « seed » sur Midjourney, suivi du numéro de seed. Je me sers de la couverture comme référence, ce qui donne le paramètre suivant : --seed 4187562391.
En plus des mots clefs, j’utilise toujours les lignes suivantes pour créer les autres images :
80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2 --seed 4187562391 (> style artistique rétro sci-fi futuriste des années 80, écarlate, bande dessinée, --ar 3:2.)
J’ai maintenant une héroïne, un scénario et un style. Je demande ensuite à ChatGPT à quoi ressemblerait la première page. Il me fournit des modèles de première case, parmi lesquels un panorama des Alpes, sous un ciel menaçant. On y voit aussi un petit groupe de scientifiques, équipement sur le dos, prêts à partir à l’aventure. Sur une autre petite case, on aperçoit Scarlet Shadow, sous sa forme humaine, qui patrouille. Jusqu’ici, tout va bien. C’est quand je passe à Midjourney que les ennuis commencent. Le style de l’image panoramique est assez similaire à celui de la couverture.
La case sur laquelle se trouvent les scientifiques me demande nettement plus de tentatives avant que la perspective et l’apparence des personnages ne soient correctes.
Je m’éloigne donc un peu des propositions de ChatGPT et je tente de créer une autre image des scientifiques. Cette fois-ci, c’est un gros plan, sur lequel je peux ajouter une bulle de dialogue. Il me faut maintenant accorder le style du dessin avec l’apparence et la couleur des personnages. Je n’arrive pas à générer une bulle de dialogue, mais je pourrais l’ajouter manuellement par la suite. Après de multiples saisies, la commande suivante me fournit l’image qui convient :
swiss scientists, with futuristic equipment, hiking up the mountain, close up of two scientists, sky is dark, cold, eerie, Scary 80s retro sci-fi future art style, scarlet, graphic novel, --ar 3:2 --seed 4187562391 (> scientifiques suisses avec équipement futuriste, montent sur la montagne, gros plan sur deux scientifiques, le ciel est sombre, froid, sinistre, style artistique rétro sci-fi futuriste effrayant des années 80, écarlate, bande dessinée, --ar 3:2 --seed 4187562391)
Je décide de ne plus utiliser le terme « suisse », car aucune croix suisse n’apparaît sur les uniformes, malgré mes efforts. J’improvise à nouveau sur la case suivante. D’après le scénario, les scientifiques enquêtent sur des phénomènes mystérieux avant d’être kidnappés. J’aimerais donc créer une image sur laquelle ils découvrent quelque chose qui brille de manière surnaturelle. Il me faut presque deux heures pour obtenir une image montrant à peu près les mêmes scientifiques que sur les images précédentes, de dos, qui regardent quelque chose briller.
À la case suivante, je mets un point final à mon projet. Je veux montrer Scarlet Shadow à une distance moyenne, cachée, alors qu’elle observe les scientifiques qui s’approchent de l’ovni. Peu importe mes efforts, je n’arrive tout simplement pas à créer une Scarlet qui ressemble à celle de l’image de couverture, sans parler de l’idée qu’elle regarde les scientifiques depuis une certaine distance. Les scientifiques n’apparaissent plus du tout. Peut-être ont-ils été kidnappés par les extraterrestres. Aucune idée.
Le style passe parfois à celui des cartes postales en noir et blanc des années 50, avec un ovni rouge dans le ciel. J’abandonne.
L’IA n’est quand même pas la panacée
Mon test m’a rapidement montré les possibilités et les limites de l’IA appliquée aux créations artistiques. J’ai obtenu de belles images, et même ajouté certaines à ma collection de fonds d’écran. Mais lorsqu’on les regarde en détail, ces créations ne tiennent pas la route. Une oreille n’est pas finie, une lumière apparaît là où l’environnement devrait être sombre, et on observe souvent de petits artefacts.
Mais le problème principal de la génération d’image, c’est son manque d’uniformité. Je n’ai pas réussi à reproduire le style de dessin de manière constante. Et ne parlons même pas d’utiliser le même personnage et de personnaliser une scène ! Midjourney semble être dépassé lorsqu’on entre trop de saisies de texte.
En revanche, je ne peux rien reprocher à ChatGPT. Ces modèles ne remporteront certes jamais un prix Will Eisner, mais ils me suffisent pour produire un court scénario.
On parlera encore longtemps de l’intelligence artificielle utilisée dans les projets artistiques et de la problématique du plagiat. Étant moi-même créateur de contenu, je trouve quand même cette technologie super intéressante... et inquiétante.
En tant que fou de jeu et de gadgets, je suis dans mon élément chez digitec et Galaxus. Quand je ne suis pas comme Tim Taylor à bidouiller mon PC ou en train de parler de jeux dans mon Podcast http://www.onemorelevel.ch, j’aime bien me poser sur mon biclou et trouver quelques bons trails. Je comble mes besoins culturels avec une petite mousse et des conversations profondes lors des matchs souvent très frustrants du FC Winterthour.