I. Mes premiers pas avec l'IA : test de Microsoft/Dall E
Voici, ci-contre, un extrait du visuel réalisé en 2019 pour une série de tee-shirts (qui se voulait humoristique !) sur le thème "Vélos-dingos" réalisée pour Mathieu de "Cigale Aventure" (location de VTT, etc.) dont j'ai refait aussi l'enseigne en 2020. Ce visuel avait pour titre le jeu de mots "Mountain-bique" (vs "mountain-bike", évidemment !) : nous sommes en Cévennes, donc dans le pays du Pélardon et des élevages de chèvres. Mais, comme je l'ai expliqué sur la page d'accueil, je trouve le dessin du corps de la chèvre très maladroit, en dehors de la tête : euphorique ici, mais plus 'zen' dans une autre version faite en hommage au pélardon, cf. les images finales dans la rubrique "Sérigraphie" ("bééatitude").
L'automne dernier, j'avais fait une première tentative d'utilisation de l'IA pour la création graphique. Mes recherches m'avaient orienté vers le module Dall-E d'Open
AI : en ce domaine, il n'est pas classé comme le meilleur, mais il est plus simple d'accès et il me semblait très bien pour commencer.
Une fois mon compte créé dans Open AI, je me suis aperçu que je ne pouvais quasiment rien faire : victime de son succès, la version gratuite avait disparu et j'ai dû me contenter d'un essai dont
l'image créée avait la taille d'une vignette, pas plus grande sur l'écran qu'un timbre-poste !
J'ai donc laissé tomber, ne voulant pas m'engager avec un abonnement payant, sans savoir précisément si Dall-E serait ensuite mon appli préférée.
Depuis quelques semaines, je dois passer plus de temps à la maison : il me faut donc bien m'occuper davantage grâce à la lecture et à l'informatique. J'avais appris que Microsoft avait investi
dans Open AI et passé des accords pour une collaboration : Microsoft proposait son moteur de recherche "Bing", et pouvait créer gratuitement une image avec sa propre IA en utilisant, avant
l'affichage du résultat, Dall-E pour l'optimisation de celui-ci : c'était tout à fait ce qu'il me fallait pour mes premiers tests !
Dans le prompt, sous "Posez-moi une question" en gris, il y a aussi une petite icône carrée, en pointillés, avec un petit cercle au centre : en cliquant, cela permet de charger une image
personnelle pour guider l'IA, appliquer un autre style à l'image par exemple. Par contre, dans une deuxième série d'essais, j'ai demandé de corriger les défauts (perspectives surtout) de
ma propre image : l'IA ne fait aucun travail de graphiste sur ma propre image et se contente d'en chercher et d'en composer de nouvelles comme celles que j'avais déjà obtenues.
Bilan de ma première séance, jusqu'à ce que l'appli me dise en gros : "ça suffit, à présent, on arrête !" *
Je me suis contenté de formuler mes requêtes en français, car mon niveau en anglais est très médiocre. Je pense qu'une partie importante de mes déceptions vient de là : le taux de réussite (c'est assez reconnu) est meilleur en utilisant l'anglais. "On" s'est donc parfois mal compris, ce qui a donné lieu à des propositions ridicules, m'obligeant à chaque fois à reformuler ma demande d'une autre façon : sur la planche d'images ci-dessous, donnant une idée de mes requêtes et des principaux résultats, je n'ai fait figurer qu'une des images franchement ratées.
* En fait, il me faut comprendre que j'ai épuisé, après mes nombreux essais, mon quota de création gratuit : il me faut attendre le mois prochain pour réussir à utiliser de nouveau gratuitement cette appli.
Pour tester :
Ci-dessous, je propose une version agrandie (si vous cliquez sur les images) de ma version préférée de cette série, la n° 5. Bien sûr, elle aussi n'est pas exempte de lacunes, de nombreux détails erronés, mais que je suis capable de corriger :
À droite, "ma première version retouchée" : zones sombres légèrement éclaircies ; couleurs de l'herbe, du pelage, etc., modifiées ; œil gauche refait ; marque du casque supprimée ; pelage accentué ; cimes des sapins de droites plus verticales ; clôture et barbelés, à gauche, plus visibles ; quelques rayons des roues modifiés, ajoutés... mais pas façon systématique, principalement pour la roue arrière qui serait difficile à refaire correctement, etc. N.B. Quelques jours plus tard, au moment de finaliser cette image pour son impression, j'ai craqué : ne pouvant plus supporter ce défaut, j'ai refait tous les rayons de la roue arrière. Cf. la fin de cette page.
Deuxième séance, le lendemain, avec de nouveaux paramètres
Liste de mes requêtes
n° 1. goat pedaling on a mountain bike goes down a small, gently sloping, stony path. Scene style : pop art, with frames like those of Roy Lichtenstein
n° 2. goat pedaling on a mountain bike goes down a small, gently sloping, stony path. Scene style : large screen printed frames
n° 3. goat pedaling on a mountain bike goes down a small, gently sloping, stony path. Scene style : large printed screens
n° 4. [requête en français à partir de ma propre image] cette image, dans le même style, en corrigeant les erreurs de perspective
n° 5. [requête à partir de l'image n° 5 de la séance 1] exactly this picture, with pop art style. Puis j'ai reformulé en français cette requête
pour demander de conserver la position, la pente et le décor : résultats dans 6, 7, 8.
Bilan
... Bon, on en a assez 'bouffé' de la chèvre à vélo, alors on arrête là pour les recherches : je vais m'en tenir à la n° 5 de ma première séance !
Mise à jour du 08/04/2024
Dernière étape : préparer l'image choisie pour une impression
J'utilise l'image n° 5, mais trop petite et avec une résolution faible de 72 dpi (adaptée à internet) : il me faut l'optimiser en vue d'une impression en 300 dpi d'un visuel A4 à transférer sur un tee-shirt noir (cette couleur est souvent ma préférée, car elle met en valeur les couleurs claires). Pour cela, je dois en modifier la taille et la résolution autrement qu'en doublant le nombre de dpi dans Photoshop : le résultat serait de très mauvaise qualité et l'effet d'escalier des pixels agrandis – donc flous – trop visible. Je peux recourir à un logiciel "d'upscaling" : il en existe depuis assez longtemps (les premiers utilisaient des algorithmes basés sur le principe des fractales), mais depuis quelque temps l'I.A. fait encore mieux le travail (en utilisant peut-être les mêmes principes). Sur internet, j'ai trouvé beaucoup de sites proposant cette opération en ligne, gratuitement (dans ce cas, il faut seulement s'inscrire) ou non. J'ai choisi la gratuité et je suis satisfait du résultat, car l'image, qui devait presque doubler de taille, est en même temps devenue plus nette que l'originale : les micros défauts ont été lissés, donc les aplats sont plus réguliers et les poils moins pixelisés, ce qui me permet une impression bien adaptée à un transfert sur tissu. CF. la copie-écran ci-dessous.
Mise à jour du 08/04/2024
Restait la composition, le "scénario" du visuel d'un futur tee-shirt :
Des choix très personnels de mise en page et de textes à faire. J'ai gardé, évidemment, le jeu de mots initial, "Mountain bique".
* L'utilisation de l'aleph a été une très bonne idée du concepteur du logo : il évoque ici la tête et les cornes de la chèvre, et il ne s'agit donc pas d'une véritable invention graphique. Cet idéogramme désignait un bœuf (et donc la richesse, etc.). L'alphabet phénicien ne comportait que des consonnes. Beaucoup plus tard, le génie des grecs a été de reprendre une grande partie de ces signes et de transformer certains de ceux-ci en voyelles : les idéogrammes servent alors de moins en moins à désigner symboliquement des réalités, et deviennent définitivement des représentations graphiques de sons pour 'fabriquer' les mots de la langue ! Peu à peu, la loi immuable de la simplification du dessin des lettres (pour une écriture plus rapide, etc.) va faire pivoter ce signe, coucher le V des cornes sur la ligne, puis permettre plus tard encore de tracer cette lettre d'un seul geste : alors sera fixé le tracé de l'alpha minuscule grec, si connu et si utilisé !
Je mets donc les illustrations des deux choix ci-dessous, à agrandir par un clic. Venu, peu après, acheter sur le marché (avec mon tee-shirt) quelques délicieux pélardons sur le stand de ma 'dealeuse' préférée (Hélène, présidente de l'AOC et productrice – comme je le pense –
des meilleurs pélardons du pays viganais), elle m'a souri et m'a fait remarquer avec malice que ma biquette était un peu trop grassouillette par rapport aux siennes pour être une bonne chèvre
cévenole ! Désolé, l'IA ne savait pas cela...
Mise à jour du 08/04/2024
II. Je teste "Firefly" d'Adobe
https://firefly.adobe.com/?ff_channel=adobe_com&ff_campaign=feature_page&ff_source=firefly_seo
Après Microsoft/Dalle E, j'ai décidé d'explorer d'autres applis : je ne me permettrai pas, ici, d'oser faire un comparatif objectif et détaillé des résultats que j'ai obtenus, car mes requêtes et mes possibilités de paramétrages n'ont jamais été exactement les mêmes. D'ailleurs, pour cette session, je n'ai rédigé qu'en français ! Et puis, pour toutes ces applis, je ne suis qu'un "newbie", un débutant qui ne maîtrise que le minimum nécessaire pour produire une image. je possède un compte Adobe, j'ai donc pu accéder immédiatement à Firefly (directement utilisable également à partir de Photoshop et d'Illustrator, quand on est abonné). Mon impression générale :
- Cette appli peut aussi créer des dessins de types vectoriels (et j'ai cru comprendre que les pro peuvent imiter les dégradés vectoriels, générer des dessins modifiables dans Illustrator. La richesse des différents styles artistiques est immense et cela donne envie, à partir du même projet, de le décliner. Une autre chose que j'ai appréciée avec Firefly vs Dall E : le dessin téléchargable a déjà une bonne définition (format faisant le double, je crois, des images de Microsoft/Dall E en version gratuite). Firefly peut aussi générer de manière très riche des caractères originaux, pour du titrage, etc.
- Avec Firefly, j'ai aussi testé l'utilisation d'une image téléchargée. Mon appréciation, sur ce point, ne peut être comparée avec le travail de Microsoft/Dall E : j'avais essayé avec ce site d'améliorer ma première image mais j'avais retrouvé tout autre chose : je pense simplement que je n'ai pas su m'en servir par manque de pratique. Avec Firefly j'ai réussi quelque chose (cf. la dernière série ci-dessous, reprenant le visuel de mon tee-shirt : dès le premier essai, je constate que Firefly a respecté la posture et la structure générales du modèle et jai compris alors mon échec avec Dall E : je lui avais demandé de corriger le défaut de la position du corps de la chèvre de mon propre dessin : ce genre d'appli ne peut que modifier le style de l'image de référence pas les petits défauts du dessin lui-même. Dans le premier essai, je suis surpris de voir que les textes ne correspondent à rien, alors qu'ils sont très précis sur le modèle : je reviens vers les paramètres et je découvre plusieurs curseurs dédiés à cette démarche : il m'a suffit de pousser plus loin le curseur du pourcentage de respect de l'image pour obtenir, à la fin, des résultats où le texte est de plus en plus respecté. Évidemment, il reste des défauts : patte gauche incomplète ou absente, patte droite qui semble vissée sur le corps de la chèvre... Pourtant, ces résultats m'intéressent grandement : ils m'aideront à dessiner au trait, etc., en me guidant sur l'essentiel, tout en l'enrichissant, pour transformer l'image de mon tee-shirt de type photo, que je trouvais chouette, en visuel de type vectoriel plus proche de ce que j'aime pour mes activités de sérigraphie ou de transfert : pour le plus délicat, la chèvre. Mais aussi pour le décor, à propos duquel, dans le dernier essai, j'avais demandé quelque chose de presque transparent, minimaliste.
- Et si je faisais l'inverse ? Donc, partir de ma propre image comme "Référence structurelle" et lui appliquer d'autres styles que le sien (donc pas de dessin au trait, etc.).
Après le téléchargement de ma propre "Mountain Bique", je propose de cumuler les styles "Peinture" et "Hyperréalisme" en les cochant dans la colonne de gauche : le résultat n'est pas nul et aurait été meilleur si j'avais supprimé le logo et le dossard "30"... bref, tout ce qui graphiquement ne signifiait rien pour l'IA, surtout quand on voit comment "Pélardon" a été interprété : une offense aux chèvres cévenols !
- Malheureusement pour moi, mon aventure avec Firefly s'est très vite arrêtée là : crédits épuisés pour le mois d'avril ! Il faut dire qu'avec quatre propositions par requête, le compteur tourne vite !
III. Je teste "OpenArt.ai"
Il faut passer par une inscription à "Discord"... appli que je trouve inutilement envahissante. Il y a beaucoup de modèles qui servent, un peu comme avec Firefly, à s'inspirer d'un modèle.
Celui que j'avais choisi en premier a permis la création d'un décor intéressant (mais trop important à mon goût). Par contre, comme l'appli affiche par défaut le texte du prompt du modèle choisi, lorsque j'ai saisi ma requête en anglais, je n'ai pas pensé à effacer le début de celle-ci qui proposait un "headshot portrait" : la chèvre de mon image tourne donc la tête pour qu'on lui voie la tête de face : quelle idée aussi d'avoir placé l'animal à trois queues et sur un vélo à une seule roue (!) dans une côte qu'elle remonte au lieu de descendre, comme dans ma requête ! Deuxième essai, avec un style "Manga" : toujours le problème des pattes et chemin ascendant.
Sinon, le "style" des dessins proposés respecte ce que j'attendais.
Un dernier essai de OpenArt. ai : que vient faire cette espèce de semi-tablier/pantalon qui masque les pattes ? Et la troisième corne qui, comme un boomerang noir, survole les deux autres ?
Cette fois, j'avais précisé dans le prompt de placer les sabots correctement sur les pédales. Quant au mountain bike, il ressemble plutôt à un tandem (d'ailleurs, il a deux pédaliers) !
Les images ont de taille très correcte (1024x1024)... mais il n'y a qu'une seule proposition possible par requête, même après avoir tiré le curseur pour en demander trois pour chaque requête : je suppose que cela ne concerne que la version gratuite.
Bref, pour plein de choses, l'appli est peut-être très satisfaisante, mais pour ma part, je vais me désinscrire de Discord et de OpenArt ai.
Il faut dire, en conclusion, que, pour mon test des applis d'IA, j'ai apparemment choisi un type de visuel qui (cela est très connu), met rudement à l'épreuve l'intelligence artificielle : pour les humains, les visages, les mains, etc. ici, pour un animal, c'est évidemment la difficulté de positionner pattes et sabots dans une bonne posture qui fait problème.
IV. J'ai voulu aussi tester "Midjourney"
La qualité de l'appli est unanimement saluée : j'ai essayé la version gratuite, sans inscription obligatoire et en version française, mais Chaque requête a été l'objet d'un message d'erreur ("Il y a eu un problème") : les serveurs étaient-ils saturés ? J'ai fait deux tentatives, deux jours de suite, à des moments différents, dont une tôt le matin. Est-ce pour décourager et pousser les gens à s'abonner sur la version pro ?
https://midjourney.talkai.info/fr/chat/
Mise à jour du 19/04/2024