Midjourney, c'est quoi? Comment bien l'utiliser?
Pour ceux qui suivent mes articles, vous aurez pu constater que mes articles ont une chose en commun: les images de couverture. Ce qu'elles ont de commun? Elles sont générées par l’intelligence artificielle Midjourney.
Lorsque j’ai commencé, je pensais me baser sur des librairies libres de droits mais c’est au même moment que les IA ont commencé à faire parler d'elles.
Après avoir joué un peu avec et vérifié les droits des images générées, j’ai choisi de partir la dessus.
Je vous présente donc l’outil, les prix, les droits et quelques conseils.
Ethique
Alors on peut, et l’on doit, se poser la question de l'éthique du procédé.
Je ne parle pas des réalisations en elle-même… Encore que pour avoir vu certaines réalisations, il va falloir mettre en place des garde-fous et les gérer correctement.
Je fais donc allusion au fait que désormais monsieur tout le monde peut s’improviser illustrateur. Et en plus, bien plus rapide…
Certains diront que c’est un danger pour les illustrateurs, d’autre que c’est une source d’inspiration infinie, des illustrateurs y voient même une aide précieuse pour les tâches ingrates.
Je ne détiens malheureusement pas la vérité et je n’ai pas de boule de cristal permettant de voir ce qu’il adviendra des illustrateurs de demain. Pour connaître quelques personnes du métier, ils ne voient pas un danger imminent mais ils tiennent les IA à l'œil.
Discord
Fonctionnement un peu spécial, plutôt que d’utiliser une interface web classique, tout se passe sur discord. J’avoue ne pas trop comprendre pourquoi cette méthode… Peut-être que la volonté derrière ce choix est de jouer sur le côté vitrine publique des images générées.
Tout ce passe donc ici: https://discord.gg/midjourney
En rejoignant le Discord, vous verrez très rapidement les nombreux channel (à thème ou non) affichant les générations d’autres utilisateurs.
Je vous rassure tout de suite, vous pouvez faire en sorte que vos générations ne soient pas publiques, nous y reviendrons plus tard.
License
Pour peut que vous ayez un abonnement, vous avez les droits d’utilisation des images.
If you have subscribed at any point, you are free to use your images in just about any way you want.
Si vous vous êtes abonné à un moment donné, vous êtes libre d'utiliser vos images comme bon vous semble.
Une autre question m’est venue à l’esprit: Et si je stoppe mon abonnement, que se passe-t-il?
Et bien vous gardez le droit sur vos images !
Your ownership of the Assets you created persists even if in subsequent months You downgrade or cancel Your membership.
Vous restez propriétaire des actifs que vous avez créés, même si, au cours des mois suivants, vous rétrogradez ou annulez votre adhésion.
Bien entendu, il y a une règle qui est logique mais que je pense bien rappeler: si vous générez une image d’un élément sous copyright, vous n’avez pas pour autant les droits de le faire.
J’ai pu voir passer des images d’un Dark Vador mis en scène dans toutes sortes de situations… Ça fait sourire, mais je doute que Disney apprécie…
Si vous voulez consultez les conditions dans leurs entièreté: https://docs.midjourney.com/docs/terms-of-service
Prix
Jusqu’il y a peu, il était possible d’utiliser une version d’essai mais cette offre à désormais disparu car victime de son succès le service était saturé.
A savoir, Midjourney ne compte pas en image générée mais en heure de rendu. Difficile donc de savoir réellement combien d'images vous pourrez demander car celà dépend de plusieurs paramètres comme la résolution ou la vitesse de génération.
Pour débuter, l’offre “basic plan” contenant 3.3 heures de rendu est a 10$/mois et perso, je trouve ça très honnête.
D’après mes statistiques, j’estime entre 200 et 250 images générées en 3.3 heure.
Bon je vous le dis tout de suite, vous n’aurez pas 250 images pour la simple raison que vous allez faire plusieurs essais avant d’avoir une image qui vous convient!
Par exemple, voici les différentes images générées pour arriver à l’image de couverture de cet article. J’ai tenté différent prompt basé sur les mots suivants: luminous digital surrounded by computer, Midjourney ai, luminous halo, aura colored, World création, god. J’ai également tenté deux déclinaisons en utilisant soit la v5 soit le mode niji (style anime) dont je vous reparlerai plus tard.
Vous noterez la différence d'interpretation entre la v5 (gauche) et le mode niji (droite). Chaque ligne correspond à la même demande.
Si vous désirez en savoir plus sur leurs offres: https://docs.midjourney.com/docs/plans
Comment formuler sa demande
Je vous le disais, la génération c’est pas mal d’essais/erreurs et nos essais sont comptés!
Autant être le plus efficace possible.
Midjourney se base donc sur Discord où vous pouvez envoyer des commandes sur les différents canaux de son serveur.
Le problème c’est que vous n’êtes pas seul sur ces canaux, ce qui est intéressant pour voir comment les autres utilisateurs génèrent leurs images mais il est difficile de retrouver les siennes.
Je vous propose donc une méthode plus simple: communiquer en message privé directement avec le bot.
Pour ce faire, un clic droit sur le bot
/Describe
Contrairement à ce que vous attendez on ne va pas commencer par générer une image mais bien par faire l’inverse !
On va donner une image à Midjourney et ce dernier va nous ressortir le prompt (description) correspondant.
Pourquoi faire ça en premier ? Et bien simplement pour voir comment se présente un prompt !
Il vous suffit de taper /describe et de lui fournir une image.
J’ai fait un petit test avec une photo que j’avais en stock.
Il nous proposera alors 4 prompts.
Voici ces propositions et la génération qui correspond.
an apple tree branch in a spring time field with some green pastures, in the style of light bronze and pink, unusual cropping, raw vulnerability, english countryside scenes, forced perspective, rusticcore, light brown and sky-blue --ar 125:94
a tree with blooming fruit in the field, in the style of harsh angles, english countryside scenes --ar 125:94
a tree branch on a green field with flowers, in the style of unusual cropping, applecore, site-specific works, english countryside, light brown and pink, documentary travel photography, strong lines --ar 125:94
a bush with pink flowers growing alongside in a field, in the style of applecore, forced perspective, twisted branches, british post-war, raw vulnerability --ar 125:94
On peut donc découvrir son analyse et un paramètre (--ar) dont nous reparlerons après.
Pour ce qui est du prompt, on peut donc voir la liste des mots clés séparés par des virgules. On retient ça pour plus tard.
Mais je tiens a préciser que la première analyse est parfaite: “an apple tree branch in a spring time field with some green pastures” on est en plein dedans
Je vous invite à tester quelques images pour voir un peu sa façon d'interpréter.
/imagine
Il est maintenant temps de générer une image.
Pour ce faire, on utilise la commande /imagine suivie de notre prompt.
/imagine a developper working on code, glasses, headset, a desk in a computer room with three monitors, brick wall
Le processus se lance et vous allez récupérer une image composée de 4 vignettes.
Vous noterez la présence d’icone sous l’image permettant des actions rapides
Les U permettent un upscale (agrandissement) de la vignette correspondante.
- U1: Haut gauche
- U2 Haut droite
- U3: Bas gauche
- U4: Bas Droite
Les V permettent de créer des variations de la vignette ciblée.
Paramètre
Vous pouvez vous contenter de la génération de base, mais elle peut vite devenir bloquante ne serait-ce que pour le ratio de l’image. Je vais donc vous présenter quelques uns des paramètres qui sont les plus utiles.
--ar (aspect ratio)
Certainement le paramètre le plus utile, il vous permet de définir le format de l’image de sortie. Si vous regardez plus haut, vous verrez que lors du /describe, il avait spécifié un –ar 125:94 qui correspondait au ratio de l’image d’origine.
Les valeurs à fournir sont donc largeur:hauteur.
Par exemple, les covers de mes articles sont toutes générées en –ar 2:1
--v (version) | --niji (anime/dessin)
A l’heure où j’écris ces lignes (21/04/2023), le moteur par défaut de Midjourney est le v4 mais ce n’est pas le seul disponible.
Si vous avez une offre payante, vous pouvez déjà utiliser le v5. Qui, comme vous vous en doutez, est l'évolution du 4 et est bien plus performant.
Ci-dessous, le meme prompt en --v 5:
Vous pouvez également remplacer le paramètre de version par --niji, ce qui aura pour effet de vous générer une image dans un style anime/manga assez bluffant lui aussi.
Ici aussi, la version 5 est disponible.
La nouvelle version permet de spécifier un style(expressive/cute).
Les différentes images ci-dessus ont toutes étés générées sur base du même prompt, seul le paramètre de version à changé.
--chaos
Alors celui-là, il faut le tester pour le comprendre. Mais je vais essayer de vous l’expliquer simplement: la valeur donnée à ce paramètre (de 0 à 100, 0 par défaut) va jouer sur la génération des 4 images des vignettes. Plus la valeur est élevée, plus les 4 vignettes seront différentes.
--tile
Si vous cherchez un nouveau papier peint, voici l’option qu’il vous faut !
Ce paramètre permet de générer des tuiles qui peuvent parfaitement s'enchaîner pour servir d’image de fond.
Attention, ce paramètre ne fonctionne qu’en version 5.
/imagine apple blossoms --v 5 --tile
--seed
Vous pouvez lancer 10 fois le même prompt, vous n’obtiendrez jamais le même résultat. Si vous voulez tester la même génération avec des paramètres différents, il suffit de fixer la seed utilisée.
/imagine robot bird on branch --niji --seed 12345
Nous voyons biens que les images sont basées sur les mêmes sources mais générées différement.
--no
Si vous ne voulez pas d’un certain élément dans vos générations, il suffit de le dire.
--r (repeat)
On sait que nous allons générer plusieurs fois le même prompt pour sélectionner le meilleur.
Le paramètre repeat vous permet de demander directement à Midjourney de le faire.
Le mot de la fin
Il y a encore pas mal de choses à dire, mais je pense qu’on en parlera dans d’autres articles car celui-ci commence à faire long et l’on va s’éparpiller.
Je pense néanmoins avoir couvert le principal de l’utilisation de Midjourney et vous avoir fourni les outils nécessaires pour vos premières générations.
Personnellement, je suis vraiment impressionné par ces petits scripts de génération d’image. Le résultat est bluffant voir effrayant… Mais je pense que l’on aurait tort de s’en priver!