
L’intelligence artificielle (IA) est utilisée depuis des lustres dans le domaine graphique. Mais avec Dall-E, désormais intégré à Bing Image Creator, ou l’indépendant Midjourney, le public peut simplement passer à la vitesse supérieure. Premiers pas amusés sur Midjourney et petit test comparatif avec Bing…
Midjourney? L’accès est possible à cette adresse. Il faut se créer un compte sur Discord et suivre cette procédure. On a l’impression de se retrouver dans le DOS de Microsoft, à des années-lumière d’une interface ergonomique qui pourrait être celle de 2023… Reste que ce genre d’interface est plutôt efficace.
Reformuler des demandes
Mais passons. En suivant le protocole, on doit ensuite passer par des sortes de serveurs pour les nouveaux venus. Ma pire expérience jusqu’ici puisqu’on m’a d’abord demandé ou de repasser le lendemain ou de sortir ma carte de crédit… Ce que j’ai finalement fait avec une version prépayée pour des questions de sécurité.
J’ai donc commencé par observer ce qui se passait sur ces différents fils… Et c’est un torrent d’image, de différents formats, qui est créé ou peaufiné en temps réel. En effet, différentes commandes permettent d’optimiser un résultat et de préciser le format de ses créations. Pour les images ci-dessous, j’ai reformulé des demandes d’autres internautes.
Influencer la création
Du côté de Midjourney, il est donc possible de créer différents formats d’image, ce qui n’est pas (encore?) le cas du côté de Bing. Il est aussi possible de donner l’URL d’une image sur internet pour «influencer» la création d’images en donnant une sorte de modèle. Attention, la création de l’image et de sa version améliorée est lente, soit au moins une trentaine de secondes.
Les possibilités de Midjourney sont clairement plus puissantes que celles de Bing. Ci-dessous quelques exemples d’illustrations récupérées de différents «prompts» adaptés de ces fils de génération d’image et les résultats correspondant sur Bing Image Creator. J’ai à chaque fois choisi un des quatre clichés générés par défaut.
Quelle quantité d’énergie?
Comme la plupart du temps, on constate souvent des résultats étranges, comme cette main dans le visage d’un sujet (pas reproduit ci-dessous). Sans parler des formes des bouteilles de Coca-Cola ou le problème de la reproduction du texte. Bref, même si tout cela est sympa, n’oublions pas l’aspect écologique…
En effet, générer une image consomme de l’énergie. Devoir recommencer plusieurs fois pour obtenir le bon résultat en consomme encore davantage. Ce n’est pas pour rien que les accès à ces outils sont limités. Bref, jusqu’où souhaitons-nous utiliser l’IA? Et pour quelle finalité? D’aucuns évoquent à ce stade le «bien commun». Vraiment?
Xavier Studer