OpenAI ne cesse d’améliorer ses outils d’intelligence artificielle (IA). Il vient d’introduire pour ses utilisateurs payants la possibilité de modifier les images générées par DALL-E3, le générateur d’images intégré. Petit test amusé d’une fonctionnalité qui ambitionne peut-être de remplacer Photoshop?
Prenons pour exemple l’image générée pour la note de dimanche. Vous avez à gauche la version brute que j’ai modifiée avec Photoshop 2024 pour rajouter un point entre le 6 et le 1 et «One UI». Pour ce petit test, j’ai demandé d’introduire le texte One UI grâce à un outil qui permet de sélectionner la zone à modifier.
Avec plus ou moins de bonheur…
Ensuite, je lui ai demandé de remplacer les icônes en haut de l’image par d’autres symbolisant des roues dentées pour «paramètres». Après cela, je lui ai demandé de remplacer le travailleur avec une massue par une femme passant un appel avec son smartphone. Il m’a simplement effacé le travailleur…
A partir de la version de base, j’ai essayé de lui demander de remplacer 61 par 6.1. Il m’a entièrement refait l’image! Encore une fois, on sait que la génération de texte n’est pas le point fort de ces IA. Mais de là à changer complètement l’image…
Nouvel échec!
Je suis donc reparti de l’image précédente avec le smartphone au centre et l’indication 61 pour lui demander de placer une femme passant un appel dans la zone précédemment sélectionnée. Nouvel échec! Il m’a de nouveau proposé une image entièrement nouvelle! Sur cette dernière, j’ai demandé de changer la couleur des fleurs en jaune. Là aussi le résultat est peu convaincant.
Bref, si l’interface est simplissime et que la possibilité d’expliquer ce qu’on veut modifier dans la zone sélectionnée est formidable, il ne faut pas oublier que Photoshop propose déjà une fonctionnalité similaire et que le logiciel d’Adobe permet de modifier plus finement une partie d’image.
Un bilan tout en nuance
Au final, on constate encore une fois que l’IA va bouleverser notre interaction avec la machine et que les jours des interfaces complexes à manier pourraient être comptés. D’un autre côté, si l’on souhaite véritablement maîtriser son crayon ou sa plume, rien ne remplace l’intervention humaine (d’ailleurs clairement plus rapide).
Enfin, une fois de plus on constate que ces IA ne comprennent pas toujours ce que l’on dit et que leurs potentialités basées sur des prédictions ne donnent pas toujours satisfaction. Dans tous les cas, il faut avouer que l’expérience utilisateur est intéressante et est surtout très ludique.
Xavier Studer
Cool! Je me réjouis de voir comment ce produit va évoluer !
Bof. Utilisateur de Gimp, je rigole bien. L’avenir est plutôt à chercher du côté de l’open source,