La plateforme X, anciennement Twitter, a lancé la semaine passée Grok 2, son intelligence artificielle (IA) générative, capable de produire des images de manière totalement libre, sans censure. Le pape en Balenciaga, presque une sympathique plaisanterie!
Première chose à savoir, il faut disposer d’un compte payant premium sur X pour générer les images de ses rêves et se rendre dans la section Grok. Il suffit ensuite de formuler un prompt (c’est-à-dire une consigne) pour générer avec plus ou moins de bonheur l’illustration de ses rêves.
Gare aux faux trop réalistes
On est rapidement tenté d’imiter les photos qui ont défrayé la chronique, notamment celles montrant des personnalités connues dans la presse. Même si certains médias ont publié de tels clichés, fort réussis, je ne le ferai pas, estimant que le risque de confusion avec une vraie image était trop important.
Ci-dessous, je préfère reproduire des illustrations plus ou moins réussies d’animaux dans des conditions amusantes où le risque de confusion avec la réalité est inexistant. Cette note est d’ailleurs l’occasion de s’interroger sur les limites de l’utilisation de tels clichés.
Des indications claires
Il est clair que plus le résultat est réaliste, plus il est important de préciser qu’il s’agit d’une image artificielle ou en l’indiquant clairement ou en mentionnant l’outil utilisé pour générer l’images, qui est souvent un cliché prétexte, ce qui repose la question de l’iconographie.
Trop souvent ici ou sur internet, on utilise des illustrations génériques ou prétextes pour égayer un texte alors qu’il serait souhaitable que l’iconographie soutienne le propos… Evidemment, une telle approche nécessite des moyens plus conséquents. Mais qui sait, peut-être que l’IA pourrait nous donner un joli coup de pouce…
Xavier Studer
Génial le Katz!
Derrière le générateur d’images de Grok, il y a Flux. La version Pro de Flux est payante, mais sur Replicate, le prix est de 5,5 cents par image. Il existe également Flux.1 Dev et la version Schnell, qui sont toutes deux open source et permettent de télécharger les modèles. Cependant, il faut disposer du matériel nécessaire pour les utiliser. Sur ma machine d’inférence (un Xeon avec 32 Go de RAM et deux Nvidia Quadro P5000 de 16 Go de VRAM chacune), j’ai dû prendre la version quantifiée sur 4 bits de Dev, qui met 15 minutes pour générer une image (alors que Stable Diffusion XL n’en prend que quelques secondes).
Heureusement, il est possible de tester Flux.1 Dev et Schnell gratuitement sur Hugging Face.