
Google vient de franchir une nouvelle étape dans la création musicale assistée par intelligence artificielle (IA). Son modèle Lyria 3, développé par Google DeepMind, est désormais disponible en version d’essai dans l’application Gemini, permettant à n’importe qui de composer un morceau en quelques secondes à partir d’une simple description textuelle.
Sur internet ou dans l’application, il s’agit de décrire une ambiance, un souvenir ou même une blague personnelle pour obtenir un morceau de musique complet, paroles incluses. Nul besoin d’être musicien — le modèle génère automatiquement les paroles à partir de votre texte, là où les versions précédentes exigeaient que vous les fournissiez vous-même.
Ce que Lyria 3 sait faire
Lyria 3 représente une évolution significative par rapport aux modèles précédents sur trois points clés. D’abord, la génération automatique des paroles; ensuite, un meilleur contrôle créatif sur le style, les voix et le rythme; enfin, des morceaux plus réalistes et musicalement plus complexes. L’application produit des extraits de trente secondes, avec une pochette générée automatiquement, faciles à partager directement depuis l’interface.
Il est également possible de charger une photo ou une vidéo pour inspirer la composition: Gemini analyse le contenu visuel et compose un morceau en accord avec l’ambiance de l’image. Un randonneur peut ainsi transformer les photos de sa sortie en montagne en un morceau original, paroles comprises, selon cette note de Google.
Droits d’auteur et traçabilité
La question des droits reste évidemment centrale dans ce domaine. Google indique avoir développé Lyria 3 en collaboration avec la communauté musicale et affirme s’être montré attentif aux questions de droits d’auteur lors de l’entraînement du modèle. Si vous mentionnez le nom d’un artiste existant dans votre demande, Google fera l’impossible pour respecter les droits d’auteurs. Il vérifiera que les créations ne reproduisent pas de contenus protégés.
Pour garantir la traçabilité, chaque morceau généré est marqué de manière invisible grâce à la technologie SynthID, le filigrane numérique de Google permettant d’identifier les contenus produits par une intelligence artificielle. Il est même possible de soumettre un fichier audio à Gemini pour vérifier s’il a été produit par cette technologie, une fonctionnalité qui s’étend désormais à l’audio après avoir d’abord couvert les images et vidéos.
Une limite de 30 secondes
Lyria 3 est accessible gratuitement pour tous les utilisateurs de 18 ans et plus, en français notamment, d’abord sur la version de bureau de Gemini, avec un déploiement progressif dans l’application mobile. Les abonnés aux formules payantes Google AI Plus, Pro et Ultra bénéficient de limites plus élevées. Bémol de taille: ces titres ne font que 30 secondes.
Mon commentaire? Encore une fonctionnalité amusante, voire disruptive possible grâce à l’IA. Reste tout de même à trouver une utilité à ces titres de 30 secondes. Peut-être pour les créateurs qui peuvent également explorer Lyria 3 sur le Dream Track de YouTube. A suivre de près lorsque cette limite de 30 secondes sautera…
Xavier Studer
En savoir plus sur Le blog high-tech & telecom de Xavier Studer
Subscribe to get the latest posts sent to your email.