Vers des intelligences artificielles toujours plus multimédias…

  • Dernière modification de la publication :30/05/2023
  • Commentaires de la publication :3 commentaires
Les IA deviennent multimédia.
Les IA deviennent multimédia.

Jour après jour les différentes intelligences artificielles (IA) font des progrès qui changent progressivement la donne. Alors que ChatGPT peut examiner des liens sur internet, Bard de Google propose désormais des images dans son flux. Et ce n’est pas fini!

En effet, à l’aune des moteurs de recherche, ces IA vont se révéler toujours plus multimédias et accomplir des tâches toujours plus pratiques. Par exemple, Bard de Google est déjà capable de réaliser certains croquis après en avoir donné les indications par écrit, comme je l’ai expérimenté.

Glisser ses fichiers….

De son côté, en permettant d’accéder à internet, le payant ChatGPT+ ouvre un véritable infini de possibles. Il peut par exemple ausculter et analyser des pages internet, voire des fichiers en ligne pour en extraire de très utiles informations. La prochaine étape risque bien de pouvoir glisser directement des fichiers dans ces outils au risque d’en perdre le contrôle…

Et puis le rendu final, de même que l’input, von probablement glisser de plus en plus vers le multimédia. Si des IA spécialisées permettent de générer des images ou des vidéos, cette fonctionnalité sera peut-être intégrée par défaut dans les services de toutes natures les plus courants. On pourra ainsi extraire des données des images ou des vidéos, comme certaines IA le font déjà.

Microsoft, d’ailleurs, propose non seulement les potentialités de GPT-4 dans son fureteur Bing, mais aussi la possibilité, certes assez sommaire, de générer des images avec le même moteur de recherche. On rappellera que la possibilité d’utiliser une IA avec un  moteur de recherche avait d’ailleurs été jugée comme peu probable par certains commentateurs ici…

Les grandes manœuvres de Microsoft et Google

Désormais officiellement, les grandes manœuvres se poursuivent. Alors que Google booste déjà son moteur de recherche à l’image de ce que produit déjà le nouveau Bing, Microsoft vient de dévoiler que l’IA sera non seulement déployée dans Office (en bêta actuellement), mais aussi au sein même de son système d’exploitation Windows. Un peu comme Cortana ou Siri… L’histoire se répète!

D’ailleurs, passé l’effet d’annonce de Siri, Cortana ou Google Assistant… Qu’en reste-t-il vraiment aujourd’hui? De même, alors que ces IA qui restent très perfectibles vous auront livré des textes comportant des erreurs, des analyses erronées ou des images trompeuses qu’en restera-t-il? A suivre de près car ce marché est des plus dynamiques…

Xavier Studer

Cet article a 3 commentaires

  1. Phil

    Ce serait bien d’avoir une ia qui fait tout et ne plus devoir choisir entre midjourney, bing ou chatgpt+: le multiplication des abos, ça coûte!

    1. Cédric

      stablediffuion + openassistant et ça coûte rien du touthttps://huggingface.co/chat/ -> l’ia qui monte (le moteur a été développé par facebook, facebook à libérer le moteur (il faut un compte mais gratuit)https://huggingface.co/spaces/stabilityai/stable-diffusion -> une instance gratuite de stable-diffusion (marche sans compte et sans rien a installer en local)
      d’ailleurs sur huggingface il y a plein de truc qui tourne autour de l’ia qui sont fort intéressant, genre ce truc https://huggingface.co/spaces/lnyan/stablediffusion-infinity qui permet de faire de l’outpainting avec stable-diffusion.
      Y a aussi ce truc https://huggingface.co/spaces/Gxia/Lama-Cleaner-lama qui permet d’effacer des objets dans une photo
      ou https://huggingface.co/spaces/aryadytm/remove-photo-background qui permet de détourrer une photo.
      Bref il faut fouiller dans les spaces de huggingface y a plein de truc intéressant

  2. Sen

    Nvidia se frotte les mains.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.