
Google poursuit sa quête d’innovation en intelligence artificielle (IA) avec le lancement de Gemini 2.5 Pro Experimental, présenté comme son modèle le plus avancé à ce jour. Selon l’entreprise, ce tas d’algorithmes se distingue par ses capacités de raisonnement et de codage, surpassant ses concurrents, notamment en science et en mathématiques.
Ce lancement marque une étape importante dans l’évolution des modèles dits «pensants» (thinking models), capables d’analyser leurs propres «réflexions» avant de répondre. Cette approche, qui repose sur des techniques comme l’apprentissage par renforcement et le «chain-of-thought prompting», vise à accroître la précision et la pertinence des réponses générées.
Une avancée majeure en raisonnement
Gemini 2.5 Pro se hisse en tête du classement LMArena et excelle dans des domaines exigeant une logique poussée. Il atteint un score inédit de 18,8% sur «Humanity’s Last Exam», un test conçu pour mesurer les limites du savoir et du raisonnement humain.
En matière de programmation, Gemini 2.5 Pro relève aussi le défi: il excelle dans la création d’applications interactives et dans la transformation de code. Sur le benchmark SWE-Bench Verified, il obtient un score impressionnant de 63,8% grâce à un agent personnalisé, consolidant sa réputation dans le domaine du développement informatique.
Polyvalence et multimodalité
Un exemple marquant est sa capacité à générer le code complet d’un jeu vidéo à partir d’une simple ligne de commande. Cette aptitude illustre non seulement son efficacité, mais aussi son potentiel pour révolutionner le développement logiciel.
Gemini 2.5 Pro se distingue également par sa capacité à traiter divers types de données, qu’il s’agisse de texte, d’images, d’audio ou même de code complet. Selon ce texte, ce nouveau modèle est notamment disponible pour les abonnés « Advanced », dont le soussigné.
XS
En savoir plus sur Le blog high-tech & telecom de Xavier Studer
Subscribe to get the latest posts sent to your email.
Merci, mais on ne s’y retrouve plus dans toutes ces modèles et toutes ses variantes. Faut presque faire une étude de marché avant de lancer un prompt! Pénible