Language Selection

Retrouvez votre bien-être dans ces temps dure sur Terre , Essayez le MedBed Quantique!
Cliquez ici pour réserver votre séance

Famille et pour toute la Famille avec Le Medbed Quantique® Orgo-Life® une technologie du Canada

Advertising by Adpathway

Google Gemini repasse devant Claude : le nouveau Deep Think bat tous les records

4 month_ago 31

NE LAISSER PAS LE 5G DETRUIRE VOTRE ADN Protéger toute votre famille avec les appareils Quantiques Orgo-Life®

Publicité par Adpathway

Deux mois après avoir lancé une première version de Gemini 3 Deep Think sous la barrière Gemini Ultra (275 euros par mois), Google actualise le « raisonnement » de son modèle dédié aux scientifiques et aux mathématiciens. Le résultat est sans appel : Google a de nouveau le modèle le plus avancé du marché, même s’il ne se destine pas encore à tout le monde.

En attendant Gemini 3.1 Pro ou Gemini 3.5 Pro, que les rumeurs annoncent pour le premier semestre 2026, Google met à jour Gemini Deep Think, son super-modèle à destination des scientifiques. Le principe est toujours le même : Deep Think étudie plusieurs chaînes de raisonnement simultanément pour résoudre des problèmes complexes. Mais cette nouvelle version, dévoilée le 12 février, réalise l’impensable pour une IA dans plusieurs épreuves mathématiques sérieuses.

Sundar Pichai a publié des benchmarks sur les prouesses du nouveau Gemini Deep Think.

Google prend beaucoup d’avance sur Anthropic et sur lui-même

À la fin de l’année 2025, Google avait frappé fort avec le duo Gemini 3 Pro et Deep Think. Ces deux modèles lui avaient permis de prendre de l’avance sur tous ses concurrents : Google semblait désormais leader de la révolution IA.

Le 5 février 2026, Anthropic a lancé Claude Opus 4.6, le premier modèle devant Gemini 3 Pro dans de nombreux benchmarks. Les deux LLM jouent dans la même cour, mais Anthropic est meilleur sur de nombreux aspects.

Tableaux comparatifs entre Gemini 3 Deep Think, Gemini 3 Pro, Claude Opus 4.6 et GPT-5.2, publié par Google.

Avec la mise à jour de Gemini Deep Think du 12 février, Google reprend largement l’ascendant.

Sur le benchmark ARC-AGI-2, un des plus complexes du milieu, le modèle est passé d’un score de 45 % à près de 85 % en trois mois. Avec un score aussi élévé, Google approche des limites du test : son modèle a désormais les capacités des meilleurs humains de la planète réunis. Même chose sur le très exigeant Humanity’s Last Exam : le nouveau Deep Think atteint les 48,4 % sans outils, contre 41 % pour l’ancienne version. Google prend de l’avance sur Claude Opus 4.1, qui est le premier modèle général avec un score de 40 %.

BenchmarkGemini 3 Deep Think (Déc. 2025)Claude Opus 4.6 (Fév. 2026)Gemini 3 Deep Think (Fév. 2026)

ARC-AGI-2 (Raisonnement visuel)	45,1 %	68,8 %	84,6 %
Humanity’s Last Exam (Connaissances académiques)	41,0 %	40,0 %	48,4 %
Olympiades mathématiques 2025	60,7 % (préversion)	–	81,5 %
Codeforces (Programmation compétitive)	–	2352 Elo	3455 Elo
MMMU-Pro (Multimodal)	–	73,9 %	81,5 %

Autre impressionnant : le score Elo sur Codeforces. Avec 3455 points, Deep Think se classe dans le top 0,01 % des programmeurs mondiaux. L’écart avec Claude Opus 4.6 (2352 points) est immense. Google est aussi très fort aux Olympiades internationales de Mathématiques, avec un score record de 81,5 % équivalent à une médaille d’or.

Un modèle toujours réservé à des utilisateurs bien spécifiques

Contrairement à Claude Opus 4.6, qui se destine à tous les utilisateurs, y compris celles et ceux qui n’ont pas besoin de toutes ses capacités, Gemini 3 Deep Think est un modèle spécialisé.

Google le positionne comme un assistant de recherche fondamentale. Ses prouesses le destinent aux laboratoires, aux ingénieurs en aéronautique ou aux mathématiciens. Deep Think n’a aucun intérêt pour structurer de longues notes. Il faut toujours l’abonnement Google AI Ultra à 275 euros par mois pour lui parler, le tout avec une latence plus élevée, puisque son raisonnement prend du temps.

Au-delà des benchmarks, la prouesse la plus significative de cette mise à jour est peut-être invisible pour l’utilisateur, mais cruciale pour l’industrie : son coût. Selon les premières analyses techniques, Google a réussi l’exploit de doubler la précision de son modèle tout en divisant ses prix par cinq.

Une requête avec Gemini 3 Deep Think coûte à peine plus chère qu'avec GPT-5.2-Pro, mais le résultat est deux fois meilleur.

Pour résoudre une tâche complexe du benchmark ARC-AGI, l’ancienne version de Deep Think coûtait environ 77 dollars en puissance de calcul. La nouvelle version ? Seulement 13,62 dollars. C’est cette chute drastique des coûts qui permettra, à terme, à cette intelligence d’intégrer les modèles du quotidien.

La newsletter pour ne rien manquer de l’actu IA, écrite par une IA

Vous souhaitez recevoir la newsletter Artificielles dans votre boîte mail ?

Toute l'actu tech en un clien d'oeil