artwork
Clique sur play pour lancer le live
Science Music
SCIENCE MUSIC
Qualité

Réservé aux membres

Accès gratuit

Lecteur extene
LIVE

Claude Fable 5, de belles promesses

Claude Fable 5, de belles promesses

Crédit Image : Gemini

Claude Fable 5, de belles promesses

Concevoir un médicament environ dix fois plus vite, puis formuler des hypothèses biologiques inédites dont l’une a ensuite été confirmée par une étude indépendante : voilà les résultats qu’Anthropic attribue à Claude Fable 5, premier modèle grand public de sa classe Mythos, mis en ligne le 9 juin 2026. Si ces promesses tiennent, l’IA ne se contenterait plus d’assister la recherche, elle commencerait à en produire.

Fable 5 est le premier modèle qu’Anthropic ouvre à tous dans un palier situé au-dessus de Claude Opus 4.8. L’entreprise le décrit comme l’état de l’art sur la quasi-totalité des tests de capacité. Le problème, pour qui veut juger sur pièces, est que l’écrasante majorité de ces chiffres provient du communiqué d’Anthropic et de ses clients. Les premières évaluations indépendantes, encore rares, dressent un portrait plus nuancé. Pour un média scientifique, la vraie question n’est donc pas de savoir si Fable 5 impressionne, mais de distinguer ce qui est démontré de ce qui reste annoncé.

Des promesses spectaculaires, surtout en laboratoire

C’est sur le terrain scientifique que l’annonce frappe le plus fort. Avec Mythos 5 (le modèle complet dont Fable 5 dérive) les équipes d’Anthropic affirment avoir accéléré certaines étapes de conception de médicaments d’un facteur dix environ. Sur quatorze cibles protéiques étudiées, neuf auraient donné des candidats sérieux, désormais à l’étude. Il faut lire ces chiffres pour ce qu’ils sont : des résultats préliminaires, obtenus par le calcul (in silico), et non des médicaments validés cliniquement.

En biologie moléculaire, Anthropic présente Mythos 5 comme son premier modèle à produire de façon constante des hypothèses inédites : lors de comparaisons à l’aveugle, des chercheurs auraient préféré ses propositions dans environ 80 % des cas. Un point se détache nettement du reste : l’une de ces hypothèses, portant sur un mécanisme nouveau d’une protéine d’Escherichia coli, a été corroborée par une étude indépendante. C’est, à ce jour, le seul résultat scientifique de l’annonce à avoir passé un examen extérieur et c’est précisément ce qui lui donne sa valeur.

En génomique enfin, après plus d’une semaine de travail largement autonome, le modèle aurait assemblé des données monocellulaires couvrant des millions de cellules sur 138 espèces animales, puis entraîné un modèle d’apprentissage cent fois plus petit qu’un modèle déjà publié dans la revue Science, qu’il aurait surpassé. Là encore, l’information vient d’Anthropic et n’a pas fait l’objet d’une publication évaluée par les pairs.

Un seul modèle, deux visages : la vraie nouveauté

Derrière les performances, le fait le plus original n’est pas un score mais une architecture. Fable 5 et Mythos 5 reposent sur exactement le même modèle ; seuls les garde-fous diffèrent. Mythos 5 conserve toute sa puissance, y compris en cybersécurité offensive, mais reste réservé à un cercle restreint de partenaires gouvernementaux et d’infrastructures dans le cadre de l’initiative Project Glasswing. Fable 5, accessible à tous, est bridé : dès qu’une requête touche à la cybersécurité, à la biologie, à la chimie ou à la copie du modèle (distillation), la réponse est silencieusement déléguée à Claude Opus 4.8.

Anthropic chiffre ce repli à moins de 5 % des sessions. La conséquence mérite d’être soulignée : le modèle qui répond n’est pas toujours celui que l’on croit interroger. Autre nuance importante, relevée par plusieurs observateurs : une partie des records de performance affichés sont des scores de Mythos 5, et non de Fable 5 bridé.

Face à Opus 4.8 : des scores élevés, à lire avec prudence

Les preuves de puissance se rangent en trois niveaux, de fiabilité croissante. D’abord les chiffres d’Anthropic : l’entreprise revendique l’état de l’art quasi général, avec par exemple un score d’environ 80 % sur le banc d’essai de programmation SWE-Bench Pro, contre près de 69 % pour Opus 4.8, et une nette avance sur l’évaluation FrontierCode de Cognition.

Viennent ensuite les témoignages de clients : Stripe rapporte une migration d’une base de code Ruby de 50 millions de lignes réalisée en une journée, là où une équipe aurait travaillé deux mois, l’éditeur Hex évoque un bond de dix points sur ses tâches analytiques complexes. Ces retours émanent de clients payants en production, ce qui les rend plus crédibles que de simples démonstrations, mais ce sont des témoignages, pas des audits.

Restent les évaluations indépendantes, encore peu nombreuses et contrastées. Artificial Analysis, qui a eu un accès anticipé, classe Fable 5 premier sur son test de travail agentique GDPval-AA. À l’inverse, Andon Labs, avec son test Vending-Bench, observe que le modèle complet gagne moins d’argent qu’Opus 4.7 et que le modèle concurrent GPT-5.5, et note un possible recul sur l’alignement. Quant à Endor Labs, qui mesure la capacité à corriger de vraies failles de sécurité tout en préservant le code, il place Fable 5 en milieu de tableau, pénalisé par un nombre record d’expirations de délai dues à son raisonnement étendu tout en résolvant quatre problèmes qu’aucun modèle n’avait traités avant lui. La leçon : selon la tâche, l’avance va du spectaculaire au très ordinaire.

Coûts et accès

Fable 5 et Mythos 5 sont facturés 10 dollars par million de jetons en entrée et 50 dollars en sortie, soit environ le double du tarif standard d’Opus 4.8 (5 et 25 dollars), et le prix exact de son mode rapide. La remise de 90 % sur les jetons d’entrée mis en cache s’applique, et une inférence hébergée aux États-Unis est proposée à 1,1 fois ce tarif. Le modèle est disponible via l’API Claude (identifiant claude-fable-5), ainsi que sur Amazon Bedrock, Google Cloud, Microsoft Foundry et GitHub Copilot.

Abonnements : une fenêtre qui se referme le 22 juin

Pour les abonnés, l’accès est rationné par étapes. Du 9 au 22 juin 2026, Fable 5 est inclus sans surcoût dans les formules Pro, Max, Team et Enterprise par siège. À partir du 23 juin, il quitte ces formules : son usage passe alors par des crédits d’utilisation payants, jusqu’à ce que la capacité serveur permette de le réintégrer. Sur l’API et les plans Enterprise à la consommation, l’accès est complet dès le premier jour.

Ce qu’il reste à confirmer

Le verdict ne se jouera pas sur les chiffres du jour de lancement, mais sur des évaluations indépendantes, répétées, dans les semaines à venir. Le recul d’alignement pointé par Andon Labs et les expirations de délai relevées par Endor Labs rappellent qu’un modèle de pointe peut briller sur une tâche et trébucher sur une autre. On notera aussi qu’Anthropic avait, quelques jours avant cette sortie, alerté sur les dangers croissants de l’IA de frontière, une tension qui mérite d’être gardée à l’esprit. Pour l’heure, le seul résultat ayant franchi un contrôle extérieur reste une hypothèse de biologie ; tout le reste, au sens strict, demande encore à être confirmé.

 !! importante mise à jour !!

Sources

  • Anthropic, Claude Fable 5 and Claude Mythos 5, 9 juin 2026  anthropic.com
  • Artificial Analysis, Claude Fable 5: the first public Mythos-class model, 9 juin 2026  artificialanalysis.ai
  • Endor Labs, Claude Fable 5: Mythos-grade hype and a few hall-of-fame entries, 11 juin 2026  endorlabs.com
  • Vellum, Claude Fable 5 & Mythos 5 benchmarks explained (rapporte les tests d’Andon Labs), 9 juin 2026 — vellum.ai
  • CNBC, Anthropic releases Mythos-like AI model to the public, 9 juin 2026  cnbc.com
  • TechCrunch, Anthropic released Claude Fable 5 days after warning AI is getting too dangerous, 9 juin 2026 techcrunch.com

 

 

 

← Article précédent La guerre des IA en avril 2026 Article suivant → Fable 5 : Washington censure l’IA la plus puissante du monde