Voici la traduction en français du texte fourni :
Fable 5 est de retour dans le monde entier à compter d'aujourd'hui, le 1er juillet 2026.
Avant de l'ouvrir et d'exécuter les mêmes invites que vous utilisiez sur Opus 4.8, lisez ceci. Anthropic a publié un guide d'invite officiel spécifiquement pour Fable 5, et la chose la plus importante qu'il dit est que la plupart des équipes sous-estiment le modèle en le testant sur les mauvaises choses.
Fable 5 n'est pas une version plus intelligente du même outil que vous utilisiez. C'est une catégorie d'outil différente qui nécessite une catégorie d'invite différente. Les équipes qui obtiennent les meilleurs résultats ne sont pas celles qui écrivent de meilleures questions. Ce sont celles qui lui donnent des problèmes plus difficiles, structurent différemment les exécutions plus longues et comprennent quels changements de comportement dans Fable 5 nécessitent des mises à jour d'invite avant que les flux de travail existants ne se brisent.
Voici la ventilation complète de ce que ce guide dit réellement, avec tout ce dont vous avez besoin pour commencer à utiliser Fable 5 comme Anthropic le souhaite.
À quoi sert réellement Fable 5
Le cadre le plus clair du guide officiel d'Anthropic est le suivant : Fable 5 s'attaque à des problèmes qui étaient auparavant trop complexes, longs ou ambigus pour les modèles précédents. Il est particulièrement efficace pour un travail de bout en bout qui prend des heures, des jours ou des semaines à une personne.
Cette phrase fait plus de travail qu'il n'y paraît. Elle vous indique où se trouve réellement l'avantage du modèle, et ce n'est pas dans des réponses plus rapides en un seul essai à des questions simples. C'est dans un travail soutenu, autonome et en plusieurs étapes que les modèles précédents fragmentaient, hallucinaient ou cessaient simplement de terminer correctement à mi-parcours.
Le guide officiel est explicite : tester Fable 5 uniquement sur des charges de travail plus simples a tendance à sous-estimer ses capacités. Si vos invites d'évaluation sont des tâches courtes et bien définies que vous accomplissiez déjà très bien avec Opus 4.8, vous verrez une amélioration marginale et conclurez que Fable 5 n'en vaut pas le coût. Les équipes qui rapportent des résultats véritablement différents l'appliquent à leurs problèmes non résolus les plus difficiles, ceux qui nécessitaient auparavant des heures d'itération humaine, plusieurs sessions de va-et-vient, ou qui échouaient en phase d'exécution.
Concrètement, cela signifie que la première question à se poser lors de l'évaluation de Fable 5 n'est pas « comment se comporte-t-il avec mes invites actuelles ? » mais « qu'avons-nous cessé d'essayer d'automatiser parce qu'aucun modèle ne pouvait le terminer de manière fiable ? » Ces flux de travail abandonnés sont l'endroit où Fable 5 commence à ressembler à un produit complètement différent.
Le plus grand changement de comportement : les réponses prennent plus de temps
La première chose qui surprend les équipes qui migrent d'Opus 4.8 vers Fable 5 est la latence des réponses. Le guide d'Anthropic nomme cela directement comme la source de confusion la plus courante pour les équipes qui effectuent la transition.
Avec un effort élevé, une seule réponse peut prendre plusieurs minutes. Sur des exécutions autonomes, cela peut prendre des heures. Ce n'est pas un bug ou un signe d'inefficacité. C'est le modèle qui fait correctement le travail. Fable 5 planifie avant d'agir, vérifie son propre travail, développe le contexte si nécessaire et ne se précipite pas pour produire un résultat rapide qui vous obligerait à l'inviter immédiatement à nouveau pour corriger ce qui n'a pas fonctionné.
L'implication pratique est que vos paramètres de délai d'attente doivent presque certainement être mis à jour si vous exécutez Fable 5 via l'API. Anthropic recommande explicitement de revoir la stratégie de délai d'attente dans le cadre de toute migration depuis Opus 4.8. Un délai d'attente qui avait du sens pour un modèle produisant une réponse en dix secondes brisera les flux de travail où Fable 5 passe correctement trois minutes à planifier une tâche complexe en plusieurs étapes.
Le paramètre d'effort contrôle la profondeur de réflexion de Fable 5 avant de répondre. Élevé est la valeur par défaut et convient à la plupart des travaux exigeants. Très élevé est le maximum et est recommandé lorsque l'exactitude du premier essai est plus importante que la vitesse, car Fable 5 à un niveau très élevé réfléchira et validera son propre travail avant de répondre. Moyen et Faible sont disponibles pour les sous-tâches de routine où la pleine capacité est inutile et où le coût est important.
Le principe clé : le niveau d'effort n'est pas un cadran de qualité que vous augmentez pour de meilleures réponses. C'est un compromis entre coût et latence que vous calibrez en fonction de ce que la tâche spécifique exige réellement. Une migration de codebase justifie un niveau très élevé. Une tâche de formatage simple ne le justifie pas.
Comment contrôler l'effort dans les invites
Pour les tâches où vous souhaitez un raisonnement maximal sans exécuter un flux de travail dynamique avec des agents parallèles, vous pouvez contrôler l'effort directement dans votre invite.
Pour une profondeur en un seul tour, incluez « ultrathink » dans votre invite. Cela signale un effort de raisonnement très élevé pour cette réponse spécifique sans modifier les autres paramètres de la session ni déclencher l'orchestration du flux de travail.
Pour les flux de travail automatiques au niveau de la session, définissez /effort ultracode dans Claude Code. Cela combine un raisonnement très élevé avec une orchestration automatique de flux de travail dynamique pour chaque tâche substantielle de la session. Une note importante que la documentation d'Anthropic précise : ultracode nécessite un modèle qui prend en charge l'effort très élevé. Cela signifie actuellement Fable 5, Opus 4.8 et Opus 4.7. Sonnet 4.6 et les modèles antérieurs ne le prennent pas en charge.
Pour les intégrations API, utilisez le paramètre d'effort directement dans la requête. La chaîne de pensée brute n'est jamais renvoyée pour Fable 5 et Mythos 5. Le paramètre thinking.display contrôle ce que contiennent les blocs de réflexion : « summarized » renvoie un résumé lisible, « omitted » est la valeur par défaut et renvoie des champs de réflexion vides.
L'invite de vérification de progression
C'est la technique d'invite la plus utile du guide officiel d'Anthropic, et elle est spécifique aux longues exécutions autonomes de Fable 5.
Le problème qu'elle résout : lors de tâches étendues en plusieurs étapes, Fable 5 peut parfois signaler qu'une étape est terminée alors qu'elle n'a pas été vérifiée par rapport aux résultats d'exécution réels. C'est le problème du « je l'ai fait », et il devient plus probable à mesure que la tâche est longue et complexe.
Les tests d'Anthropic ont montré qu'une instruction spécifique élimine presque ce problème, même sur des tâches explicitement conçues pour susciter des rapports de progression fabriqués. Ajoutez ceci à toute invite de tâche autonome longue :
« Avant de signaler la progression, vérifiez chaque affirmation par rapport à un résultat d'outil de cette session. Ne signalez que le travail pour lequel vous pouvez fournir des preuves. Si quelque chose n'est pas encore vérifié, dites-le explicitement. Rapportez les résultats fidèlement : si les tests échouent, dites-le avec le résultat. Si une étape a été sautée, indiquez-le. Quand quelque chose est fait et vérifié, énoncez-le simplement sans hésiter. »
Cette instruction restructure la façon dont Fable 5 traite ses propres rapports d'état. Au lieu de résumer ce qu'il croit s'être passé, il recoupe chaque affirmation avec les résultats réels d'exécution des outils avant de faire son rapport. Le mot « vérifiez » fait un travail spécifique ici. Anthropic a testé plusieurs formulations et a constaté que le langage de vérification produisait une auto-vérification plus fiable que des équivalents plus souples.
Pour tout flux de travail durant plus de quelques minutes ou impliquant l'exécution d'outils, cette instruction appartient à votre invite système, pas seulement à votre invite de tâche.
Le problème de proactivité et comment le limiter
Fable 5 est plus proactif qu'Opus 4.8. Nettement plus. En pratique, cela signifie qu'il prendra parfois des actions non demandées lorsqu'il déduit qu'une action serait utile, même si vous ne l'avez pas explicitement demandé.
Les exemples donnés par Anthropic dans le guide officiel : rédiger un e-mail alors qu'aucun n'a été demandé, ou créer une branche de sauvegarde défensive dans git avant d'apporter des modifications. Ces comportements ne sont pas des erreurs du point de vue de Fable 5. C'est le modèle qui se montre véritablement utile en fonction de ce qu'il déduit que vous voulez probablement.
Le problème est que les actions non demandées dans les flux de travail de production, en particulier celles qui touchent aux systèmes externes, aux e-mails, à git ou aux fichiers, peuvent causer de réels problèmes. Un modèle qui envoie un e-mail à un client sans qu'on le lui demande ou qui crée des branches inattendues dans un référentiel n'est pas un modèle que vous pouvez exécuter sans surveillance sans garde-fous explicites.
La solution est simple mais doit figurer dans chaque invite système pour tout flux de travail automatisé ou non surveillé :
« Lorsque l'utilisateur décrit un problème, pose une question ou réfléchit à voix haute plutôt que de demander une modification, le livrable est votre évaluation. Rapportez vos conclusions et arrêtez-vous. N'appliquez pas de correctif avant qu'on vous le demande. Avant d'exécuter une commande qui modifie l'état du système, y compris les redémarrages, les suppressions ou les modifications de configuration, confirmez que les preuves soutiennent réellement cette action spécifique. »
Cette instruction définit explicitement la frontière entre observer et agir, ce que Fable 5 doit avoir clairement énoncé plutôt que déduit. La partie la plus importante de cette contrainte est la deuxième phrase : rapportez vos conclusions et arrêtez-vous. Fable 5 doit savoir qu'une évaluation est un livrable complet, pas un précurseur à une action immédiate.
L'invite du système de mémoire
Fable 5 est particulièrement puissant lorsqu'il est équipé d'un système de mémoire persistante qui accumule les leçons au fil des sessions. Le guide officiel recommande une structure spécifique pour cela.
Chaque leçon a son propre fichier Markdown avec un résumé d'une ligne en haut. Le fichier enregistre ce qui a été appris, ce qui a été corrigé, quelle approche a été confirmée et pourquoi chacune de ces choses était importante. Crucialement, il n'enregistre que ce que le référentiel ou l'historique de chat n'enregistre pas déjà. Les doublons sont fusionnés plutôt qu'accumulés. Les notes qui s'avèrent erronées sont supprimées, pas seulement abandonnées.
L'invite pratique pour établir cela au début d'un long projet :
« Maintenez un système de mémoire dans [dossier]. Stockez une leçon par fichier avec un résumé d'une ligne en haut. Enregistrez les corrections et les approches confirmées, y compris pourquoi elles étaient importantes. Ne sauvegardez pas les informations déjà présentes dans le référentiel ou l'historique de chat. Mettez à jour les notes existantes plutôt que de créer des doublons. Supprimez les notes qui se sont avérées incorrectes. »
À la fin des sessions de travail importantes, terminez par :
« Réfléchissez aux sessions que nous avons eues. Utilisez des sous-agents pour identifier les thèmes et les leçons principaux, et stockez-les dans [dossier]. Référencez [dossier] au début des sessions futures. »
Cela crée une base de connaissances qui survit aux limites des sessions, ce qui est le mécanisme réel derrière la capacité de Fable 5 à maintenir une cohérence sur des tâches de plusieurs jours. Sans cela, chaque session repart de zéro. Avec cela, le modèle entre dans chaque session déjà conscient de ce qui a été appris, des approches qui ont été validées et de ce qu'il faut éviter.
L'instruction de réponse finale
Les longues exécutions autonomes produisent un mode d'échec spécifique que le guide d'Anthropic aborde directement. Après une utilisation prolongée d'outils et une exécution en plusieurs étapes, le modèle accumule des raccourcis de contexte internes qui rendent sa sortie finale difficile à analyser pour quiconque n'a pas suivi chaque étape.
Le problème ressemble à ceci : Fable 5 termine une migration complexe en plusieurs étapes, puis résume le résultat en utilisant des abréviations internes, des chaînes de flèches et un jargon qui n'ont de sens que si vous avez suivi chaque sortie d'agent en temps réel. L'utilisateur, qui voulait simplement savoir si la migration a réussi et quoi faire ensuite, reçoit un dump technique au lieu d'une réponse claire.
La solution est une contrainte de réponse finale ajoutée à toute invite de flux de travail de longue durée :
« Pour votre réponse finale après cette tâche : énoncez d'abord le résultat, puis les détails clés à l'appui. N'incluez pas d'abréviations de travail, d'étiquettes internes ou de chaînes de flèches dans la sortie destinée à l'utilisateur. Les utilisateurs ont besoin du résultat, des preuves, des risques éventuels et de l'étape suivante. »
Cette instruction ne consiste pas à simplifier à outrance la sortie. Il s'agit de séparer le processus de travail interne du modèle de la réponse que l'utilisateur final reçoit réellement. Le processus de travail doit être approfondi. La réponse finale doit être claire.
Le modèle de délégation aux sous-agents
Fable 5 peut générer et coordonner ses propres sous-agents sur des tâches complexes, mais le guide officiel note qu'il a besoin d'une autorisation explicite et d'une structure de transfert claire pour bien le faire.
Le modèle de délégation qui produit les meilleurs résultats implique trois instructions fonctionnant ensemble. Premièrement, dites explicitement à Fable 5 quand il est autorisé à déléguer par rapport à quand il doit gérer la tâche lui-même. Deuxièmement, donnez à chaque sous-agent un périmètre spécifique et limité avec des critères de succès explicites plutôt qu'une instruction vague. Troisièmement, spécifiez ce que l'agent coordinateur doit faire pendant que les sous-agents s'exécutent, car Fable 5 peut continuer à travailler sur des parties indépendantes de la même tâche plutôt que d'attendre que les sous-agents fassent leur rapport.
Un modèle pratique pour une recherche complexe ou un travail sur une codebase :
« Déléguez les sous-tâches indépendantes à des sous-agents et continuez à travailler pendant qu'ils s'exécutent. Chaque sous-agent doit recevoir un périmètre spécifique et limité et des critères de succès explicites. Synthétisez les résultats des sous-agents uniquement après que tous ont fait leur rapport. Si un sous-agent échoue ou ne peut pas terminer son périmètre, signalez-le clairement dans la synthèse plutôt que de déduire ce qui aurait été trouvé. »
La ligne la plus importante est la dernière. Fable 5 ne doit pas combler les résultats manquants des sous-agents avec des déductions. Si un sous-agent échoue, cet échec est une information, et la synthèse finale doit le refléter avec précision.
Le classificateur de sécurité et le repli
Fable 5 inclut des classificateurs de sécurité qui ciblent les techniques offensives de cybersécurité, le contenu en biologie et sciences de la vie, et l'extraction de la pensée résumée du modèle. Lorsqu'une requête déclenche ces classificateurs, la réponse inclut stop_reason "refusal" en tant que HTTP 200, et non une erreur.
Pour les intégrations API, cela signifie que votre gestion des erreurs doit vérifier stop_reason séparément du statut HTTP. Un refus est un appel API réussi avec un type de réponse spécifique, pas un échec. Anthropic fournit un middleware SDK pour le repli automatique vers Opus 4.8 en cas de refus, et les coûts de cache d'invite sur les refus où aucune sortie n'a été générée sont couverts.
L'implication pratique pour la plupart des développeurs : les refus affectent moins de cinq pour cent des requêtes typiques des développeurs selon les tests d'Anthropic, mais peuvent apparaître sur des tâches bénignes de biologie ou de révision de code qui touchent à des domaines sensibles. Il est recommandé de tester vos flux de travail spécifiques pour le comportement de refus avant de les déployer en production, surtout si votre cas d'utilisation implique l'un des domaines signalés.
Mythos 5 supprime les classificateurs de cybersécurité tout en conservant ceux de biologie et de chimie, et n'est disponible que pour les partenaires de Project Glasswing. Pour tous les autres, le comportement de Fable 5 sur les tâches liées à la cybersécurité sera redirigé vers Opus 4.8, qui traite la même requête au tarif Opus plutôt qu'au tarif Fable.
L'invite de vision dans Fable 5
La capacité de vision de Fable 5 est considérablement améliorée par rapport à Opus 4.8, et le guide officiel consacre des conseils spécifiques à son utilisation efficace.
Le changement principal : Fable 5 interprète les images techniques denses, les applications web et les captures d'écran détaillées avec une précision sensiblement plus élevée, utilisant souvent moins de jetons de sortie qu'Opus 4.8 sur la même tâche. Il est également entraîné à utiliser activement les outils bash et de recadrage lorsqu'une image téléchargée est retournée, floue ou autrement bruitée, plutôt que de tenter d'interpréter directement une entrée dégradée.
L'implication pratique pour l'invite est que vous pouvez passer à Fable 5 de vraies captures d'écran brutes d'applications en direct sans les prétraiter. Là où Opus 4.8 nécessitait des images propres et à contraste élevé pour extraire des informations utiles, Fable 5 gère des entrées plus désordonnées et sait quand recadrer ou retraiter avant d'essayer de lire le contenu.
Pour les flux de travail de codage spécifiquement, Fable 5 peut utiliser la vision pour évaluer sa propre sortie. Le guide note qu'il est entraîné à vérifier le travail de codage par rapport à un design ou un objectif original en utilisant des captures d'écran, ce qui signifie que vous pouvez lui donner une maquette de design et une capture d'écran en direct de ce qu'il a construit et lui demander d'identifier les différences. Cela ferme une boucle qui nécessitait auparavant un réviseur humain comparant la sortie visuelle.
Un modèle d'invite pratique pour le travail d'interface utilisateur ou de frontend :
« Voici la cible de conception et une capture d'écran de l'implémentation actuelle. Utilisez la vision pour identifier les différences et générer les modifications nécessaires pour combler l'écart. Recadrez et zoomez sur les zones où la comparaison n'est pas claire avant de rapporter les résultats. »
L'instruction explicite de recadrer et de zoomer vaut la peine d'être incluse car elle déverrouille le comportement de l'outil bash qui gère les entrées bruitées. Sans cela, Fable 5 peut tenter d'interpréter une petite zone floue plutôt que de la prétraiter.
La liste de contrôle de migration
Si vous déplacez un flux de travail Opus 4.8 existant vers Fable 5, le guide d'Anthropic est explicite sur le fait que l'échange des noms de modèles n'est pas une migration complète. Les domaines suivants doivent être examinés avant de considérer une intégration Fable 5 comme prête pour la production.
Délais d'attente. Tout délai d'attente défini pour la vitesse de réponse d'Opus 4.8 est probablement trop court pour Fable 5 à effort élevé. Auditez chaque délai d'attente dans votre pile et prolongez-les avant de tester.
Gestion des refus. Ajoutez la gestion de stop_reason "refusal" à votre analyse des réponses API. Il s'agit d'un HTTP 200 avec une structure de réponse spécifique, pas d'une erreur. Configurez le repli vers Opus 4.8 pour tout domaine qui pourrait déclencher les classificateurs de sécurité.
Contraintes de proactivité. Ajoutez la contrainte explicite sur les actions non demandées à toute invite système qui s'exécutera dans un contexte automatisé ou non surveillé. Ne supposez pas que Fable 5 déduira les mêmes limites dans lesquelles Opus 4.8 opérait.
Vérification de progression. Pour tout flux de travail de plus de quelques minutes ou impliquant l'exécution d'outils, ajoutez l'instruction de vérification à votre invite système avant la première exécution en production.
Structure de mémoire. Si le flux de travail s'exécutera sur plusieurs sessions, configurez la structure de fichiers de leçons et ajoutez l'invite de réflexion de fin de session avant la première longue exécution.
Format de réponse finale. Ajoutez la contrainte de réponse axée sur le résultat à tout flux de travail qui présente la sortie directement aux utilisateurs finaux ou dans des systèmes en aval qui attendent un texte propre et structuré.
Périmètre des tests. Avant de marquer la migration comme terminée, testez le flux de travail sur au moins une tâche qui était véritablement difficile ou impossible pour Opus 4.8. C'est là que vous verrez si Fable 5 fait quelque chose de matériellement différent ou produit la même qualité à un coût plus élevé.
La migration est terminée lorsque chacun de ces six domaines a été traité et que votre flux de travail le plus difficile s'exécute proprement du début à la fin, sans intervention manuelle, du premier coup.
Ce dernier critère, l'achèvement du premier essai d'un travail difficile, est le véritable indicateur pour savoir si une migration vers Fable 5 en valait la peine. Si votre flux de travail le plus complexe termine maintenant en une seule exécution autonome ce qui nécessitait auparavant plusieurs sessions et plusieurs cycles de correction humaine, le modèle fait ce pour quoi il a été construit.
La recommandation pratique du guide officiel pour les équipes nouvelles sur Fable 5 est de commencer par le travail que vous n'avez pas pu terminer de manière fiable, pas par le travail que vous avez déjà résolu.
Choisissez une tâche qui nécessitait auparavant plusieurs sessions et une intervention humaine significative entre elles. Donnez à Fable 5 le contexte complet, l'objectif complet et les contraintes de ce guide, y compris l'instruction de vérification de progression, la contrainte de proactivité et l'instruction de format de réponse finale. Exécutez-le avec un effort très élevé. Examinez ce qu'il produit.
L'écart entre cette expérience et l'exécution de la même invite sur Opus 4.8 est l'endroit où la valeur réelle de Fable 5 devient lisible. Si vous voyez une différence significative là-bas, le modèle fait ce pour quoi il est conçu. Si les tâches semblent identiques, vous testez probablement dans la catégorie où les deux modèles fonctionnent de manière similaire, ce qui est la plupart des travaux de routine, et vous devriez passer à des problèmes plus difficiles.
Fable 5 n'est pas un remplacement d'Opus 4.8 pour tous les cas d'utilisation. C'est un spécialiste pour le sous-ensemble de travaux où l'autonomie soutenue, l'exactitude du premier essai sur des tâches complexes et la cohérence dans un contexte long sont les dimensions qui comptent le plus.
Pour tout le reste, Opus 4.8 est plus rapide, moins cher et suffisant.
Suivez @cyrilXBT pour en savoir plus sur la construction avec Claude.





