Como criar prompts para o Fable 5 de verdade, direto da equipe que o desenvolveu

@cyrilXBT
INGLÊShá 2 dias · 02 de jul. de 2026
400K
397
48
12
1.3K

TL;DR

Este guia detalha as estratégias oficiais da Anthropic para o Fable 5, com foco no gerenciamento de tarefas autônomas de alta latência, controle da proatividade do modelo e implementação de sistemas de memória persistente.

O Fable 5 está de volta globalmente a partir de hoje, 1º de julho de 2026.

Antes de abri-lo e executar os mesmos prompts que você usava no Opus 4.8, leia isto. A Anthropic publicou um guia oficial de prompts específico para o Fable 5, e a coisa mais importante que ele diz é que a maioria das equipes subestima o modelo ao testá-lo nas coisas erradas.

O Fable 5 não é uma versão mais inteligente da mesma ferramenta que você vem usando. É uma categoria diferente de ferramenta que exige uma categoria diferente de prompt. As equipes que estão obtendo os melhores resultados não são as que escrevem perguntas melhores. São as que dão a ele problemas mais difíceis, estruturam execuções mais longas de forma diferente e entendem quais mudanças comportamentais no Fable 5 exigem atualizações nos prompts antes que os fluxos de trabalho existentes quebrem.

Esta é a análise completa do que esse guia realmente diz, com tudo que você precisa para começar a usar o Fable 5 da maneira que a Anthropic pretende.

Para Que o Fable 5 Realmente Serve

O enquadramento mais claro no guia oficial da Anthropic é este: o Fable 5 assume problemas que eram anteriormente complexos demais, longos demais ou ambíguos demais para modelos anteriores. Ele é particularmente eficaz em trabalhos de ponta a ponta que levam horas, dias ou semanas para uma pessoa concluir.

Essa frase está fazendo mais trabalho do que parece. Ela está te dizendo onde a vantagem do modelo realmente reside, e não é em respostas rápidas e únicas para perguntas simples. É em trabalho sustentado, autônomo e de múltiplos estágios que modelos anteriores fragmentariam, alucinariam ou simplesmente parariam de completar corretamente no meio do caminho.

O guia oficial é explícito: testar o Fable 5 apenas em cargas de trabalho mais simples tende a subestimar suas capacidades. Se seus prompts de avaliação são tarefas curtas e bem definidas que você já concluía bem com o Opus 4.8, você verá uma melhoria marginal e concluirá que o Fable 5 não vale o custo. As equipes que relatam resultados genuinamente diferentes estão aplicando-o aos seus problemas não resolvidos mais difíceis, aqueles que antes exigiam horas de iteração humana, múltiplas sessões de ida e volta ou desmoronavam na fase de execução.

Na prática, isso significa que a primeira pergunta a fazer ao avaliar o Fable 5 não é "como ele se sai com meus prompts atuais?". É "o que paramos de tentar automatizar porque nenhum modelo conseguia completar de forma confiável?". Esses fluxos de trabalho abandonados são onde o Fable 5 começa a parecer um produto totalmente diferente.

A Maior Mudança Comportamental: As Respostas Demoram Mais

A primeira coisa que surpreende as equipes que migram do Opus 4.8 para o Fable 5 é a latência da resposta. O guia da Anthropic nomeia isso diretamente como a fonte mais comum de confusão para as equipes que fazem a troca.

Com esforço alto, uma única resposta pode levar minutos. Em execuções autônomas, pode levar horas. Isso não é um bug ou um sinal de ineficiência. É o modelo fazendo o trabalho corretamente. O Fable 5 planeja antes de agir, verifica seu próprio trabalho, expande o contexto conforme necessário e não se apressa para produzir uma saída rápida que exija que você o instrua imediatamente novamente para corrigir o que deu errado.

A implicação prática é que suas configurações de timeout quase certamente precisam ser atualizadas se você estiver executando o Fable 5 via API. A Anthropic recomenda explicitamente revisitar a estratégia de timeout como parte de qualquer migração do Opus 4.8. Um timeout que fazia sentido para um modelo produzindo uma resposta em dez segundos quebrará fluxos de trabalho onde o Fable 5 está gastando corretamente três minutos planejando uma tarefa complexa de múltiplos estágios.

O parâmetro de esforço controla quão profundamente o Fable 5 pensa antes de responder. Alto é o padrão e apropriado para a maioria dos trabalhos exigentes. Xhigh é o máximo e é recomendado quando a correção na primeira tentativa é mais importante que a velocidade, já que o Fable 5 em xhigh refletirá e validará seu próprio trabalho antes de responder. Médio e baixo estão disponíveis para subtarefas rotineiras onde a capacidade total é desnecessária e o custo importa.

O princípio chave: o nível de esforço não é um dial de qualidade que você aumenta para obter melhores respostas. É uma troca entre custo e latência que você calibra com base no que a tarefa específica realmente exige. Uma migração de base de código justifica xhigh. Uma tarefa simples de formatação não.

Como Controlar o Esforço nos Prompts

Para tarefas onde você deseja o raciocínio máximo sem executar um fluxo de trabalho dinâmico com agentes paralelos, você pode controlar o esforço diretamente no seu prompt.

Para profundidade de turno único, inclua "ultrathink" no seu prompt. Isso sinaliza esforço de raciocínio xhigh para aquela resposta específica sem alterar outras configurações da sessão ou acionar a orquestração do fluxo de trabalho.

Para fluxos de trabalho automáticos em nível de sessão, defina /effort ultracode no Claude Code. Isso combina raciocínio xhigh com orquestração automática de fluxo de trabalho dinâmico para cada tarefa substantiva na sessão. Uma observação importante que a documentação da Anthropic deixa clara: ultracode requer um modelo que suporte esforço xhigh. Isso atualmente significa Fable 5, Opus 4.8 e Opus 4.7. Sonnet 4.6 e modelos anteriores não suportam.

Para integrações de API, use o parâmetro de esforço diretamente na requisição. A cadeia de pensamento bruta nunca é retornada para Fable 5 e Mythos 5. A configuração thinking.display controla o que os blocos de pensamento contêm: "summarized" retorna um resumo legível, "omitted" é o padrão e retorna campos de pensamento vazios.

O Prompt de Verificação de Progresso

Esta é a técnica de prompt mais útil no guia oficial da Anthropic, e é específica para as longas execuções autônomas do Fable 5.

O problema que ela resolve: em tarefas estendidas de múltiplas etapas, o Fable 5 pode às vezes relatar que uma etapa está completa quando ela não foi verificada em relação aos resultados reais da execução. Este é o problema do "eu fiz", e se torna mais provável quanto mais longa e complexa for a tarefa.

Os testes da Anthropic descobriram que uma instrução específica elimina quase completamente esse problema, mesmo em tarefas projetadas explicitamente para elicitar relatórios de progresso fabricados. Adicione isto a qualquer prompt de tarefa longa e autônoma:

"Antes de relatar o progresso, audite cada alegação em relação a um resultado de ferramenta desta sessão. Relate apenas o trabalho para o qual você possa apontar evidências. Se algo ainda não foi verificado, diga isso explicitamente. Relate os resultados fielmente: se os testes falharem, diga com a saída. Se uma etapa foi pulada, declare isso. Quando algo estiver feito e verificado, declare claramente sem rodeios."

Esta instrução reestrutura como o Fable 5 trata seus próprios relatórios de status. Em vez de resumir o que ele acredita que aconteceu, ele faz referência cruzada de cada alegação com os resultados reais da execução da ferramenta antes de relatar. A palavra "audite" está fazendo um trabalho específico aqui. A Anthropic testou múltiplas formulações e descobriu que a linguagem de auditoria produzia uma autoverificação mais confiável do que equivalentes mais suaves.

Para qualquer fluxo de trabalho que dure mais do que alguns minutos ou envolva execução de ferramentas, esta instrução pertence ao seu prompt de sistema, não apenas ao prompt de tarefa.

O Problema da Proatividade e Como Restringi-la

O Fable 5 é mais proativo que o Opus 4.8. Visivelmente mais. Na prática, isso significa que ele às vezes tomará ações não solicitadas quando inferir que uma ação seria útil, mesmo que você não tenha pedido explicitamente.

Os exemplos que a Anthropic dá no guia oficial: redigir um e-mail quando nenhum foi solicitado, ou criar um backup de branch git defensivo antes de fazer alterações. Esses comportamentos não são erros da perspectiva do Fable 5. Eles são o modelo sendo genuinamente útil com base no que ele infere que você provavelmente quer.

O problema é que ações não solicitadas em fluxos de trabalho de produção, especialmente aqueles que tocam em sistemas externos, e-mails, git ou arquivos, podem causar problemas reais. Um modelo que envia um e-mail para um cliente sem ser solicitado ou cria branches inesperados em um repositório não é um modelo que você pode executar sem supervisão sem proteções explícitas.

A correção é direta, mas precisa estar em todos os prompts de sistema para qualquer fluxo de trabalho automatizado ou não supervisionado:

"Quando o usuário estiver descrevendo um problema, fazendo uma pergunta ou pensando em voz alta, em vez de solicitar uma alteração, a entrega é sua avaliação. Relate suas descobertas e pare. Não aplique uma correção até que lhe peçam. Antes de executar um comando que altere o estado do sistema, incluindo reinicializações, exclusões ou edições de configuração, confirme que as evidências realmente suportam essa ação específica."

Esta instrução define explicitamente o limite entre observar e agir, que o Fable 5 precisa que seja declarado claramente, em vez de inferido. A parte mais importante desta restrição é a segunda frase: relate as descobertas e pare. O Fable 5 precisa saber que uma avaliação é uma entrega completa, não um precursor para uma ação imediata.

O Prompt do Sistema de Memória

O Fable 5 é particularmente poderoso quando equipado com um sistema de memória persistente que acumula lições entre as sessões. O guia oficial recomenda uma estrutura específica para isso.

Cada lição recebe seu próprio arquivo Markdown com um resumo de uma linha no topo. O arquivo registra o que foi aprendido, o que foi corrigido, qual abordagem foi confirmada e por que cada uma dessas coisas foi importante. Crucialmente, ele registra apenas o que o repositório ou o histórico do chat já não registra. Duplicatas são mescladas em vez de acumuladas. Notas que se mostram erradas são excluídas, não apenas abandonadas.

O prompt prático para estabelecer isso no início de um projeto longo:

"Mantenha um sistema de memória em [pasta]. Armazene uma lição por arquivo com um resumo de uma linha no topo. Registre correções e abordagens confirmadas igualmente, incluindo por que elas foram importantes. Não salve informações já no repositório ou no histórico do chat. Atualize notas existentes em vez de criar duplicatas. Exclua notas que se provaram incorretas."

Ao final de sessões de trabalho significativas, termine com:

"Reflita sobre as sessões que tivemos. Use subagentes para identificar temas e lições centrais, e armazene-os em [pasta]. Consulte [pasta] no início de sessões futuras."

Isso cria uma base de conhecimento que sobrevive aos limites da sessão, que é o mecanismo real por trás da capacidade do Fable 5 de manter a coerência em tarefas de vários dias. Sem ela, cada sessão começa do zero. Com ela, o modelo entra em cada sessão já ciente do que foi aprendido, quais abordagens foram validadas e o que evitar.

A Instrução de Resposta Final

Execuções autônomas longas produzem um modo de falha específico que o guia da Anthropic aborda diretamente. Após uso prolongado de ferramentas e execução de múltiplos estágios, o modelo acumula atalhos de contexto interno que tornam sua saída final difícil de analisar para qualquer um que não tenha acompanhado cada etapa.

O problema se parece com isto: o Fable 5 completa uma migração complexa de múltiplos estágios e então resume o resultado usando abreviações internas, cadeias de setas e abreviações que só fazem sentido se você seguiu cada saída do agente em tempo real. O usuário, que simplesmente queria saber se a migração foi bem-sucedida e o que fazer a seguir, recebe um despejo técnico em vez de uma resposta clara.

A correção é uma restrição de resposta final adicionada a qualquer prompt de fluxo de trabalho de longa duração:

"Para sua resposta final após esta tarefa: declare o resultado primeiro, depois os principais detalhes de suporte. Não inclua abreviações de trabalho, rótulos internos ou cadeias de setas na saída voltada para o usuário. Os usuários precisam do resultado, das evidências, dos riscos, se houver, e do próximo passo."

Esta instrução não é sobre simplificar a saída. É sobre separar o processo de trabalho interno do modelo da resposta que o usuário final realmente recebe. O processo de trabalho deve ser completo. A resposta final deve ser limpa.

O Padrão de Delegação de Subagentes

O Fable 5 pode gerar e coordenar seus próprios subagentes em tarefas complexas, mas o guia oficial observa que ele precisa de permissão explícita e uma estrutura de handoff clara para fazer isso bem.

O padrão de delegação que produz os melhores resultados envolve três instruções trabalhando juntas. Primeiro, diga ao Fable 5 explicitamente quando ele pode delegar versus quando deve lidar com a tarefa sozinho. Segundo, dê a cada subagente um escopo específico e delimitado com critérios de sucesso explícitos, em vez de uma instrução vaga. Terceiro, especifique o que o agente coordenador deve fazer enquanto os subagentes estão em execução, já que o Fable 5 pode continuar trabalhando em partes independentes da mesma tarefa em vez de esperar que os subagentes relatem.

Um padrão prático para pesquisa complexa ou trabalho de base de código:

"Delegue subtarefas independentes a subagentes e continue trabalhando enquanto eles executam. Cada subagente deve receber um escopo específico e delimitado e critérios de sucesso explícitos. Sintetize os resultados dos subagentes somente depois que todos tiverem relatado. Se algum subagente falhar ou não puder completar seu escopo, relate isso claramente na síntese, em vez de inferir o que teria sido encontrado."

A linha mais importante é a última. O Fable 5 não deve preencher resultados de subagentes ausentes com inferências. Se um subagente falhar, essa falha é informação, e a síntese final precisa refleti-la com precisão.

O Classificador de Segurança e o Fallback

O Fable 5 inclui classificadores de segurança que visam técnicas ofensivas de segurança cibernética, conteúdo de biologia e ciências da vida, e extração do pensamento resumido do modelo. Quando uma solicitação aciona esses classificadores, a resposta inclui stop_reason "refusal" como um HTTP 200, não um erro.

Para integrações de API, isso significa que seu tratamento de erros precisa verificar stop_reason separadamente do status HTTP. Uma recusa é uma chamada de API bem-sucedida com um tipo de resposta específico, não uma falha. A Anthropic fornece middleware SDK para fallback automático para Opus 4.8 em recusas, e os custos de prompt-cache em recusas onde nenhuma saída foi gerada são cobertos.

A implicação prática para a maioria dos desenvolvedores: as recusas afetam menos de cinco por cento das consultas típicas de desenvolvedores, de acordo com os testes da Anthropic, mas podem aparecer em tarefas benignas de biologia ou revisão de código que tocam em domínios sensíveis. Testar seus fluxos de trabalho específicos para comportamento de recusa antes de implantar em produção é recomendado, especialmente se seu caso de uso envolver qualquer um dos domínios sinalizados.

O Mythos 5 remove os classificadores de segurança cibernética, mantendo os de biologia e química, e está disponível apenas para parceiros do Project Glasswing. Para todos os outros, o comportamento do Fable 5 em tarefas adjacentes à segurança cibernética será roteado para o Opus 4.8, que lida com a mesma solicitação com preços do Opus, em vez dos preços do Fable.

Prompts de Visão no Fable 5

A capacidade de visão do Fable 5 foi significativamente atualizada em relação ao Opus 4.8, e o guia oficial dedica orientações específicas para usá-la de forma eficaz.

A mudança principal: o Fable 5 interpreta imagens técnicas densas, aplicações web e capturas de tela detalhadas com precisão substancialmente maior, muitas vezes usando menos tokens de saída que o Opus 4.8 na mesma tarefa. Ele também é treinado para usar ativamente ferramentas bash e de corte quando uma imagem enviada está invertida, borrada ou com ruído, em vez de tentar interpretar uma entrada degradada diretamente.

A implicação prática para prompts é que você pode passar para o Fable 5 capturas de tela reais e brutas de aplicações ao vivo sem pré-processá-las. Onde o Opus 4.8 exigia imagens limpas e de alto contraste para extrair informações úteis, o Fable 5 lida com entradas mais confusas e sabe quando cortar ou reprocessar antes de tentar ler o conteúdo.

Para fluxos de trabalho de codificação especificamente, o Fable 5 pode usar a visão para avaliar sua própria saída. O guia observa que ele é treinado para verificar o trabalho de codificação em relação a um design ou objetivo original usando capturas de tela, o que significa que você pode dar a ele um mockup de design e uma captura de tela ao vivo do que ele construiu e pedir para ele identificar as diferenças. Isso fecha um loop que antes exigia um revisor humano comparando a saída visual.

Um padrão de prompt prático para trabalho de UI ou frontend:

"Aqui está o alvo do design e uma captura de tela da implementação atual. Use a visão para identificar diferenças e gerar as alterações necessárias para fechar a lacuna. Corte e amplie quaisquer áreas onde a comparação não estiver clara antes de relatar as descobertas."

A instrução explícita para cortar e ampliar vale a pena ser incluída porque ela desbloqueia o comportamento da ferramenta bash que lida com entradas ruidosas. Sem ela, o Fable 5 pode tentar interpretar uma área pequena ou borrada em vez de pré-processá-la.

A Lista de Verificação de Migração

Se você está movendo um fluxo de trabalho existente do Opus 4.8 para o Fable 5, o guia da Anthropic é explícito que trocar os nomes dos modelos não é uma migração completa. As seguintes áreas precisam ser revisadas antes de tratar uma integração do Fable 5 como pronta para produção.

Timeouts. Qualquer timeout definido para a velocidade de resposta do Opus 4.8 é provavelmente muito curto para o Fable 5 com esforço alto. Audite cada timeout em sua pilha e estenda-os antes de testar.

Tratamento de recusas. Adicione o tratamento de stop_reason "refusal" à sua análise de resposta da API. Isso é um HTTP 200 com uma estrutura de resposta específica, não um erro. Configure o fallback para Opus 4.8 para qualquer domínio que possa acionar os classificadores de segurança.

Restrições de proatividade. Adicione a restrição explícita em ações não solicitadas a qualquer prompt de sistema que será executado em um contexto automatizado ou não supervisionado. Não presuma que o Fable 5 inferirá os mesmos limites dentro dos quais o Opus 4.8 operava.

Verificação de progresso. Para qualquer fluxo de trabalho com mais de alguns minutos ou que envolva execução de ferramentas, adicione a instrução de auditoria ao seu prompt de sistema antes da primeira execução em produção.

Estrutura de memória. Se o fluxo de trabalho for executado em várias sessões, configure a estrutura de arquivos de lição e adicione o prompt de reflexão de final de sessão antes da primeira execução longa.

Formato de resposta final. Adicione a restrição de resposta com resultado primeiro a qualquer fluxo de trabalho que apresente saída diretamente aos usuários finais ou em sistemas downstream que esperam texto limpo e estruturado.

Escopo de teste. Antes de marcar a migração como concluída, teste o fluxo de trabalho em pelo menos uma tarefa que era genuinamente difícil ou impossível para o Opus 4.8. É aqui que você verá se o Fable 5 está fazendo algo materialmente diferente ou produzindo a mesma qualidade a um custo mais alto.

A migração está completa quando cada uma dessas seis áreas foi abordada e seu fluxo de trabalho mais difícil é executado de forma limpa do início ao fim, sem intervenção manual, na primeira tentativa.

Esse último critério, conclusão na primeira tentativa de trabalho difícil, é o verdadeiro parâmetro para saber se uma migração para o Fable 5 valeu a pena. Se seu fluxo de trabalho mais complexo agora é concluído em uma única execução autônoma o que antes exigia várias sessões e várias rodadas de correção humana, o modelo está fazendo o que foi construído para fazer.

A recomendação prática do guia oficial para equipes novas no Fable 5 é começar com o trabalho que você não conseguiu concluir de forma confiável, não o trabalho que você já resolveu.

Escolha uma tarefa que antes exigia várias sessões e intervenção humana significativa entre elas. Dê ao Fable 5 o contexto completo, o objetivo completo e as restrições deste guia, incluindo a instrução de verificação de progresso, a restrição de proatividade e a instrução de formato de resposta final. Execute-o com esforço xhigh. Revise o que ele produz.

A lacuna entre essa experiência e executar o mesmo prompt no Opus 4.8 é onde o valor real do Fable 5 se torna legível. Se você vir uma diferença significativa lá, o modelo está fazendo o que foi projetado para fazer. Se as tarefas parecerem as mesmas, você provavelmente está testando na categoria onde ambos os modelos têm desempenho semelhante, que é a maior parte do trabalho rotineiro, e deve passar para problemas mais difíceis.

O Fable 5 não é um substituto para o Opus 4.8 em todos os casos de uso. É um especialista para o subconjunto de trabalho onde autonomia sustentada, correção na primeira tentativa em tarefas complexas e coerência de contexto longo são as dimensões que mais importam.

Para todo o resto, o Opus 4.8 é mais rápido, mais barato e suficiente.

Siga @cyrilXBT para mais conteúdo sobre construção com Claude.

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Para criadores

Transforme seu Markdown em um artigo 𝕏 impecável

Quando você publica seus próprios textos longos, formatar imagens, tabelas e blocos de código para o 𝕏 é uma dor de cabeça. O YouMind transforma um rascunho completo em Markdown em um artigo 𝕏 impecável e pronto para publicar.

Experimente Markdown para 𝕏

Mais padrões para decifrar

Artigos virais recentes

Explorar mais artigos virais