Economize 50% nos custos do Claude Fable 5: A estrutura 10-80-10

Como reduzir seus custos com tokens do Fable 5 em mais de 50%

O Claude Fable 5 é o melhor modelo de IA que já usei. Ponto final.

O problema é que ele é incrivelmente caro.

Nas primeiras horas de teste, quase estourou todo o meu limite de uso — e eu nem estava fazendo nada absurdo.

O Fable custa exatamente o dobro do Opus 4.8 e, por ser tão inteligente, ele acaba pensando demais, criando loops e queimando tokens de um jeito que nenhum modelo anterior do Claude fez.

Aprender a usar esse novo modelo corretamente é mais importante do que nunca.

Neste guia, vou mostrar o sistema 10-80-10 que desenvolvi para reduzir significativamente meus custos com tokens do Fable — e esses conselhos vêm diretamente dos engenheiros da Anthropic.

No final do artigo, criei um documento que você pode colocar diretamente no Fable, resumindo todo o meu framework.

Esse documento vai reduzir imediatamente seus gastos com tokens.

Fique até o final e vou compartilhá-lo com você diretamente.

Meu documento do framework

I: Sistema 10-80-10 Explicado

O sistema 10-80-10 é um framework simples para usar o Fable de forma eficiente, apenas onde ele é realmente necessário.

Esse é exatamente o framework que os engenheiros da Anthropic usam.

Veja como funciona:

Os primeiros 10%: Planejamento

Antes de começar qualquer projeto de IA, use o Fable para definir a estrutura, abordagem, critérios de sucesso e restrições.

Pense como se fosse construir uma casa. A parte mais importante é acertar a arquitetura e o planejamento. Caso contrário, os construtores vão executar um plano ruim.

O Fable 5 é um excelente arquiteto; use-o como tal.

Os 80% do meio: Execução

A maioria dos tokens é queimada na ida e volta, na iteração, nos pequenos ajustes, no trabalho braçal de concluir tarefas.

Para a camada de execução dos seus projetos de IA, use um modelo mais barato, como o Opus 4.8 para trabalhos padrão ou o Haiku para tarefas leves.

Você obtém o benefício da arquitetura do Fable sem pagar o preço do Fable por cada token de execução (que é exagero, de qualquer forma).

Os 10% finais: Revisão

Quando a execução terminar, traga o Fable de volta. Peça para ele revisar o resultado em relação à arquitetura original.

O resultado corresponde ao plano? Existem lacunas? Precisa de ajustes antes de publicar?

Essa passada final é onde a inteligência do Fable capta o que os modelos mais baratos perdem e, como está revisando um resultado finalizado em vez de gerar do zero, usa muito menos tokens do que usaria se tivesse feito a tarefa inteira sozinho.

Sistema 10-80-10

Esse é todo o framework 10-80-10 que permite obter todos os benefícios do Fable, sem os custos de tokens.

Modelos como o Opus 4.8 são igualmente capazes de lidar com a camada de execução, e esse sistema evita a tendência do Fable de querer deixar tudo "perfeito" com múltiplos loops, pesquisas aprofundadas, etc.

II: Loops Explicados

Vou fazer um artigo detalhado sobre isso, mas quero abordar rapidamente o /loop, já que é a forma mais poderosa de usar o Fable 5 atualmente.

Lance Martin (@RLanceMartin), engenheiro da Anthropic, publicou um guia sobre como projetar loops para modelos da classe Mythos.

Recomendo fortemente a leitura desse artigo, mas vou resumir abaixo.

https://x.com/RLanceMartin/status/2064397389189071163

O Jeito Antigo vs. O Jeito Novo de Criar Prompts

O jeito antigo de criar prompts era assim:

Você faz o prompt → Claude responde → Você revisa → Você faz um novo prompt → Repete

Nesse modelo, você é o loop.

Você verifica manualmente cada etapa de verificação, cada correção e cada acompanhamento.

Os loops automatizam todo esse processo e removem você como gargalo.

Com a engenharia de loops, você dá um objetivo ao Fable de antemão, e ele cria subagentes para trabalhar em direção a esse objetivo.

Projete o loop → O Fable cria subagentes de verificação → Os agentes fazem prompts para si mesmos para concluir o objetivo

Engenharia de prompts vs. engenharia de loops

/goal e /loop explicados

Esses dois comandos são a implementação prática da engenharia de loops dentro do Claude Code.

/goal é o ponto de partida.

ESTRUTURA DO PROMPT

/goal [tarefa] até [estado final mensurável] sem [restrições]

/loop leva isso um passo adiante.

Em vez de uma execução única, o /loop reexecuta o prompt em um intervalo predeterminado.

/loop [seu prompt aqui] --interval 30m --expires 8h

/goal vs. /loop

A combinação é extremamente poderosa.

Use /goal para definir a tarefa uma vez e use /loop para executá-la automaticamente no cronograma que fizer sentido para o trabalho.

Usando engenharia de loops na prática para gastar menos tokens

É aqui que o sistema 10-80-10 faz sua mágica.

Com o framework 10-80-10, o Fable lida com os 10% de planejamento inicial, arquitetando o loop; o modelo mais barato lida com os 80% de execução; e o Fable só volta quando o loop é fechado ou quando necessário.

Você pode até usar o GPT-5.5 na camada de execução, o que pode reduzir os gastos com tokens em 50% ou mais.

III: Dicas Gerais para Economizar Tokens

O sistema 10-80-10 e os loops cuidam da eficiência macro — estes são os ajustes menores que também podem fazer diferença.

Seleção de Esforço

Comece com esforço médio, não no máximo.

O Fable no médio supera o Opus no extra alto. Só aumente se estiver realmente enfrentando problemas de qualidade. Deixar no máximo em tudo é uma das formas mais rápidas de estourar seu limite.

Algumas pessoas até relatam usar o Fable no esforço baixo e obter resultados incríveis.

Exclua skills e instruções antigas

Prompts criados para modelos anteriores geralmente têm desempenho pior no Fable.

Instruções mais curtas e limpas têm melhor desempenho e custam menos dentro do Fable (o Fable vai descobrir as coisas sozinho de qualquer forma).

Dê ao Fable o "porquê" de tudo

O Fable acerta as coisas na primeira vez com mais frequência quando entende a intenção por trás da solicitação.

Menos correções e rodadas de iteração também significam muito menos tokens queimados.

Observe que este modelo foi construído para trabalho totalmente autônomo e, se você não der o "porquê" das coisas, ele precisa pensar mais para definir os próximos passos.

/usage

Monitore seu uso ativamente. Execute /usage no Claude Code regularmente. Quando o Fable migrar para pagamento por token em 7 de julho, isso se tornará essencial.

Escrevi um guia completo sobre prompts para o Fable 5 aqui — muitas das dicas mencionadas também vão reduzir seus gastos com tokens

https://x.com/aiedge_/status/2065064961999847849

IV: Erros Caros com o Fable

Estes são dois erros que vale a pena destacar especificamente porque são fáceis de passar despercebidos e podem sair caros se você não resolvê-los.

Erro 1: Usar o Fable sem querer.

Quando você abre o Claude Code ou o aplicativo Claude, agora ele usa o Fable por padrão.

A Anthropic está ativamente incentivando as pessoas a testar o modelo agora.

Conselho simples: Verifique o seletor de modelo antes de cada sessão. Já me peguei usando o Fable acidentalmente em conversas normais.

Erro 2: Sem limite de gastos

Em 7 de julho, o Fable sai das assinaturas padrão.

Se quiser continuar usando além do limite do seu plano, você precisará adicionar um cartão de crédito e pagar por token.

A armadilha é não ter um limite rígido no seu cartão de crédito.

O Fable queima tokens rapidamente em execuções autônomas e sessões longas. Sem um limite, você pode acumular uma conta significativa antes mesmo de perceber.

Você pode definir seu gasto mensal em Configurações → Uso → Ajustar Limite

Definir gasto mensal

Conclusão

Então, é isso.

Meu framework completo para reduzir significativamente os custos com tokens do Fable.

Espero que você tenha achado este artigo valioso.

Se gostou, não deixe de me seguir @milesdeutscher e @aiedge_ — toda semana publico guias práticos de IA para mantê-lo à frente neste espaço louco.

Como prometido, criei um documento que você pode enviar diretamente para o Fable para reduzir os gastos com tokens o mais rápido possível.

Documento do sistema 10-80-10 prévia

Para acessar o documento completo:

Inscreva-se gratuitamente na newsletter AI Edge
Entre na minha comunidade gratuita do Instagram para que eu possa enviá-lo para você

Comece por aqui.👇

https://www.aiedgehq.co/

https://www.aiedgehq.co/

Obrigado por ler até aqui.💙

Como usar o Claude Fable 5 sem ir à falência

Como reduzir seus custos com tokens do Fable 5 em mais de 50%

I: Sistema 10-80-10 Explicado

II: Loops Explicados

III: Dicas Gerais para Economizar Tokens

IV: Erros Caros com o Fable

Conclusão

Turn one viral article into a full content workflow

Artigos virais recentes

Como ganhar dinheiro com o Claude Fable 5 (Guia Completo)

Guia de Configuração do Claude Fable 5: Como Obter Qualidade Máxima com Custo Mínimo (Configuração Exata Inclusa)

Como construir um Segundo Cérebro com o Fable 5

Como usar o Claude Fable 5 sem ir à falência

A maioria das pessoas está usando o Claude de forma errada

Seus agentes de IA não conseguem se comunicar. Aqui está a solução de duas linhas.

Como usar o Claude Fable 5 sem ir à falência

Como reduzir seus custos com tokens do Fable 5 em mais de 50%

I: Sistema 10-80-10 Explicado

II: Loops Explicados

III: Dicas Gerais para Economizar Tokens

IV: Erros Caros com o Fable

Conclusão

Turn one viral article into a full content workflow

Transforme seu Markdown em um artigo 𝕏 impecável

Artigos virais recentes

Como ganhar dinheiro com o Claude Fable 5 (Guia Completo)

Guia de Configuração do Claude Fable 5: Como Obter Qualidade Máxima com Custo Mínimo (Configuração Exata Inclusa)

Como construir um Segundo Cérebro com o Fable 5

Como usar o Claude Fable 5 sem ir à falência

A maioria das pessoas está usando o Claude de forma errada

Seus agentes de IA não conseguem se comunicar. Aqui está a solução de duas linhas.