Análise Profunda do Claude Code: Arquitetura, Governança e Práticas de Engenharia

@HiTw93
CHINÊShá 4 meses · 12/03/2026
2.9M
8.6K
2.0K
191
17.2K

TL;DR

Um guia abrangente para otimizar o Claude Code, cobrindo sua arquitetura de seis camadas, engenharia de contexto e o uso estratégico de Skills, Hooks e Subagents para construir fluxos de trabalho de IA estáveis.

0. TL;DR

Este artigo é fruto de seis meses de uso intensivo do Claude Code e das lições aprendidas ao gastar $40/mês em duas contas. Espero fornecer uma contribuição valiosa para todos.

Inicialmente, usei como ChatBot, mas logo percebi que as coisas estavam dando errado: o contexto ficava confuso, as ferramentas aumentavam mas a eficácia diminuía, e as regras eram ignoradas apesar de serem mais longas. Depois de pesquisar o próprio Claude Code, percebi que não era um problema de Prompt, mas sim de design do sistema.

Quero discutir: como o Claude Code funciona internamente, por que o contexto fica confuso e como governá-lo, como projetar Skills e Hooks, o uso correto de Subagentes, o impacto arquitetural do Prompt Caching e como escrever um CLAUDE.md verdadeiramente útil.

A maneira mais direta de entender é dividir o Claude Code em seis camadas:

Tw93 - inline image

Fortalecer apenas uma camada causa desequilíbrio. Se o CLAUDE.md for muito longo, polui o contexto; muitas ferramentas causam confusão; muitos subagentes levam à deriva de estado; pular a verificação impossibilita encontrar onde as coisas falharam.

1. Como funciona internamente

Tw93 - inline image

O núcleo do Claude Code não é "responder", mas um loop agêntico repetitivo:

text
1Coletar Contexto → Agir → Verificar Resultado → [Finalizar ou Repetir]
2 ↑ ↓
3 CLAUDE.md Hooks / Permissões / Sandbox
4 Skills Ferramentas / MCP
5 Memória

Percebi que os gargalos raramente são devidos ao modelo não ser inteligente o suficiente, mas sim por fornecer o contexto errado ou não ter como julgar se a saída está correta ou reverter.

Cinco camadas para focar:

Tw93 - inline image

Olhar para essas camadas facilita a resolução de problemas. Resultados instáveis? Verifique a ordem de carregamento do contexto. Automação fora de controle? Verifique a camada de controle. Qualidade decaindo em sessões longas? Produtos intermediários poluíram o contexto; iniciar uma nova sessão é melhor do que ajustar prompts.

2. Limites Conceituais: MCP / Plugin / Ferramentas / Skills / Hooks / Subagentes

Tw93 - inline image

Regra simples: Use Ferramentas/MCP para novas ações, Skills para fluxos de trabalho, Subagentes para ambientes isolados, Hooks para restrições/auditoria obrigatórias e Plugins para distribuição entre projetos.

3. Engenharia de Contexto: A Restrição Mais Importante do Sistema

Muitos tratam o contexto como uma "questão de capacidade", mas o gargalo geralmente é o ruído. Informações úteis são enterradas em conteúdo irrelevante.

Composição Real do Custo do Contexto

Tw93 - inline image

O contexto de 200K do Claude Code não está totalmente disponível:

text
1200K Contexto Total
2├── Sobrecarga Fixa (~15-20K)
3│ ├── Instruções do sistema: ~2K
4│ ├── Descritores de Skill: ~1-5K
5│ ├── Definições de ferramentas do servidor MCP: ~10-20K ← O maior vilão oculto
6│ └── Estado LSP: ~2-5K
7
8├── Semifixo (~5-10K)
9│ ├── CLAUDE.md: ~2-5K
10│ └── Memória: ~1-2K
11
12└── Dinâmico Disponível (~160-180K)
13 ├── Histórico do chat
14 ├── Conteúdo de arquivos
15 └── Resultados de ferramentas
Tw93 - inline image

Um servidor MCP típico (como GitHub) contém 20-30 definições de ferramentas, cada uma com ~200 tokens, totalizando 4.000-6.000 tokens. Conectar 5 servidores consome 25.000 tokens (12,5%). Isso é crítico ao ler grandes quantidades de código.

Camadas de Contexto Recomendadas

text
1S="text">
2Sempre Residente → CLAUDE.md: Contrato do projeto / comandos de build / proibições
3Baseado em Caminho → rules: Regras específicas de idioma / diretório / tipo de arquivo
4Sob Demanda → Skills: Fluxos de trabalho / conhecimento de domínio
5Isolado → Subagentes: Exploração em larga escala / pesquisa paralela
6Fora do Contexto → Hooks: Scripts determinísticos / auditoria / bloqueio

Não carregue coisas que você usa apenas ocasionalmente.

Melhores Práticas de Contexto

  • Mantenha o CLAUDE.md curto, direto e executável. O da própria Anthropic tem ~2,5K tokens.
  • Mova documentos de referência grandes para arquivos de suporte das Skills.
  • Use .claude/rules/ para regras de caminho/idioma.
  • Use /context para monitorar o consumo.
Tw93 - inline image
  • Use /clear para trocar de tarefa e /compact para novas fases.
  • Escreva Instruções Compactas no CLAUDE.md para controlar o que é preservado.

Ruído de Saída de Ferramentas: Outro Vilão Oculto

A saída dinâmica de ferramentas (como cargo test ou git log) pode facilmente preencher o contexto. O Claude não precisa ver tudo.

RTK (Rust Token Killer) é uma boa abordagem: ele filtra a saída do comando antes de chegar ao Claude. Por exemplo, pode condensar milhares de linhas de saída de teste em uma única mensagem de sucesso.

Armadilhas de Compressão

A compressão padrão pode excluir decisões de arquitetura e restrições.

Tw93 - inline image

Solução: Especifique Instruções Compactas no CLAUDE.md para priorizar decisões de arquitetura, arquivos modificados, status de verificação e TODOs.

Outra solução proativa: Peça ao Claude para escrever um HANDOFF.md antes de iniciar uma nova sessão para explicar o progresso e becos sem saída.

Valor de Engenharia do Modo Plano

Tw93 - inline image

O Modo Plano separa a exploração da execução.

Tw93 - inline image

Para refatorações complexas, isso é melhor do que sair programando. Dica avançada: Use um Claude para escrever o plano e outro como "Engenheiro Sênior" para revisá-lo.

4. Design de Skills: Fluxos de Trabalho Carregados Sob Demanda

Skills são conhecimento e fluxos de trabalho sob demanda.

O que faz uma boa Skill

  • A descrição deve dizer "quando me usar", não "o que eu faço".
  • Tenha etapas completas, entradas, saídas e condições de parada.
  • Mantenha o corpo principal para navegação e restrições principais; mova detalhes para arquivos de suporte.
  • Defina disable-model-invocation: true para skills com efeitos colaterais.

Divulgação Progressiva

O Claude Code enfatiza a "divulgação progressiva": primeiro forneça índices e navegação, depois busque detalhes conforme necessário.

Três Tipos Típicos de Skill

  1. Checklist (Portão de Qualidade): ex.: release-check.
  2. Fluxo de Trabalho (Operações Padronizadas): ex.: config-migration com rollback.
  3. Especialista de Domínio (Estrutura de Decisão): ex.: runtime-diagnosis.

Mantenha os descritores curtos para economizar espaço no contexto.

5. Design de Ferramentas: Ajudando o Claude a Escolher Corretamente

Ferramentas para agentes devem focar na facilidade de uso correto, não na completude de funcionalidades.

Ferramentas Boas vs. Ruins

Tw93 - inline image

Princípios de design: Use prefixos (github_pr_*), suporte formatos concisos, forneça mensagens de erro úteis e evite expor muitas ferramentas fragmentadas.

Evolução das Ferramentas Internas

Tw93 - inline image

A evolução da ferramenta "AskUserQuestion" mostra que uma ferramenta dedicada é mais estável do que formatação markdown ou parâmetros de saída.

Tw93 - inline image
Tw93 - inline image

Ferramentas de Todo se tornaram uma "amarra" conforme os modelos ficaram mais fortes. Ferramentas de busca evoluíram de RAG para Grep para melhor flexibilidade e "divulgação progressiva".

6. Hooks: Lógica Obrigatóris Antes/Depois das Operações

Hooks recuperam o controle determinístico sobre processos como formatação, proteção de arquivos e notificações.

Tw93 - inline image

Adequados para Hooks

Bloqueio de arquivos protegidos, autoformatação após edições, injeção de contexto dinâmico (branch Git) e notificações.

Detecção Precoce de Erros

Tw93 - inline image

7. Subagentes: Instâncias Independentes do Claude

Subagentes fornecem isolamento. Tarefas como escanear repositórios ou executar testes produzem saídas massivas que não devem poluir o thread principal.

Restrições Explícitas

Limite ferramentas, escolha o modelo certo (Haiku para exploração, Opus para revisão) e defina maxTurns.

8. Prompt Caching: O Núcleo da Arquitetura do Claude Code

O Claude Code é construído em torno do Prompt Caching. Altas taxas de acerto economizam dinheiro e aumentam os limites de taxa.

Layout do Prompt para Cache

Tw93 - inline image

A ordem importa para correspondência de prefixo: Prompt do Sistema → Definições de Ferramentas → Histórico do Chat → Entrada do Usuário.

Não Troque de Modelos no Meio da Sessão

Trocar de modelos quebra o cache. Use Subagentes para transferências.

Implementação da Compactação

Tw93 - inline image

A compactação usa um fork para resumir o histórico a 1/10 do custo devido a acertos de cache.

9. Loops de Verificação: Sem Verificador, Sem Agente de Engenharia

"Claude diz que está pronto" é inútil sem verificação. Defina a verificação explicitamente no Prompt, Skill e CLAUDE.md.

10. Comandos de Alta Frequência

Comandos como /context, /clear, /compact e /memory ajudam a gerenciar o contexto ativamente.

Governança e Paralelismo

Tw93 - inline image

Comandos ocultos úteis: /simplify (revisão de código), /rewind (checkpointing), /btw (perguntas paralelas), /insight (analisar sessão para atualizações do CLAUDE.md).

11. Como Escrever um Bom CLAUDE.md

É um contrato, não uma base de conhecimento.

Tw93 - inline image

Inclua comandos de build/teste, limites da arquitetura, convenções de código, barreiras de segurança e Instruções Compactas. Peça ao Claude para atualizar o CLAUDE.md depois de corrigir seus erros.

12. Experiências Recentes

Lições da construção do Kaku (Rust + Lua): a transparência do ambiente é vital (use um comando 'doctor'), e Hooks são ótimos para projetos multilíngues.

13. Antipadrões

Tw93 - inline image

14. Verificação de Saúde

Use npx skills add tw93/claude-health para verificar sua configuração.

15. Conclusão

Tw93 - inline image

O foco muda de "como usar recursos" para "como deixar o agente operar sob restrições". Se você não consegue definir "pronto", a tarefa não está pronta para um agente.

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Mais padrões para decifrar

Artigos virais recentes

Explorar mais artigos virais