Usando o Claude Code: Gerenciamento de Sessão e Contexto de 1M

@trq212
INGLÊShá 3 meses · 15/04/2026
2.4M
8.5K
1.0K
288
16.0K

TL;DR

Este guia explica como otimizar o desempenho do Claude Code gerenciando sua ampla janela de contexto por meio de técnicas como retrocesso, compactação e utilização de subagentes.

Nas minhas conversas recentes com usuários do Claude Code, um tema sempre aparece: a janela de contexto de 1 milhão de tokens é uma faca de dois gumes.

Ela permite que o Claude Code opere de forma autônoma por mais tempo e lide com tarefas de forma mais confiável, mas também abre espaço para poluição de contexto se você não for cuidadoso ao gerenciar suas sessões.

O gerenciamento de sessão é mais importante do que nunca e parece haver muitas dúvidas sobre isso. Você mantém uma sessão aberta no terminal, ou duas? Começa do zero a cada prompt? Quando usar compact, rewind ou subagentes? O que causa um compact ruim?

Há uma quantidade surpreendente de detalhes aqui que podem realmente moldar sua experiência com o Claude Code, e quase tudo vem do gerenciamento da sua janela de contexto.

Um Guia Rápido sobre Contexto, Compactação e Deterioração do Contexto

Thariq - inline image

A janela de contexto é tudo o que o modelo pode "ver" de uma vez ao gerar sua próxima resposta. Inclui seu prompt de sistema, a conversa até agora, cada chamada de ferramenta e sua saída, e cada arquivo que foi lido. O Claude Code tem uma janela de contexto de um milhão de tokens.

Infelizmente, usar contexto tem um custo sutil, que é frequentemente chamado de deterioração do contexto. A deterioração do contexto é a observação de que o desempenho do modelo degrada à medida que o contexto cresce, porque a atenção se espalha por mais tokens, e conteúdo mais antigo e irrelevante começa a distrair da tarefa atual. Para nosso modelo de 1MM de contexto, vemos algum nível de deterioração do contexto por volta de ~300-400k tokens, mas isso depende muito da tarefa – não é uma regra fixa.

As janelas de contexto são um limite rígido. Portanto, quando você estiver se aproximando do final da janela de contexto, precisará resumir a tarefa em que estava trabalhando em uma descrição menor e continuar o trabalho em uma nova janela de contexto. Chamamos isso de compactação. Você também pode acionar a compactação manualmente.

Thariq - inline image

Cada Turno é um Ponto de Ramificação

Digamos que você acabou de pedir ao Claude para fazer algo e ele terminou. Agora você tem algumas informações no seu contexto (chamadas de ferramenta, saídas de ferramenta, suas instruções) e tem um número surpreendente de opções sobre o que fazer a seguir:

  • Continuar — enviar outra mensagem na mesma sessão
  • /rewind (esc esc) — voltar para uma mensagem anterior e tentar novamente a partir dali
  • /clear — iniciar uma nova sessão, geralmente com um resumo do que você acabou de aprender
  • Compact — resumir a sessão até agora e continuar em cima do resumo
  • Subagentes — delegar o próximo bloco de trabalho a um agente com seu próprio contexto limpo, e trazer apenas o resultado de volta

Embora o mais natural seja apenas continuar, as outras quatro opções existem para ajudar a gerenciar seu contexto.

Thariq - inline image

Quando Iniciar uma Nova Sessão

A nova janela de contexto de 1M significa que agora você pode fazer tarefas mais longas de forma mais confiável, por exemplo, fazer com que ele construa um aplicativo full-stack do zero. Mas só porque seu modelo não ficou sem contexto, não significa que você não deva iniciar uma nova sessão.

Nossa regra geral é: quando você inicia uma nova tarefa, também deve iniciar uma nova sessão.

Uma área cinzenta é quando você pode querer fazer tarefas relacionadas onde parte do contexto ainda é necessária, mas não todo.

Por exemplo, escrever a documentação para um recurso que você acabou de implementar. Embora você pudesse iniciar uma nova sessão, o Claude teria que reler os arquivos que você acabou de implementar, o que seria mais lento e mais caro. Como a documentação pode não ser uma tarefa de alta sensibilidade intelectual, o contexto extra provavelmente vale o ganho de eficiência de não ter que reler os arquivos relevantes novamente.

Rebobinar em Vez de Corrigir

Thariq - inline image

Se eu tivesse que escolher um hábito que sinaliza um bom gerenciamento de contexto, seria o rewind.

No Claude Code, tocar duas vezes em Esc (ou executar /rewind) permite que você volte para qualquer mensagem anterior e faça um novo prompt a partir dali. As mensagens após esse ponto são descartadas do contexto.

O rewind geralmente é a melhor abordagem para correção. Por exemplo, o Claude lê cinco arquivos, tenta uma abordagem e não funciona. Seu instinto pode ser digitar "isso não funcionou, tente X em vez disso." Mas a melhor jogada é rebobinar para logo após a leitura dos arquivos e fazer um novo prompt com o que você aprendeu. "Não use a abordagem A, o módulo foo não expõe isso — vá direto para B."

Você também pode usar “resumir daqui” para fazer o Claude resumir seus aprendizados e criar uma mensagem de transferência, como uma mensagem para a iteração anterior do Claude vinda de seu eu futuro que tentou algo e não funcionou.

Thariq - inline image

Compactar vs. Sessões Novas

Quando uma sessão fica longa, você tem duas maneiras de reduzir o peso: /compact ou /clear (e começar do zero). Eles parecem semelhantes, mas se comportam de forma muito diferente.

Compact pede ao modelo para resumir a conversa até agora e, em seguida, substitui o histórico por esse resumo. É com perdas; você está confiando que o Claude decidirá o que foi importante, mas você não precisou escrever nada e o Claude pode ser mais minucioso ao incluir aprendizados ou arquivos importantes. Você também pode direcioná-lo passando instruções (/compact foco na refatoração de autenticação, descarte a depuração de teste).

Thariq - inline image

Com /clear, *você* escreve o que importa ("estamos refatorando o middleware de autenticação, a restrição é X, os arquivos que importam são A e B, descartamos a abordagem Y") e começa do zero. Dá mais trabalho, mas o contexto resultante é o que você decidiu que era relevante.

O Que Causa um Compact Ruim?

Thariq - inline image

Se você executa muitas sessões longas, pode ter notado momentos em que a compactação pode ser particularmente ruim. Nesse caso, frequentemente descobrimos que compacts ruins podem acontecer quando o modelo não consegue prever a direção do seu trabalho.

Por exemplo, o autocompact é acionado após uma longa sessão de depuração e resume a investigação, e sua próxima mensagem é "agora corrija aquele outro aviso que vimos em bar.ts."

Mas como a sessão estava focada na depuração, o outro aviso pode ter sido descartado do resumo.

Isso é particularmente difícil, porque devido à deterioração do contexto, o modelo está em seu ponto menos inteligente ao compactar. Com um milhão de contexto, você tem mais tempo para /compact proativamente com uma descrição do que deseja fazer.

Subagentes e Janelas de Contexto Novas

Thariq - inline image

Subagentes são uma forma de gerenciamento de contexto, útil quando você sabe de antemão que um bloco de trabalho produzirá muita saída intermediária da qual não precisará novamente.

Quando o Claude gera um subagente por meio da ferramenta Agent, esse subagente recebe sua própria janela de contexto nova. Ele pode fazer todo o trabalho necessário e, em seguida, sintetizar seus resultados para que apenas o relatório final volte para o agente pai.

O teste mental que usamos: vou precisar dessa saída da ferramenta novamente, ou apenas da conclusão?

Embora o Claude Code chame subagentes automaticamente, você pode querer dizer a ele para fazer isso explicitamente. Por exemplo, você pode querer dizer a ele para:

  • “Criar um subagente para verificar o resultado deste trabalho com base no seguinte arquivo de especificação”
  • “Criar um subagente para ler esta outra base de código e resumir como ela implementou o fluxo de autenticação, depois implemente você mesmo da mesma forma”
  • “Criar um subagente para escrever a documentação sobre este recurso com base nas minhas alterações do git”

Resumo

Em resumo, quando o Claude termina um turno e você está prestes a enviar uma nova mensagem, você tem um ponto de decisão.

Com o tempo, esperamos que o Claude o ajude a lidar com isso sozinho, mas por enquanto, esta é uma das maneiras de guiar a saída do Claude.

Thariq - inline image
Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Mais padrões para decifrar

Artigos virais recentes

Explorar mais artigos virais