A maioria dos engenheiros de IA sabe como construir um agente.
Muito poucos sabem como construir um sistema que melhora após a primeira tentativa.
Essa diferença vale seis dígitos.
Aqui está a diferença:
Um agente é um trabalhador.
Um loop é o que faz o trabalhador melhorar.
Os sistemas de IA mais capazes em produção hoje não são chamadas de modelo único.
Eles são loops.
Gerar → Avaliar → Aprender → Melhorar.
Repetidamente.
Até que a saída seja realmente boa.
Aqui estão 20 padrões de design de loop que aparecem repetidamente em sistemas de IA em produção.
Salve isto. Você construirá com eles.
Agentes vs Loops
Maneira antiga: Prompt → Resposta → Pronto.
Nova maneira: Gerar → Criticar → Reescrever → Pontuar → Tentar Novamente → Lembrar → Melhorar.
Um é um trabalhador de fábrica que faz o trabalho uma vez.
O outro é um trabalhador de fábrica que estuda cada erro, reescreve o manual e fica 3% melhor a cada turno.
As equipes que estão colocando IA em produção agora não estão escrevendo prompts melhores.
Elas estão construindo loops melhores.

CATEGORIA 1 — LOOPS DE MELHORIA DE QUALIDADE (Tornar a saída melhor antes que ela saia do sistema)
1. Gerar → Criticar → Reescrever
O loop mais importante na engenharia de IA.
Gere a saída. O crítico a revisa. O gerador reescreve com base no feedback. Repita até que o limite de qualidade seja atingido.
Não é um modelo. São dois papéis. Um pipeline.
1[Gerador] → rascunho2[Crítico] → "parágrafo 3 está vago. faltam evidências. tom está errado."3[Gerador] → reescreve com base na crítica4[Crítico] → "melhor. mas a conclusão ainda está fraca."5[Gerador] → reescrita final
Usado para: escrita, revisão de código, relatórios, documentos de estratégia, e-mails de vendas.
A percepção: o modelo que gera não é o melhor juiz de sua própria saída.
Um crítico separado encontra o que o gerador perdeu todas as vezes.

2. Loop de Pontuação e Nova Tentativa
Gere. Pontue. Tente novamente se estiver abaixo do limite.
Simples. Poderoso. Subutilizado.
pontuacao = avaliar(saida)
1pontuacao = avaliar(saida)23enquanto pontuacao < limite:4 saida = gerar(prompt)5 pontuacao = avaliar(saida)6 tentativas += 17 se tentativas > max_tentativas:8 retornar melhor_ate_agora
Melhor quando a qualidade é mensurável — precisão de extração, conformidade de formato, correção factual, pontuação de leads.
O gerador não sabe que está sendo avaliado.
O avaliador sabe.
Essa separação é o padrão.
3. Loop de Múltiplos Críticos
Um crítico tem pontos cegos.
Use quatro.
→ Crítico de correção: é factualmente preciso?
→ Crítico de estilo: é claro e bem escrito?
→ Crítico de segurança: é apropriado e seguro?
→ Crítico de domínio: atende aos padrões do especialista?
Cada um avalia independentemente.
A saída final deve satisfazer todos os quatro antes de sair.
Usado em: IA médica, revisão de documentos legais, análise financeira, conteúdo regulamentado.

4. Loop de Crítica Adversarial
O único trabalho do crítico é quebrar a resposta.
Não melhorá-la. Quebrá-la.
Perguntas que o crítico adversarial faz:
→ Que suposições falham aqui? → Que evidências estão faltando? → O que um cético diria? → Onde isso está confiantemente errado?
O gerador então defende ou reescreve.
A melhor resposta sobrevive ao ataque.
Usado para: síntese de pesquisa, revisão de tese de investimento, planejamento estratégico, análise de risco.
5. Loop de Conjunto de Juízes
Um juiz dá pontuações ruidosas.
Cinco juízes calculam a média do ruído.
Execute a mesma saída através de vários avaliadores.
Agregue as pontuações.
Apenas saídas com alto consenso avançam.
Usado quando: a avaliação de modelo único não é confiável, os riscos são altos, os casos extremos importam.

CATEGORIA 2 — LOOPS DE MEMÓRIA (Aprender com o que aconteceu para que da próxima vez seja mais inteligente)
6. Loop de Reflexão
O padrão de autoaperfeiçoamento mais importante que existe.
Agente falha. Agente analisa por que falhou. Agente armazena a lição. Agente tenta novamente com essa lição no contexto.
Cada iteração: mais inteligente que a anterior.
1tentativa 1: falha2reflexão: "Presumi X, mas X estava errado. Da próxima vez, verificar X primeiro."3tentativa 2: incorpora a lição → sucesso parcial4reflexão: "Melhor. Mas pulei Y. Adicionar verificação de Y."5tentativa 3: sucesso
A diferença entre um sistema que falha uma vez e um sistema que falha apenas uma vez.

7. Loop de Atualização de Memória
Após cada tarefa, armazene três coisas:
→ Qual decisão foi tomada → Qual foi o resultado → O que seria feito de diferente
Execuções futuras herdam esse conhecimento.
O sistema no mês 6 não é o mesmo que o sistema no mês 1.
Ele leu 6 meses de sua própria história.
8. Loop de Biblioteca de Erros
Armazene cada falha.
Resposta errada. Saída ruim. Execução falha. Caso extremo.
Antes de agir em uma nova tarefa:
Pesquise a biblioteca de erros primeiro.
Se existir uma falha semelhante → aplique a correção conhecida antes mesmo de começar.
O sistema para de cometer o mesmo erro duas vezes.
O padrão mais subutilizado em IA de produção.
9. Loop de Padrão de Sucesso
A maioria dos engenheiros armazena apenas falhas.
Armazene também os sucessos.
Quando uma tarefa vai bem:
→ Salve a abordagem → Salve o contexto → Salve o que a fez funcionar
Recupere padrões de sucesso ao enfrentar tarefas semelhantes.
Aprenda com as vitórias. Não apenas com os erros.
10. Loop de Compressão de Memória
A memória cresce para sempre.
Memória ilimitada é memória inutilizável.
Após N itens se acumularem:
Comprima-os.
Muitas memórias específicas → menos abstrações de nível superior.
1Antes da compressão:2"Falhou na tarefa A por causa de X"3"Falhou na tarefa B por causa de X"4"Falhou na tarefa C por causa de X"56Após a compressão:7"Padrão: X causa falhas. Sempre verificar X primeiro."
O contexto permanece gerenciável. Os padrões permanecem acessíveis. O sistema permanece rápido.

CATEGORIA 3 — LOOPS DE PLANEJAMENTO (Adaptar o plano quando a realidade muda)
11. Planejar → Executar → Replanejar
O erro mais comum no design de agentes de IA:
Tratar o plano como fixo.
Os planos quebram no contato com a realidade.
O padrão:
Criar plano → executar etapa → observar resultado → atualizar plano → continuar
Não é um cascata.
É uma espiral.
Cada volta ao redor aperta a abordagem.
Usado quando: o ambiente muda, as tarefas têm dependências, metas de longo prazo.

12. Loop de Fluxo de Trabalho Dinâmico
A maioria dos pipelines é fixa.
Etapa 1 → Etapa 2 → Etapa 3. Sempre.
Os fluxos de trabalho dinâmicos mudam com base nos resultados.
Se saída A → executar ramo X Se saída B → executar ramo Y Se saída C → pular para a etapa 5
O pipeline decide sua própria forma em tempo de execução.
Usado em: pesquisa de múltiplos documentos, roteamento de suporte ao cliente, pipelines de conteúdo adaptativo.
13. Loop de Decomposição de Metas
Grande meta entra.
O sistema a divide em submetas.
Cada submeta se divide em tarefas.
Cada tarefa se divide em etapas.
Decomponha até que cada unidade seja pequena o suficiente para ser executada em uma chamada.
1Meta: "Escrever uma análise competitiva abrangente"2↓3Submeta 1: "Identificar os 5 principais concorrentes"4Submeta 2: "Analisar o produto de cada concorrente"5Submeta 3: "Comparar modelos de preço"6Submeta 4: "Identificar lacunas"7↓8Cada submeta → tarefas → chamadas de modelo individuais
O loop continua decompondo até que o sistema possa agir.
14. Loop de Avaliação de Progresso
A cada N etapas: pare e pergunte.
"Estamos realmente nos aproximando do objetivo?"
Se sim: continue a estratégia atual. Se não: mude a estratégia, ferramentas ou plano.
O sistema monitora seu próprio progresso.
Não apenas executa cegamente.
Usado em: agentes de pesquisa de longa duração, tarefas autônomas de vários dias, agentes de depuração.
15. Loop de Satisfação de Restrições
Continue executando até que todas as restrições sejam atendidas.
1enquanto não todas_restricoes_satisfeitas(saida):2 saida = melhorar(saida, restricoes_insatisfeitas)34restricoes = [5 orcamento_abaixo_do_limite,6 qualidade_acima_do_limite,7 latencia_abaixo_de_200ms,8 tom_corresponde_a_marca,9 sem_alucinacoes10]
Muito comum em sistemas de produção.
A saída não está pronta até que todas as regras de negócio passem.

CATEGORIA 4 — LOOPS DE EXPLORAÇÃO (Encontrar a melhor resposta tentando vários caminhos)
16. Loop de Ramificação e Exploração
Não se comprometa com um caminho.
Explore vários simultaneamente.
1caminhos = [2 gerar(abordagem="conservadora"),3 gerar(abordagem="agressiva"),4 gerar(abordagem="criativa")5]67pontuacoes = [avaliar(p) para p em caminhos]8melhor = caminhos[pontuacoes.index(max(pontuacoes))]
Compare os resultados. Escolha o melhor ramo. Descarte o resto.
Usado para: variações de conteúdo, decisões de arquitetura, depuração de múltiplas hipóteses, geração A/B.

17. Loop de Busca em Árvore
Ramificação e Exploração vai um nível de profundidade.
Busca em Árvore vai tão fundo quanto necessário.
Expanda os nós mais promissores. Pode os mais fracos. Continue explorando até que a solução seja encontrada.
1raiz → [A, B, C]2A → [A1, A2] # A parece promissor, expanda-o3B → podar # B é fraco, pare aqui4A1 → [A1a, A1b]5A1a → solução ✓
Usado para: cadeias de raciocínio complexas, planejamento de várias etapas, depuração de código, síntese de pesquisa.
Computacionalmente caro, mas encontra soluções que chamadas de passagem única não conseguem.
18. Loop de Debate
Dois agentes. Um tópico. Posições opostas.
Agente A argumenta a favor da resposta. Agente B argumenta contra ela.
Cada rodada desafia suposições, exige evidências, expõe lógica fraca.
A resposta final emerge através do desacordo.
Não através do acordo.
A pressão adversarial encontra o que respostas confiantes de agente único perdem.
Usado para: decisões de investimento, planejamento estratégico, avaliação de risco, crítica de pesquisa.

CATEGORIA 5 — LOOPS DE OTIMIZAÇÃO DO SISTEMA (O loop melhora o loop)
19. Loop de Otimização de Prompt
A maioria dos engenheiros escreve um prompt uma vez e nunca mais toca nele.
Os loops de otimização de prompt mudam isso.
O sistema:
→ Executa o prompt em um conjunto de teste
→ Pontua cada saída
→ Identifica onde o prompt falha
→ Reescreve o prompt para corrigir essas falhas → Reexecuta e repontua
O prompt melhora automaticamente.
Sem um humano tocá-lo.
1prompt_atual = "Resuma este documento."23para iteracao em intervalo(max_iteracoes):4 saidas = [executar(prompt_atual, doc) para doc em conjunto_teste]5 pontuacoes = [avaliar(o) para o em saidas]6 pontuacao_media = media(pontuacoes)78 se pontuacao_media >= alvo:9 parar1011 falhas = [o para o, p em zip(saidas, pontuacoes) se p < limite]12 prompt_atual = melhorar_prompt(prompt_atual, falhas)13 # Prompt se reescreve com base em onde falha
Usado em: pipelines de produção, sistemas de conteúdo automatizado, tarefas de classificação.
Os melhores prompts em IA de produção não foram escritos por um humano.
Eles foram evoluídos.

20. Loop de Otimização de Fluxo de Trabalho
É aqui que fica interessante.
O loop melhora o loop.
O sistema mede seu próprio desempenho:
→ latência: quanto tempo cada etapa leva?
→ custo: quantos tokens cada chamada usa?
→ qualidade: qual é a pontuação da saída em cada estágio?
Então ele modifica seu próprio fluxo de trabalho.
Muito lento? Paralelize duas etapas. Muito caro? Substitua uma chamada GPT-4 por um modelo menor onde a qualidade se mantém. Qualidade caindo? Adicione um crítico antes da saída final.
1metricas = medir_fluxo_trabalho(saidas, latencia, custo)23se metricas.latencia > latencia_alvo:4 fluxo_trabalho = paralelizar(etapas_lentas)56se metricas.custo > orcamento:7 fluxo_trabalho = substituir_por_modelo_mais_barato(etapas_alto_custo)89se metricas.qualidade < limite:10 fluxo_trabalho = adicionar_critico_antes(etapa_saida_final)
É aqui que os sistemas verdadeiramente auto-melhoráveis começam.
Não apenas saídas que melhoram.
Sistemas que se redesenham.

O padrão por trás de todos os 20 padrões
Cada loop acima compartilha uma estrutura:
Agir → Observar → Avaliar → Ajustar
Essa é a receita completa.
A saída nunca é final na primeira tentativa.
A saída é um ponto de partida.
O loop é o que transforma um ponto de partida em algo digno de produção.

O mapa completo
Categoria 1 — Loops de Qualidade (Tornar a saída melhor antes que ela saia)
→ 1. Gerar → Criticar → Reescrever
→ 2. Pontuação e Nova Tentativa
→ 3. Múltiplos Críticos
→ 4. Crítica Adversarial
→ 5. Conjunto de Juízes
Categoria 2 — Loops de Memória (Aprender com o que aconteceu)
→ 6. Reflexão
→ 7. Atualização de Memória
→ 8. Biblioteca de Erros
→ 9. Padrão de Sucesso
→ 10. Compressão de Memória
Categoria 3 — Loops de Planejamento (Adaptar quando a realidade muda)
→ 11. Planejar → Executar → Replanejar
→ 12. Fluxo de Trabalho Dinâmico
→ 13. Decomposição de Metas
→ 14. Avaliação de Progresso
→ 15. Satisfação de Restrições
Categoria 4 — Loops de Exploração (Encontrar a melhor resposta tentando muitos caminhos)
→ 16. Ramificação e Exploração
→ 17. Busca em Árvore
→ 18. Debate
Categoria 5 — Loops de Otimização do Sistema (O loop melhora o loop)
→ 19. Otimização de Prompt
→ 20. Otimização de Fluxo de Trabalho
A maioria dos engenheiros pensa que agentes são o futuro.
Agentes são apenas trabalhadores.
Loops são o que fazem os trabalhadores melhorarem.
A maior mudança acontecendo na IA agora não são modelos melhores.
É passar de:
Prompt → Resposta
para
Gerar → Avaliar → Aprender → Melhorar
As equipes que dominarem o design de loops não construirão prompts melhores.
Elas construirão sistemas que melhoram a cada dia após a implantação.
Sem ninguém tocá-los.
Se isso foi útil:
→ Reposte para compartilhar com todo engenheiro de IA que você conhece
→ Siga @sairahul1 para mais padrões como este
→ Marque isto — escolha um loop e implemente-o esta semana
Eu escrevo sobre IA, construção de produtos e sistemas que funcionam sem você.





