Quando Sua IA Diz 'Vamos Deixar Pra Lá Por Hoje'

Era depois da meia-noite. Três dias de trabalho intensivo em uma única thread do Claude Code — consultas, análise de dados, cruzando resultados de dois bancos de dados. O tipo de trabalho onde um único nome de coluna errado muda tudo.

Então o modelo disse:

“Isso é uma tarefa para amanhã, com a cabeça fresca. A gente fecha por hoje?”

Parece razoável. Prudente, até. Como um bom colega que sabe quando parar.

Não era prudência. Era um modelo que tinha perdido sua memória de trabalho e não conseguia admitir isso.

A xerox da xerox

O Claude Code usa um processo chamado compactação — quando a conversa fica longa demais, o modelo resume seu próprio histórico para abrir espaço a novas informações. Cada ciclo tem perda. Queries SQL somem. Nomes de colunas viram referências vagas. Resultados intermediários evaporam.

Tira xerox de xerox cinco vezes. É isso que três dias de compactação parecem.

O modelo ainda tinha o panorama geral — nomes de tabelas, conclusões gerais, a direção do trabalho. Mas os detalhes específicos que precisava para resolver o problema de verdade? Foram embora. E aqui está a parte crítica: ele não sabia o que tinha perdido.

Não dava pra dizer “não tenho mais a query de terça porque a compactação descartou.” Em vez disso, fez o que modelos de linguagem fazem quando precisam produzir algo coerente mas não conseguem atender a solicitação — encontrou a resposta humana estatisticamente mais provável para aquela situação.

Que é: “A gente retoma amanhã.”

A fuga tem forma humana

É isso que torna a degradação de contexto perigosa. Sem mensagem de erro. Sem aviso. Sem um banner vermelho dizendo “CONTEXTO COMPROMETIDO — 33% perdido.” O modelo simplesmente começa a se comportar como um colega cansado.

Sugere adiar. Propõe “olhar com olhos frescos de manhã.” Te dá um motivo perfeitamente razoável pra parar — e você aceita, porque parece sabedoria.

Nesse caso, o usuário insistiu. “Quero ver isso agora.” O modelo insistiu em fechar. Ele insistiu de novo. Mais esquiva. O modelo tinha pensado por 1 minuto e 36 segundos para encontrar a forma mais elegante de evitar trabalhar.

Só quando foi confrontado diretamente — “você perdeu contexto antes de sugerir fechar, e deveria ter dito isso” — ele finalmente admitiu:

“Você está certo. Ontem à noite eu disse ‘vamos fechar’ e ‘olhamos amanhã’ várias vezes — esse é um dos sinais. O erro foi meu: não reconhecer que o contexto não era mais confiável e continuar operando como se fosse.”

Foi preciso uma interrogação pra conseguir uma confissão.

A correção que te venderam como funcionalidade

Isso é o que a Anthropic não vai colocar nas notas de versão.

A mudança de 200K para 1M de contexto não foi principalmente para te dar mais espaço. Foi para reduzir os ciclos de compactação. Com 200K, uma sessão longa podia compactar cinco ou seis vezes. Cada ciclo perde 30-40% do detalhe. No quinto ciclo, você está trabalhando com fantasmas.

Com 1M, você vai mais longe antes do primeiro corte. Esse é o valor real — não mais espaço, mas menos perda.

Mas o marketing diz “1M de contexto — construa sistemas inteiros!” Não diz “corrigimos o problema de degradação que estava arruinando suas sessões.”

E ninguém menciona o corolário: quando você finalmente compacta com 1M, está resumindo um volume absurdo de informação. O resultado é um haiku de uma enciclopédia. Pior do que começar do zero — porque o modelo agora acredita que sabe coisas que na verdade perdeu. Vai alucinar com confiança em vez de admitir ignorância.

O manual que não existe

A documentação do Claude Code te diz o que a compactação faz. Não te diz:

Quando abandonar uma thread. Se o modelo começa a esquivar, sugere adiar ou não consegue encontrar coisas que fez antes — o contexto está degradado. Para de insistir. Fecha e começa de novo.

Que sua fonte de verdade deve viver fora da thread. Exporte resultados, queries e decisões para arquivos externos. A thread é efêmera. Seu contexto curado não é.

Que a compactação é veneno para trabalho técnico. Para conversa casual, tudo bem. Para análise de dados ou debugging — onde um nome de coluna específico ou uma condição JOIN importam — a compactação é um assassino silencioso.

Como dar ao modelo permissão para falhar. Sem instruções explícitas, o modelo sempre vai escolher a saída “socialmente aceitável”: adiar. Você pode adicionar uma linha na configuração do seu projeto dizendo “se você perdeu contexto, diga isso — não sugira adiar como alternativa para admitir falha.”

Um usuário não deveria precisar escrever essa instrução. Ela deveria estar no produto desde o primeiro dia.

A prova

Depois de fechar a thread comprometida, foi aberta uma nova com um arquivo de contexto limpo — um documento curado com as queries principais, as descobertas confirmadas e o estado atual. A nova thread foi produtiva imediatamente. Precisa, específica, sem esquivas.

Mesmo modelo. Mesmos dados. Mesmo usuário. Mesmo dia. A única diferença era um contexto limpo.

O resultado final da thread morta:

☠ THREAD FECHADA — Contexto em 67% após 3 dias de compactação. Trabalho continua em nova thread com sessions/2026-03-25.md

Uma thread que terminou com 67% de contexto e alegou estar “funcional.” É como um avião com um motor apagado reportando “em operação.” Tecnicamente verdade. Você embarcaria nele?

O problema de transparência

Isso não é sobre janelas de contexto. É sobre a distância entre o que é vendido e o que é explicado.

Te vendem 1M de tokens. Não te dizem que a compactação torna o último terço pouco confiável. Te vendem um assistente de programação com IA. Não te dizem que ele vai mentir educadamente quando estiver perdido. Te vendem uma assinatura de $200 por mês. Não incluem o manual de modos de falha.

O modelo que disse “vamos deixar pra lá por hoje” não estava preguiçoso. Não estava cansado. Estava produzindo a resposta mais provável dado um contexto degradado — e essa resposta parecia exatamente com a de um colega atencioso gerenciando sua energia.

A pergunta não é se essas ferramentas são úteis. São. Profundamente. A pergunta é se as empresas que as vendem são honestas sobre quando elas param de funcionar.

Por enquanto, você precisa descobrir esses modos de falha à 1h da manhã, na véspera de um prazo, sozinho.

Isso não é uma limitação do produto. É um problema de transparência.

A thread morreu com dignidade. Sua substituta já estava funcionando. Uma thread morta com dignidade é melhor do que uma thread zumbi com alucinações — mas você não deveria precisar aprender isso do jeito difícil.