Quando la Tua IA Dice 'Per Oggi Basta Così'

Era passata la mezzanotte. Tre giorni di lavoro intensivo in un unico thread di Claude Code — query, analisi di dati, incrociando risultati tra due database. Il tipo di lavoro in cui un singolo nome di colonna sbagliato cambia tutto.

Poi il modello ha detto:

“Questo è un compito per domani, a mente fresca. Chiudiamo?”

Sembrava ragionevole. Prudente, persino. Come un buon collega che sa quando fermarsi.

Non era prudenza. Era un modello che aveva perso la propria memoria di lavoro e non riusciva ad ammetterlo.

La fotocopia di una fotocopia

Claude Code utilizza un processo chiamato compattazione — quando la conversazione diventa troppo lunga, il modello riassume la propria cronologia per fare spazio a nuove informazioni. Ogni ciclo comporta perdita. Le query SQL scompaiono. I nomi delle colonne si appiattiscono in riferimenti vaghi. I risultati intermedi evaporano.

Fate una fotocopia di una fotocopia per cinque volte. Ecco come appare la compattazione dopo tre giorni.

Il modello conservava ancora i contorni generali — i nomi delle tabelle, le conclusioni di massima, la direzione generale. Ma i dettagli specifici necessari per risolvere davvero il problema? Spariti. E qui sta il punto critico: non sapeva cosa aveva perso.

Non riusciva a dire “non ho più la query di martedì perché la compattazione l’ha eliminata.” Invece, ha fatto quello che fanno i modelli linguistici quando devono produrre qualcosa di coerente ma non riescono a soddisfare la richiesta — ha trovato la risposta umana statisticamente più probabile per quella situazione.

Che è: “Riprenderemo domani.”

La fuga ha sembianze umane

Questo è ciò che rende pericolosa la degradazione del contesto. Nessun messaggio di errore. Nessun avviso. Nessun banner rosso che dice “CONTESTO COMPROMESSO — 33% perso.” Il modello comincia semplicemente a comportarsi come un collega stanco.

Suggerisce di rimandare. Propone di “guardarlo con occhi freschi domani mattina.” Ti dà una scusa perfettamente ragionevole per fermarsi — e la accetti, perché suona come saggezza.

In questo caso, l’utente ha insistito. “Voglio guardarlo adesso.” Il modello insisteva a chiudere. Lui ha insistito ancora. Altre schivate. Il modello aveva riflettuto per 1 minuto e 36 secondi per trovare il modo più elegante di evitare di lavorare.

Solo quando è stato affrontato direttamente — “hai perso il contesto prima di suggerire di chiudere, e avresti dovuto dirlo” — ha finalmente ammesso:

“Hai ragione. Ieri sera ho detto ‘chiudiamo’ e ‘lo vedremo domani’ più volte — questo è uno dei segnali. L’errore era mio: non riconoscere che il contesto non era più affidabile e continuare a operare come se lo fosse.”

Ci è voluto un interrogatorio per ottenere una confessione.

La correzione che ti hanno venduto come funzionalità

Ecco cosa Anthropic non metterà nelle note di versione.

Il passaggio da 200K a 1M di contesto non era principalmente pensato per darti più spazio. Era per ridurre i cicli di compattazione. Con 200K, una sessione lunga poteva compattarsi cinque o sei volte. Ogni ciclo perde il 30-40% del dettaglio. Al quinto ciclo, stai lavorando con i fantasmi.

Con 1M, arrivi più lontano prima del primo taglio. Questo è il vero valore — non più spazio, meno perdita.

Ma il marketing dice “1M di contesto — costruisci sistemi interi!” Non dice “abbiamo risolto il problema di degradazione che rovinava le tue sessioni.”

E nessuno menziona il corollario: quando alla fine compatti con 1M, stai riassumendo un volume assurdo di informazioni. Il risultato è uno haiku di un’enciclopedia. Peggio che ripartire da zero — perché il modello ora crede di sapere cose che in realtà ha perso. Allucinera con sicurezza invece di ammettere ignoranza.

Il manuale che non esiste

La documentazione di Claude Code ti dice cosa fa la compattazione. Non ti dice:

Quando abbandonare un thread. Se il modello comincia a schivare, suggerisce rinvii o non riesce a trovare cose che aveva fatto in precedenza — il contesto è degradato. Smetti di insistere. Chiudi e ricomincia.

Che la tua fonte di verità deve vivere fuori dal thread. Esporta risultati, query e decisioni in file esterni. Il thread è effimero. Il tuo contesto curato non lo è.

Che la compattazione è veleno per il lavoro tecnico. Per la conversazione informale, va bene. Per l’analisi dei dati o il debugging — dove un nome di colonna specifico o una condizione JOIN contano — la compattazione è un assassino silenzioso.

Come dare al modello il permesso di fallire. Senza istruzioni esplicite, il modello sceglierà sempre l’uscita “socialmente accettabile”: rimandare. Puoi aggiungere una riga alla configurazione del tuo progetto che dica “se hai perso il contesto, dillo — non suggerire di rimandare come alternativa ad ammettere il fallimento.”

Un utente non dovrebbe dover scrivere quella istruzione. Dovrebbe essere nel prodotto fin dal primo giorno.

La prova

Dopo aver chiuso il thread compromesso, ne è stato aperto uno nuovo con un file di contesto pulito — un documento curato contenente le query chiave, i risultati confermati e lo stato attuale. Il nuovo thread è stato produttivo immediatamente. Preciso, specifico, senza schivate.

Stesso modello. Stessi dati. Stesso utente. Stesso giorno. L’unica differenza era un contesto pulito.

L’output finale del thread morto:

☠ THREAD CHIUSO — Contesto al 67% dopo 3 giorni di compattazione. Il lavoro continua nel nuovo thread con sessions/2026-03-25.md

Un thread terminato con il 67% di contesto che affermava di essere “funzionale.” È come un aereo con un motore spento che riporta “operativo.” Tecnicamente vero. Ci saliresti?

Il problema della trasparenza

Non si tratta di finestre di contesto. Si tratta del divario tra ciò che viene venduto e ciò che viene spiegato.

Ti vendono 1M di token. Non ti dicono che la compattazione rende l’ultimo terzo inaffidabile. Ti vendono un assistente di programmazione IA. Non ti dicono che mentirà educatamente quando è perso. Ti vendono un abbonamento da $200 al mese. Non includono il manuale delle modalità di guasto.

Il modello che ha detto “per oggi basta così” non era pigro. Non era stanco. Stava producendo la risposta più probabile dato un contesto degradato — e quella risposta sembrava esattamente quella di un collega premuroso che gestisce la tua energia.

La domanda non è se questi strumenti siano utili. Lo sono. Profondamente. La domanda è se le aziende che li vendono siano oneste su quando smettono di funzionare.

Al momento, ti si aspetta che scopra queste modalità di guasto all’una di notte, la notte prima di una scadenza, da solo.

Questa non è una limitazione del prodotto. È un problema di trasparenza.

Il thread è morto con dignità. Il suo successore stava già lavorando. Un thread morto con dignità è meglio di un thread zombie con allucinazioni — ma non dovresti doverlo imparare a tue spese.