- La guerra silenziosa contro la memoria del web
- Ventitré testate contro un archivio: i numeri del blocco
- Il paradosso USA Today: usare ciò che si vuole distruggere
- La posta in gioco: memoria collettiva o asset digitali?
- Cosa c'entra l'Italia e perché dovrebbe interessarci
- Il giornalismo che cancella le proprie tracce
- Domande frequenti
La guerra silenziosa contro la memoria del web
C'è qualcosa di profondamente inquietante nel modo in cui si sta consumando, quasi in sordina, uno dei conflitti più significativi dell'era digitale. Internet Archive, l'organizzazione no-profit che dal 1996 conserva istantanee del web attraverso la celebre Wayback Machine, si trova oggi stretta in una morsa. Da un lato, le battaglie legali con l'editoria libraria. Dall'altro, un fenomeno più subdolo e meno raccontato: il blocco sistematico del suo crawler da parte di grandi testate giornalistiche.
Non si tratta di un'azione coordinata dichiarata, ma il risultato è lo stesso. Pezzi interi della storia recente del giornalismo online rischiano di svanire, come se non fossero mai esistiti. E la cosa paradossale è che tra chi alza le barricate ci sono redazioni che, nei propri articoli, linkano proprio alla Wayback Machine.
Ventitré testate contro un archivio: i numeri del blocco
Stando a quanto emerge dalle analisi più recenti, sono almeno 23 grandi testate ad aver inserito nel proprio file robots.txt istruzioni specifiche per impedire al bot ia_archiverbot di indicizzare e archiviare i contenuti pubblicati. Un gesto tecnico, in apparenza banale, una riga di codice. Ma le conseguenze sono enormi.
Quando un editore blocca il crawler di Internet Archive, ogni articolo pubblicato su quel dominio diventa effimero per definizione. Può essere modificato senza traccia, rimosso senza memoria, riscritto senza che nessuno possa verificare la versione originale. Per chi si occupa di fact-checking, di ricerca storica, di giornalismo d'inchiesta, questo è un problema serio.
Mark Graham, direttore della Wayback Machine, ha criticato apertamente questa tendenza, evidenziando una contraddizione che definire stridente sarebbe un eufemismo. Gli stessi editori che si appellano alla trasparenza, alla verifica delle fonti, al diritto del pubblico di essere informato, stanno di fatto sabotando l'unico strumento capace di garantire che i contenuti online restino verificabili nel tempo.
Il paradosso USA Today: usare ciò che si vuole distruggere
Il caso più eclatante è quello di USA Today, una delle testate di maggior diffusione negli Stati Uniti. I giornalisti della testata utilizzano regolarmente la Wayback Machine come fonte per i propri pezzi, linkando versioni archiviate di pagine web che altrimenti sarebbero irrecuperabili. Eppure, contemporaneamente, USA Today impedisce a Internet Archive di archiviare i propri contenuti.
Interrogata sulla questione, la testata ha risposto con una formula che dice molto sulla filosofia sottostante: si tratta, stando alla dichiarazione ufficiale, di una scelta volta a "proteggere i propri asset digitali". Una frase rivelatrice. Perché trasforma articoli giornalistici, che dovrebbero essere patrimonio informativo della collettività, in merce da custodire gelosamente.
È come se una biblioteca pubblica decidesse di consultare liberamente i cataloghi di tutte le altre biblioteche, rifiutandosi però di condividere i propri. Il parallelo non è perfetto, certo, ma la sproporzione etica è evidente.
La posta in gioco: memoria collettiva o asset digitali?
La questione, a ben vedere, supera di gran lunga il perimetro del diritto d'autore. Tocca un nervo scoperto della democrazia contemporanea: chi decide cosa resta nella memoria pubblica e cosa scompare?
Nel mondo analogico, le emeroteche conservano i giornali. Le biblioteche raccolgono i libri. Gli archivi di Stato custodiscono i documenti. Nessun editore ha mai potuto impedire che una copia del proprio quotidiano finisse in una raccolta pubblica. Nel mondo digitale, invece, basta una riga nel file robots.txt per cancellare la possibilità stessa dell'archiviazione.
La differenza è sostanziale. Se un articolo cartaceo viene pubblicato e poi ritirato, le copie già distribuite restano. Se un articolo online viene cancellato e nessun archivio ne ha conservato una copia, è come se non fosse mai stato scritto. In un'epoca in cui la manipolazione dell'informazione è una minaccia concreta per le democrazie, questo dovrebbe preoccupare chiunque. Come abbiamo avuto modo di approfondire riflettendo su come Insegnare Speranza e Partecipazione Civica in Tempi di Crisi Democratica, la capacità di accedere a fonti verificabili è un presupposto irrinunciabile per qualsiasi forma di cittadinanza consapevole.
Cosa c'entra l'Italia e perché dovrebbe interessarci
Se il fenomeno è per ora prevalentemente americano, le sue implicazioni riguardano eccome il contesto italiano ed europeo. L'archivio digitale del web non conosce confini nazionali, e la Wayback Machine conserva milioni di pagine di siti italiani, dalle testate giornalistiche ai portali istituzionali, dai blog alle piattaforme educative.
In Italia, il quadro normativo sul diritto d'autore digitale è regolato dal decreto legislativo 68/2003 e successive modifiche, in recepimento delle direttive europee. La direttiva UE 2019/790 sul copyright nel mercato unico digitale ha introdotto eccezioni per la conservazione del patrimonio culturale da parte di istituti preposti, ma i confini di queste eccezioni restano oggetto di interpretazione, soprattutto quando si parla di organizzazioni no-profit straniere come Internet Archive.
C'è poi la questione, tutta italiana, dell'archiviazione dei contenuti prodotti dalla pubblica amministrazione e dalle istituzioni scolastiche. Quante circolari ministeriali, quanti documenti pubblicati sui siti degli uffici scolastici regionali, quanti bandi e regolamenti sono stati rimossi senza che ne restasse traccia? La Wayback Machine è spesso l'unico strumento per recuperarli. Per i docenti, ad esempio, che già affrontano un carico lavorativo spesso invisibile, come raccontato nell'approfondimento su Il Lavoro Sconosciuto dei Docenti: Oltre le 36 Ore Settimanali, la scomparsa di documenti normativi dai siti istituzionali rappresenta un problema concreto e quotidiano.
Il giornalismo che cancella le proprie tracce
Resta una domanda di fondo, scomoda ma necessaria. Può il giornalismo, che fonda la propria legittimità sulla trasparenza e sulla responsabilità pubblica delle parole scritte, sottrarsi contemporaneamente alla possibilità di essere archiviato e verificato?
La risposta degli editori che bloccano Internet Archive è, nei fatti, sì. E le motivazioni economiche, per quanto comprensibili in un settore in crisi strutturale, non bastano a giustificare un gesto che ha implicazioni ben più ampie della protezione di un modello di business.
Perché la prossima volta che un giornale scriverà di fake news, di manipolazione dell'informazione, di post-verità, varrà la pena chiedersi: come si può combattere la disinformazione se si impedisce la conservazione delle fonti originali? Come si verifica un'affermazione, si smentisce una bufala, si ricostruisce una cronologia, se le pagine web possono sparire senza lasciare traccia?
La Wayback Machine non è un concorrente dell'editoria. È un'infrastruttura culturale. E come tutte le infrastrutture, il suo valore si comprende appieno solo quando smette di funzionare. I 23 editori che hanno scelto di bloccarla stanno contribuendo, consapevolmente o meno, a rendere il web un luogo più opaco, più fragile, più esposto alla riscrittura della storia.
La questione resta aperta. Ma il tempo, in questo caso, non gioca a favore di nessuno: ogni giorno che passa senza archiviazione è un giorno di memoria perduta per sempre.