Loading...
Internet Archive sotto attacco: perché i grandi editori vogliono bloccare la Wayback Machine
Tecnologia

Internet Archive sotto attacco: perché i grandi editori vogliono bloccare la Wayback Machine

Disponibile in formato audio

Ventitré testate impediscono l'archiviazione dei propri contenuti, ma alcune continuano a usare lo stesso strumento che ostacolano. Una contraddizione che mette a rischio la memoria storica del web e il diritto all'informazione

La guerra silenziosa contro la memoria del web

C'è qualcosa di profondamente inquietante nel modo in cui si sta consumando, quasi in sordina, uno dei conflitti più significativi dell'era digitale. Internet Archive, l'organizzazione no-profit che dal 1996 conserva istantanee del web attraverso la celebre Wayback Machine, si trova oggi stretta in una morsa. Da un lato, le battaglie legali con l'editoria libraria. Dall'altro, un fenomeno più subdolo e meno raccontato: il blocco sistematico del suo crawler da parte di grandi testate giornalistiche.

Non si tratta di un'azione coordinata dichiarata, ma il risultato è lo stesso. Pezzi interi della storia recente del giornalismo online rischiano di svanire, come se non fossero mai esistiti. E la cosa paradossale è che tra chi alza le barricate ci sono redazioni che, nei propri articoli, linkano proprio alla Wayback Machine.

Ventitré testate contro un archivio: i numeri del blocco

Stando a quanto emerge dalle analisi più recenti, sono almeno 23 grandi testate ad aver inserito nel proprio file robots.txt istruzioni specifiche per impedire al bot ia_archiverbot di indicizzare e archiviare i contenuti pubblicati. Un gesto tecnico, in apparenza banale, una riga di codice. Ma le conseguenze sono enormi.

Quando un editore blocca il crawler di Internet Archive, ogni articolo pubblicato su quel dominio diventa effimero per definizione. Può essere modificato senza traccia, rimosso senza memoria, riscritto senza che nessuno possa verificare la versione originale. Per chi si occupa di fact-checking, di ricerca storica, di giornalismo d'inchiesta, questo è un problema serio.

Mark Graham, direttore della Wayback Machine, ha criticato apertamente questa tendenza, evidenziando una contraddizione che definire stridente sarebbe un eufemismo. Gli stessi editori che si appellano alla trasparenza, alla verifica delle fonti, al diritto del pubblico di essere informato, stanno di fatto sabotando l'unico strumento capace di garantire che i contenuti online restino verificabili nel tempo.

Il paradosso USA Today: usare ciò che si vuole distruggere

Il caso più eclatante è quello di USA Today, una delle testate di maggior diffusione negli Stati Uniti. I giornalisti della testata utilizzano regolarmente la Wayback Machine come fonte per i propri pezzi, linkando versioni archiviate di pagine web che altrimenti sarebbero irrecuperabili. Eppure, contemporaneamente, USA Today impedisce a Internet Archive di archiviare i propri contenuti.

Interrogata sulla questione, la testata ha risposto con una formula che dice molto sulla filosofia sottostante: si tratta, stando alla dichiarazione ufficiale, di una scelta volta a "proteggere i propri asset digitali". Una frase rivelatrice. Perché trasforma articoli giornalistici, che dovrebbero essere patrimonio informativo della collettività, in merce da custodire gelosamente.

È come se una biblioteca pubblica decidesse di consultare liberamente i cataloghi di tutte le altre biblioteche, rifiutandosi però di condividere i propri. Il parallelo non è perfetto, certo, ma la sproporzione etica è evidente.

La posta in gioco: memoria collettiva o asset digitali?

La questione, a ben vedere, supera di gran lunga il perimetro del diritto d'autore. Tocca un nervo scoperto della democrazia contemporanea: chi decide cosa resta nella memoria pubblica e cosa scompare?

Nel mondo analogico, le emeroteche conservano i giornali. Le biblioteche raccolgono i libri. Gli archivi di Stato custodiscono i documenti. Nessun editore ha mai potuto impedire che una copia del proprio quotidiano finisse in una raccolta pubblica. Nel mondo digitale, invece, basta una riga nel file robots.txt per cancellare la possibilità stessa dell'archiviazione.

La differenza è sostanziale. Se un articolo cartaceo viene pubblicato e poi ritirato, le copie già distribuite restano. Se un articolo online viene cancellato e nessun archivio ne ha conservato una copia, è come se non fosse mai stato scritto. In un'epoca in cui la manipolazione dell'informazione è una minaccia concreta per le democrazie, questo dovrebbe preoccupare chiunque. Come abbiamo avuto modo di approfondire riflettendo su come Insegnare Speranza e Partecipazione Civica in Tempi di Crisi Democratica, la capacità di accedere a fonti verificabili è un presupposto irrinunciabile per qualsiasi forma di cittadinanza consapevole.

Cosa c'entra l'Italia e perché dovrebbe interessarci

Se il fenomeno è per ora prevalentemente americano, le sue implicazioni riguardano eccome il contesto italiano ed europeo. L'archivio digitale del web non conosce confini nazionali, e la Wayback Machine conserva milioni di pagine di siti italiani, dalle testate giornalistiche ai portali istituzionali, dai blog alle piattaforme educative.

In Italia, il quadro normativo sul diritto d'autore digitale è regolato dal decreto legislativo 68/2003 e successive modifiche, in recepimento delle direttive europee. La direttiva UE 2019/790 sul copyright nel mercato unico digitale ha introdotto eccezioni per la conservazione del patrimonio culturale da parte di istituti preposti, ma i confini di queste eccezioni restano oggetto di interpretazione, soprattutto quando si parla di organizzazioni no-profit straniere come Internet Archive.

C'è poi la questione, tutta italiana, dell'archiviazione dei contenuti prodotti dalla pubblica amministrazione e dalle istituzioni scolastiche. Quante circolari ministeriali, quanti documenti pubblicati sui siti degli uffici scolastici regionali, quanti bandi e regolamenti sono stati rimossi senza che ne restasse traccia? La Wayback Machine è spesso l'unico strumento per recuperarli. Per i docenti, ad esempio, che già affrontano un carico lavorativo spesso invisibile, come raccontato nell'approfondimento su Il Lavoro Sconosciuto dei Docenti: Oltre le 36 Ore Settimanali, la scomparsa di documenti normativi dai siti istituzionali rappresenta un problema concreto e quotidiano.

Il giornalismo che cancella le proprie tracce

Resta una domanda di fondo, scomoda ma necessaria. Può il giornalismo, che fonda la propria legittimità sulla trasparenza e sulla responsabilità pubblica delle parole scritte, sottrarsi contemporaneamente alla possibilità di essere archiviato e verificato?

La risposta degli editori che bloccano Internet Archive è, nei fatti, sì. E le motivazioni economiche, per quanto comprensibili in un settore in crisi strutturale, non bastano a giustificare un gesto che ha implicazioni ben più ampie della protezione di un modello di business.

Perché la prossima volta che un giornale scriverà di fake news, di manipolazione dell'informazione, di post-verità, varrà la pena chiedersi: come si può combattere la disinformazione se si impedisce la conservazione delle fonti originali? Come si verifica un'affermazione, si smentisce una bufala, si ricostruisce una cronologia, se le pagine web possono sparire senza lasciare traccia?

La Wayback Machine non è un concorrente dell'editoria. È un'infrastruttura culturale. E come tutte le infrastrutture, il suo valore si comprende appieno solo quando smette di funzionare. I 23 editori che hanno scelto di bloccarla stanno contribuendo, consapevolmente o meno, a rendere il web un luogo più opaco, più fragile, più esposto alla riscrittura della storia.

La questione resta aperta. Ma il tempo, in questo caso, non gioca a favore di nessuno: ogni giorno che passa senza archiviazione è un giorno di memoria perduta per sempre.

Pubblicato il: 15 aprile 2026 alle ore 07:11

Domande frequenti

Perché alcuni grandi editori vogliono bloccare la Wayback Machine di Internet Archive?

Gli editori bloccano la Wayback Machine per proteggere i propri asset digitali e mantenere il controllo esclusivo sui loro contenuti online, temendo che l'archiviazione riduca il loro valore commerciale.

Quali sono le conseguenze del blocco dell'archiviazione da parte delle testate giornalistiche?

Il blocco impedisce di conservare versioni originali e verificabili degli articoli, rendendo impossibile il fact-checking e la ricostruzione storica dei contenuti. Questo aumenta il rischio che informazioni importanti possano essere modificate o cancellate senza lasciare traccia.

Perché la questione riguarda anche l'Italia e non solo gli Stati Uniti?

La Wayback Machine archivia milioni di pagine italiane, incluse quelle di istituzioni pubbliche e scolastiche. La perdita di archiviazione può pregiudicare l'accesso a documenti normativi e informazioni essenziali anche in Italia, dove il quadro normativo sul copyright digitale è in continua evoluzione.

Qual è il paradosso evidenziato nel caso di USA Today?

USA Today utilizza regolarmente la Wayback Machine come fonte per i propri articoli, ma allo stesso tempo impedisce che i propri contenuti vengano archiviati, mostrando una contraddizione tra uso e condivisione dell'informazione.

Qual è il rischio per la memoria collettiva e la trasparenza del web?

Se le testate bloccano l'archiviazione, intere parti della storia digitale rischiano di scomparire, rendendo più difficile la verifica delle fonti e favorendo la manipolazione delle informazioni. Ciò mette a rischio la trasparenza e la responsabilità del giornalismo online.

Quali implicazioni ha la cancellazione di contenuti online per il settore educativo?

La rimozione di documenti e circolari istituzionali dai siti scolastici e amministrativi può creare difficoltà concrete per docenti e cittadini che necessitano di accedere a informazioni e regolamenti ufficiali, spesso reperibili solo tramite la Wayback Machine.

Redazione EduNews24

Articolo creato da

Redazione EduNews24

Articoli pubblicati da parte della redazione di EduNews24.it

Articoli Correlati