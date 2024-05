Per alcuni, potrebbe essere una rivincita all'avviso che le cose pubblicate su Internet restano per sempre, ma il "decadimento digitale" riguarda anche le fonti di Wikipedia o su Twitter / X

Internet ha un problema, che per molti in realtà potrebbe essere un sollievo, o anche una rivincita: quasi il 40% delle pagine Web di 10 anni fa o più non sono più accessibili e rimandano al famoso "404: Page not found" (a proposito, sapete come cancellare la cronologia dal browser?). Stiamo parlando di quello che viene chiamato "decadimento digitale", che stando a un rapporto del Pew Research Center è particolarmente grave e getta un'ombra sulle fonti di una serie di articoli, come quelle che possiamo trovare su Wikipedia.

Il decadimento digitale è un fenomeno più grave di quanto si possa pensare

Stando all'articolo pubblicato dal Pew Research Center, un quarto di tutte quelle che esistevano tra il 2013 e il 2023 non sono più disponibili. Questa tendenza è più aggressiva per i contenuti più vecchi, in quanto il 38% delle pagine Web del 2013 non è più accessibile, mentre per quelle del 2023 stiamo parlando dell'8%, il che comunque non è un valore così basso. Il fenomeno, noto come "decadimento digitale", non riguarda solo le pagine Web, ma anche i tweet. Circa un quinto di tutti i tweet non è più visibile pochi mesi dopo essere stati pubblicati, perché l'account è diventato privato, è stato sospeso o cancellato. Inoltre alcuni tweet tendono a sparire più velocemente di altri. Per esempio i tweet scritti in turco o arabo hanno maggiori probabilità di svanire rispetto ai tweet scritti in altre lingue (stiamo parlando del 40% di questi contenuti, spariti entro tre mesi dalla pubblicazione).

Fonte: Pew Research Center

Perché è un problema

Come dicevamo, per molti potrebbe essere una rivincita, dopo che per anni si sono sentiti dire che quello che si pubblica su Internet è per sempre, ma in realtà è un problema. Perché? Pensate a Wikipedia: sono tantissime le schede in cui le fonti non sono più accessibili. Ma questo riguarda anche i siti Web governativi, o anche quelli di notizie. Secondo il sito Columbia Journalism Review, che aveva ravvisato questo pericolo già nel 2021, questo comporta che non si può più accedere a contenuti di riferimento, quindi non si potrà più comprendere il contesto di un articolo. Non solo, ma in uno studio del 2014 si è visto come negli Stati Uniti quasi la metà di tutti i collegamenti ipertestuali nei pareri della Corte Suprema hanno portato a contenuti che erano cambiati dalla loro pubblicazione originale o erano scomparsi da Internet. Purtroppo questo rende certi tipi di ricerche estremamente difficili o quasi impossibili.

C'è una parziale soluzione

C'è una soluzione, però, almeno parziale: The Internet Archive, una biblioteca digitale non profit che offre uno spazio digitale permanente per l'accesso a vari tipi di risorse, tra cui appunto i siti web. Il sito vi permette di recuperare miliardi di pagine Internet, salvate automaticamente dai suoi web crawler che lavorano per preservare quanto più possibile il web pubblico, anche attraverso una comoda estensione per Chrome. Certo, non troverete tutto quello che è stato pubblicato, ma una buona parte sì, e noi lo usiamo di frequente per controllare cambiamenti nei siti durante il tempo. Curiosamente, mentre scrivevamo questo articolo il sito di The Internet Archive risultava non accessibile con errore 503, giustamente smentendo quanto appena affermato.