Come usare Wayback Machine per recuperare i contenuti di un sito

Nulla di quanto viene pubblicato sul web viene perso. Ecco come fare a recuperare e rivedere con pochi click i vecchi contenuti
Come usare Wayback Machine per recuperare i contenuti di un sito
SmartWorld team
SmartWorld team

Le pagine web vengono costantemente rinnovate. Di conseguenza può essere difficoltoso trovare informazioni pubblicate un mese o un anno precedente in seguito al restyling. Come recuperare una vecchia pagina web e come mantenere la versione corrente di una pagina? Detto in altri termini: è possibile visualizzare una "vecchia" versione di una pagina web? E come salvare preventivamente una pagina web in modo da poter sempre visualizzare quella versione in un secondo momento?

Indice

Cosa è e come funziona Wayback Machine

Le immagini su Wayback Machine sono disponibili da 6 a 12 mesi dopo la loro acquisizione. La frequenza delle istantanee è variabile, non tutti gli aggiornamenti del sito web vengono registrati e si possono osservare intervalli di diverse settimane. Nel 2009 Wayback Machine conteneva quasi 3 petabyte di dati e sta crescendo a 100 terabyte al mese. I dati sono archiviati in sistemi prodotti da Capricorne Technologies, Petabox rack.

Il nome Wayback Machine è un riferimento al The Rocky and Bullwinkle Show, in cui il signor Peabody, un cane dall'aspetto di un professore, e il suo assistente Sherman (un animale domestico umano), usano una macchina del tempo chiamata WABAC Machine per descrivere eventi storici famosi. La condivisione gratuita di questo patrimonio ha alcuni limiti tecnologici: viene archiviata solo la cosiddetta parte visibile del web e alcune pagine non vengono visualizzate nella loro interezza a causa di collegamenti interrotti. Tuttavia resta una incredibile fonte di informazioni. In parallelo al massiccio progetto di assorbimento del web, la fondazione sta sviluppando raccolte ragionate di documenti, secondo un approccio selettivo e tematico.

Wayback Machine: come usarlo per recuperare le pagine web

Wayback Machine di Internet Archive può trovare versioni precedenti di siti web e pagine. Il funzionamento è molto semplice: basta incollare la url nel campo di input, premere Invio e ottenere una panoramica dell'evoluzione nel tempo.

Nella sequenza temporale si notano le date in cui sono state apportate modifiche insieme ai cambiamenti stessi. Basta quindi cliccare sul momento scelto per andare alla versione attiva nel periodo selezionato. È quindi possibile scorrere avanti e indietro utilizzando le frecce. Vale comunque la pena far presente che la presentazione originale non viene sempre visualizzata correttamente. Sulla homepage di Wayback Machine, l'utente può anche caricare e salvare manualmente la versione corrente di una pagina web. Ma ci sono anche utili estensioni del browser per Chrome e per Firefox pensate per questo scopo. In sintesi, i passaggi da seguire sono i seguenti:

  • collegarsi alla pagina waybackmachine.org;
  • digitare la url del sito che si sta cercando: si ottiene una schermata contenente l'istogramma del numero di copie dal 1996 e, per ogni anno, il calendario per mese;
  • navigare tra le diverse versioni dalle frecce nella parte superiore dello schermo.

A cosa serve Wayback Machine

Gli usi di Wayback Machine sono tanti. Dalla semplice curiosità alla ricerca scientifica a utilizzi professionali più pragmatici. Questo strumento consente ad esempio di verificare che il nome a dominio che si desidera acquisire non sia stato spammato o inserito in una black list. In caso di problemi con il proprio sito web e in assenza di un backup valido, permette di ritrovare il contenuto del sito. Ecco quindi la possibilità con il recupero di alcune istantanee del sito di analizzare la strategia web di un'organizzazione nel lungo periodo confrontando le diverse versioni dello stesso sito. Niente viene mai cancellato completamente da Internet. Questo strumento è la prova che è possibile trovare tracce lasciate anche 10 anni fa.

Infine, per trovare un sito che non c'è più o avere un'idea dell'evoluzione dell'offerta di un competitor o si stanno cercando informazioni storiche su un settore, Wayback Machine si rivela un punto di riferimento.

Come mantenere la versione corrente del sito

C'è il timore che una pagina web possa cambiare in futuro e si desidera mantenere la versione corrente? Archive.ph offre la possibilità di eseguire un backup preventivo. Basta incollare la url nel campo di input e fare clic su Salva la pagina. In questo modo si ottiene una pagina verde con vari codici e dopo pochi secondi si viene reindirizzato a una nuova url che mantiene per sempre la versione corrente della pagina web.

Presente anche un'opzione di download per scaricare la pagina (inclusi tutti gli elementi) sotto forma di file zip. Archive.ph ha anche un pratico segnalibro da trascinare nella barra dei preferiti del browser. In questo modo diventa più semplice preservare il contenuto delle pagine web.

Esportare il contenuto di Wayback Machine in pdf

Da segnalare quindi la possibilità di mantenere la versione corrente di una pagina web come pdf compatto. La maggior parte dei browser offre questa opzione nel menu di stampa. Ci sono a che strumenti online separati come Webpage to pdf ed estensioni del programma di navigazione come Save as pdf. GoFullPage - Full Page Screen Capture acquisisce invece uno screenshot dell'intera pagina in Chrome e lo salva come file grafico png. Ci sono anche servizi di cattura immagini che consentono di salvare facilmente le pagine sul cloud personale. Esempi noti sono Evernote e OneNote.

Mostra i commenti