septembre 6

0 comments

Comment (re)trouver le contenu d’un site hors ligne ?

By David

septembre 6, 2019


Il y a des cas où il peut être utile de retrouver le contenu d’une page qui n’est plus accessible (serveur indisponible, page effacée…). Pas de panique ! Ici, je vous révèle comment (re)trouver le contenu d’un site même hors ligne.

Google a pensé à tout et même aux problèmes de mise en ligne ou de serveur auxquelles nous pouvons faire face parfois. En effet, il est possible de retrouver le contenu d’un site grâce à la mise en cache par Google lui-même.

Autre solution : l’utilisation d’archive.org, la mémoire du web, un outil méconnu, mais exceptionnel !

More...

Qu’est-ce qu’un cache ?

La mise en cache est tout simplement une sauvegarde réalisée par les sites ou les moteurs de recherche qui permet aussi une optimisation de la rapidité d’affichage, permettant ainsi aux internautes d’accéder au contenu d’un site grâce aux versions sauvegardées de ces derniers. L’internaute pourra accéder au contenu de la page souhaitée plus rapidement, car il n’y aura pas besoin de recalculer les données.

Bien évidemment, tous les sites ne seront pas égaux face à la mise en cache. Cela dépendra du webmaster qui autorisera, ou non, la sauvegarde de ses pages : il existe une balise « noarchive » qui indique aux moteurs de recherche que vous refusez la mise en cache de la page. Heureusement pour nous, elle est très peu utilisée.

Et si le contenu de la page a changé entre-temps ? Pas de panique, encore une fois, Google a pensé à tout. Une mise à jour de la page mise en cache est faite régulièrement. Ainsi, vous aurez accès au contenu rafraîchi. Cette mise en cache dépend aussi de l’importance du site : un site majeur d’actualités verra son cache rafraîchi très souvent (quelques minutes). Un produit d’un site e-commerce peu fréquenté pourra mettre des mois avant d’avoir son cache mis à jour…


Quels outils à disposition pour consulter les pages mis en cache ?

Il existe plusieurs outils à disposition afin de consulter ou de retrouver du contenu web en étant hors ligne, voici les deux les plus efficaces !


La méthode Cache: de Google

En utilisant la requête avancée « Cache » du menu, vous pourrez retrouver facilement la page souhaitée, et ce, même si elle a été supprimée.

Si vous connaissez l’URL, entrez « cache: » avant l’URL (sans aucun espace) puis lancez la recherche. Par exemple, si vous souhaitez accéder à la page « https://www.apple.com/fr/ipad/ », il vous suffit de taper « cache: https://www.apple.com/fr/ipad/ »

Simple, rapide et gratuit, c’est la première solution à tester. 

"Attention !​

Si la page est hors ligne depuis longtemps, Google l’effacera de son index et donc de son cache… Autre inconvénient, vous ne disposez que de la dernière version. Il n’est pas possible de retrouver (sur Google) de versions plus anciennes…"

Dans votre navigateur, vous pouvez aussi cliquer sur la flèche verte à l’extrémité de l’URL en vert, pour accéder à la dernière version de la page :


La méthode Archive.org

Vous avez peut-être envie d’accéder à une version un peu plus ancienne du site de votre choix ? Archive.org est LA solution. Grâce à leur système de calendrier, vous pourrez remonter dans le temps. Archive.org effectue régulièrement des screenshots des principales pages du site pour ensuite les archiver. Bonne nouvelle, le service est – vraiment - gratuit. Attention, pour de petits sites, archive.org ne propose pas toujours des résultats, encore moins sur certaines pages profondes.

Quelques statistiques sur les anciennes versions d’Apple :


Choix de la date exacte de la version que l’on souhaite voir :


Par exemple, la version d’Apple le 12 mars 2014 :

About the author

Leave a Repl​​​​​y

Your email address will not be published. Required fields are marked

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Direct Your Visitors to a Clear Action at the Bottom of the Page

Copy link
Powered by Social Snap