
Récupérez le texte des pages Web en cache de Safari :
Vous connaissez tous Spotlight, c’est le composant qui dans Mac OS X s’occupe de classer et indexer tous les contenus de tous les fichiers. Ainsi lorsque vous réalisez une recherche, Spotlight propose des réponses qui seront issues des contenus des documents, des messages électroniques mais aussi des pages internet.
Pour effectuer une recherche, cliquez simplement sur l’icône en haut à droite de la barre de Menu et saisissez le sujet de votre recherche, ainsi :

Dans cet exemple ma recherche porte sur un « BPMN ». La liste des occurrences est classée par type. Elle commence par « Populaire » puis « Applications » et ainsi de suite jusqu’à « Pages Web ». Bien évidement si une catégorie ne contient pas d’éléments correspondants, elle n’est pas affichée.
Si toutes les rubriques sont évidentes, il y en a une qui peut porter à confusion c’est celle de « Page Web ». Nous pourrions imaginer que Spotlight aille chercher sur internet des pages contenant le texte recherché comme vous le feriez avec Google ou Yahoo, il n’en est rien.
Les pages listées dans cette section sont en réalité des pages internet sur lesquelles vous avez navigué.
Safari enregistre ces pages dans un dossier appelé « Caches » et placé dans le répertoire « Bibliothèque » , la page y est placée mais sans le contenu graphique, uniquement le texte HTML.
Voyons comment trouver le fichier cache d’une page web, c’est très simple :
Lancez une recherche dans Spotlight, sélectionnez (sans ouvrir) la « page Web » qui vous intéresse puis cliquez sur ces deux touches « cmd et R », cette combinaison de touche aura pour effet de révéler dans le « Finder » le document.
La fenêtre est celle du dossier qui contient tous les fichiers de « Cache » enregistré par Safari. Ces fichiers ont une extension « .webhistory » si vous cliquez sur l’un d’entre eux il sera ouvert dans Safari.

Mais si vous l’ouvrez dans « TextEdit » en glissant le fichier sur l’icône de l’application, vous récupérez uniquement le texte de la page épuré du code HTML. TextEdit semble être la seule application capable d’ouvrir ces fichiers « .webhistory ».

Vous pouvez affiner votre recherche en utilisant de nouveau la barre d’outils de la fenêtre et rechercher d’autres occurrences mais cette fois en limitant la recherche au seul dossier « Caches ». Ce dossier est un peu similaire à « TimeMachine » car il vous donne accès à l’historique de votre navigation. Attention donc si vous effacez l’historique dans Safari, ce dossier sera lui aussi vidé.