La société "Unspam Technologies" vient de lancer un service leur permettant de se "perdre dans la foule". "Lost in the crowd. Envoie régulièrement de nombreuses requêtes vers les moteurs en se faisant passer pour vous. Ainsi vos vrai requêtes se retrouvent perdues au milieu d'autres et il devient beaucoup plus difficile de vous identifier.

Dans le même genre, vous pouvez aussi essayer TrackMeNot, une extension pour Firefox qui elle envoie régulièrement des requêtes bidon depuis votre navigateur.

Je trouve l'idée pas mauvaise, même s'il est probable que les moteurs trouvent bientôt une parade (du moins si le service a du succès et qu'ils s'estiment menacés). Bruce Schneier, un spécialiste en sécurité informatique[1] relève sur son blog les failles de la méthode :

  • ça ne masque pas vos recherches, on pourra toujours savoir que vous avez cherché comment commettre un attentat pâtissier, même si ce n'est pas vous mais un des outils qui a passé la requête
  • si les outils utilisent des dictionnaires statiques (cas de TMN pour l'instant), il est simple pour les moteurs de filtrer les recherches contenant ces mots.
  • les recherches effectuées automatiquement peuvent attirer l'attention sur vous : si LITC ou TMN s'amusent lancer des recherches bidon avec certains mots fort appréciés de la NSA, préparez-vous finir en pyjama orange fluo sur une île ensoleillée
  • cette méthode consomme beaucoup de ressources, aussi bien en terme de charge des moteurs (d'où un possible ralentissement) que de bande passante.
  • nul doute que les programmes qui analysent les requêtes pourront assez facilement faire le ménage.

Schneier propose quelques pistes pour améliorer les outils, mais rappelle que le meilleur moyen de lutter contre le profilage est d'utiliser des outils qui renforcent l'anonymat, comme Tor. Pour les recherches, on peut aussi utiliser des méta-moteurs, qui interrogent pour vous Google, Yahoo, MSN, etc, ou des proxies spécifiques comme Black Box Search.

Quelques pistes pour aller plus loin propos du profilage par les moteurs:

  • Google teste depuis longtemps un service de recherche personnalisée. Une fois enregistré, il conserve toutes vos recherches (et probablement d'autres informations) et adapte ses réponses en fonction de ce qu'il devine de vous, vos centre d'intérêt, etc. Il a d'ailleurs déposé un brevet il y a quelques mois sur un système permettant d'organiser les réponses une requête en fonction du profil de l'internaute (cf PC Impact).
  • Yahoo propose des services similaires depuis 2004...
  • silicon.fr vient de publier un intéressant billet sur le sujet: cacher son identité aux moteurs de recherche
  • ajout du 31.08 un autre bon article publié au début du mois sur ZDNet: moteurs de recherche: l'usage des données privées encore opaque

Notes

[1] aussi célèbre que Chuck Norris puisqu'il a lui aussi droit un site consacré ses exploits ;-)