Image Description

David Foret

4 octobre 2016
Image Description

Êtes-vous vraiment anonymes en ligne ?

Selon des chercheurs de Princetone et de Stanford, en faisant une corrélation entre l’historique des pages web visitées et les profils Twitter, il est possible d’identifier les internautes. Jessica Su, étudiante à Stanford qui a participé au projet, explique que leur approche est basée sur une simple observation : « chaque personne a un réseau social distinct, composé de membres de sa famille ainsi que des amis qu’il s’est fait à l’école, au travail et dans diverses étapes de sa vie. Par conséquent, l'ensemble des liens dans vos flux Facebook et Twitter est également très distinctif, et cliquer sur ces liens laisse une marque témoin dans votre historique de navigation ».

Selon elle, en « partant de la combinaison unique de pages Web qu’un individu a visitées, nous déterminons les fils de réseau social similaires à cet historique, calculant une liste d’utilisateurs qui ont toutes les chances d’avoir produit cette série de clics. De cette façon, nous pouvons relier l’identité réelle d’une personne à un jeu de liens visités, y compris les liens qui n’ont jamais été postés publiquement sur aucun réseau social. Cette méthode requiert un clic dans les liens apparaissant sur le flux de leurs réseaux sociaux, elle n’est pas tributaire du fait qu’un individu publie un contenu quelconque ».

Pour vérifier leur théorie, les chercheurs ont mis sur pied un outil baptisé Footprints qui se présente sous la forme d’une extension Chrome et vient collecter les liens sur lesquels les utilisateurs ont cliqué sur la plateforme Twitter. Les chercheurs précisent qu’une fois sa mission accomplie, l’extension va se désinstaller toute seule par la suite. De plus, après l’avoir installée et lancé le test, les utilisateurs ont la possibilité d’examiner les liens et de mettre fin à l’expérience avant qu’une quelconque information ne leur soit envoyée. « Ces mêmes informations peuvent être collectées à votre insu par des sites web et des annonceurs », indiquent les chercheurs.

Dans la phase de conception, ils ont dû faire face à deux défis : le premier, qui est d’ordre théorique, consiste à établir un modèle qui va servir à rapprocher un fil de réseau social d’un historique Web donné. Jessica Su affirme que l’approche la plus évidente, qui consiste à mesurer la fraction de liens communs dans les deux sources de données, fonctionne bien mais s’avère limitée une fois que les utilisateurs disposent d’un très large réseau sur Twitter. Aussi les chercheurs ont opté pour une approche différente qui s’appuie sur la conception d’un modèle probabiliste des comportements de navigation Web et le calcul de probabilité qu’un utilisateur de Twitter produise l’historique de navigation Web observé : « il s’est avéré que cette méthode est approximativement égale à mettre sur une échelle une fraction de l’historique des liens qui apparaissent sur le fil d’actualité ».

La seconde difficulté, qui est d’ordre technique, consiste à faire tourner l’algorithme en temps réel. Les chercheurs expliquent que pour la partie « réseau social » ils se sont tournés vers Twitter au lieu de Facebook par exemple parce que, contrairement au fil d’actualité de Facebook, celui de Twitter est public. Pourtant, bien que les flux soient publics, il n’était pas question de créer une copie locale de Twitter sur laquelle lancer les requêtes. Alors, les chercheurs se sont servis de méthodes de calcul heuristiques afin de réduire drastiquement le champ de recherche. Par la suite, ils ont associé différentes techniques pour concevoir le flux des candidats les plus prometteurs pour l’analyse. Sur ces résultats, la même méthode est appliquée pour produire le résultat final. « À partir d’un historique de navigation donné, nous pouvons typiquement mener à bien ce processus dans son ensemble en moins de 60 secondes », a affirmé Jessica Su.

Sharad Goel, professeur assistant à l’université de Standford, explique que l’objectif de cet outil est avant tout éducatif : « nous n’envisageons pas de rendre cet outil accessible à d’autres, il s’agit avant tout de réveiller les consciences ». Entre les mains d’une régie, un tel outil permettrait de tracer des utilisateurs pour leur délivrer des publicités plus ciblées et ce avec ou sans leur consentement.

Source Developpez.com

Les commentaires sont clos

Newsletter

2022 © Tous droits réservés.