« Online tracking: A 1-million-site measurement and analysis » est une étude effectuée en 2016 par un projet de l'université de Princeton sur l'emploi du tracking (du pistage!?) publicitaire des sites web.


Il s'agit ici de mesurer objectivement les pratiques de pistage opérés par les sites web.

Cette étude fournit des éléments de réponse sur le tracking en fonction du type de site, la distribution des pratiques de pistage observées et détaille les moyens et procédés, distinguant notamment les techniques 'classiques'; Cookie-based, de techniques plus sophistiquées de Fingerprinting.


Pistage par prise d'empreinte

Le pistage par prise d'empreinte se base sur le principe que chaque combinaison de navigateur-matériel-paramétrage représente un critère suffisament fin pour cibler l'individus et offrir de nouvelles possibilités de consolidation et de croisement par ce biais des données collectées.


Cette étude en anglais débuté en 2014 est mise à jour en 2016 et on peut trouver une vidéo youtube de la conférence de présentation durant le CSS2016, l'occasion de détailler l'évolution de ces techniques depuis 2012.


Extrait : During our January 2016 measurement of the Top 1 million sites, our tool made over 90 million requests, assembling the largest dataset on web tracking to our knowledge. Our large scale allows us to answer a rather basic question: how many third parties are there? In short, a lot: the total number of third parties present on at least two first parties is over 81,000.

What is more surprising is that the prevalence of third parties quickly drops off: only 123 of these 81,000 are present on more than 1% of sites. This suggests that the number of third parties that a regular user will encounter on a daily basis is relatively small. The effect is accentuated when we consider that different third parties may be owned by the same entity. All of the top 5 third parties, as well as 12 of the top 20, are Google-owned domains. In fact, Google, Facebook, Twitter, and AdNexus are the only third-party entities present on more than 10% of sites.


L'année suivante, en Février 2017, on pouvait lire : "Now sites can fingerprint you online even when you use multiple browsers" - Par Dan Goodin, sur ArsTechnica. ARTICLE SOURCE.

L'empreinte que laisse un navigateur permet à des sites, comme ceux de paiements des banques, d'évaluer si la transaction sur un compte se fait 'du terminal habituel' ou pas. Les applications autres sont vastes, et cet article s'attarde sur les dernières études exploitant l'API des browsers via JS pour, grâce à WebGL en particuliers, obtenir des caractéristiques du hardware pour en constituer une empreinte.

Extrait : In a test that collected 3,615 fingerprints from 1,903 users over a three-month period, the technique was able to successfully identify 99.2 percent of users. By contrast, a single-browser fingerprinting technique dubbed AmIUnique, had a success rate of 90.8 percent.


Depuis 2018(?)-2019, certains navigateurs comme Firefox proposent des options dédiées aux traitements de ces objets fingerprint, tentant ainsi d'intégrer une tâche dont certains add-on et autres plug-in se proposaient jusqu'à là d'agrémenter (entre autres) l'application web.