En tant que géant de l’internet, et depuis plusieurs mois acteur du domaine de la santé, Google manipule une très grande quantité de données. Comment toutes ces données sont-elles exploitées? Avec son nouveau projet dénommé RAPPOR, l’entreprise californienne apporte une réponse à cette question, et va plus loin en garantissant un usage efficient et responsable de ces ressources. Cela suffit-il tout de même à apaiser nos inquiétudes?

Le RAPPOR de Google

RAPPOR, l’une des toutes dernières initiatives lancées par Google, a été dévoilée lors du dernier congrès de l’ACM (Association for Computing Machinery), organisation américaine dont la mission est de développer la recherche scientifique et l’innovation informatique. Ce congrès s’est tenu en début novembre, et portait sur la sécurité informatique.

RAPPOR (Randomized Aggregatable Privacy-Preserving Ordinal Response) est une technologie qui permet de collecter de l’information des utilisateurs de logiciels, de manière anonyme et avec de fortes garanties de confidentialité. Actuellement testée sur Chrome, elle permettra d’étudier toutes les données de façon collective, sans possibilité de remonter aux sources. Afin de mettre sur pied l’algorithme à la base de RAPPOR, la compagnie américaine s’est inspirée d’une technique d’enquête développée durant les années 1960, appelée « intimité différentielle ». Cette méthode s’applique à des cas de collecte de données sur des sujets sensibles, et pour lesquels les personnes interrogées désirent garder leur anonymat. Elle consiste à mélanger l’ensemble des données, de telle sorte que celles-ci restent valables statistiquement, tout en rendant une remontée à la source impossible. Le premier usage de cette technique avait pour but de savoir si les sondés étaient porteurs ou non de maladies sexuellement transmissibles.???????????????????????

Concrètement, l’image suivante peut être utilisée pour expliquer le fonctionnement de RAPPOR. Une question du type « Êtes-vous membre du Parti Communiste » est posée à un sondé. Ce dernier lance alors une pièce de monnaie en secret, et répond obligatoirement par « oui » si la pièce de monnaie tombe sur le côté face. Dans le cas contraire, c’est-à-dire si la pièce tombe sur le côté pile, il doit dire la vérité. Cela permet à la personne interrogée de pouvoir nier la véracité de sa réponse, et surtout aux chercheurs de pouvoir établir une occurrence statistique.

Quel usage de ces données ?

RAPPOR a été utilisé pour la première fois dans le but de savoir quels utilisateurs avaient recours à quels produits Google. Étant encore en cours d’expérimentation, le célèbre moteur de recherche a indiqué que l’outil n’a pour l’instant connu qu’un déploiement limité sur le navigateur Google Chrome, où il est utilisé pour l’amélioration des rapports envoyés par des clients volontaires. Les autres modalités d’application n’ont pas encore été dévoilées.

Pour le moment limité, il est possible d’envisager des usages de ce fonctionnement dans le secteur de l’assurance. En effet, disposer de sources d’informations aussi vastes et aussi diverses représente un avantage certain. Les assureurs, grâce à l’algorithme développé par Google, pourraient être en mesure d’établir des comportements types grâce aux échantillons récoltés. Concrètement, cela permettrait de fixer de manière précise les tarifs des polices d’assurances grâce à estimation  fine du niveau de risque auquel sont confrontés différentes populations clients, du fait de leurs agissements. De manière analogue, l’algorithme et les données qui en découlent trouveraient également des usages dans le domaine de la santé, un secteur où les objets connectés sont de plus en plus présents.

Avec RAPPOR, Google franchit un pas de plus dans la collecte d’informations auprès du grand public. Même s’il est aujourd’hui difficile de dire comment et dans quelle mesure cet outil sera utilisé, et malgré les inquiétudes que cela peut soulever, il est tout de même évident que les usages potentiels de tels échantillons de données créés par cet algorithme anonymisant seront nombreux.