anonymisation de contenu ou déréférencement des moteurs de recherche ?
Sommaire
Déréférencement ou anonymisation de contenu
Du fait qu’elle est accessible à tous, il importe de prendre grand soin de notre image sur le web. Simplement en tapant le nom et le prénom d’un individu dans un moteur de recherche, il est possible d’obtenir des informations plus ou moins détaillées sur ses expériences vécues, les personnes côtoyées, sa localisation et bien d’autres informations.
Cependant, certains résultats de recherche peuvent porter atteinte à notre e-réputation (notre image sur la toile). Grâce au déréférencement des moteurs de recherche, il est possible de supprimer ou de réduire un tant soit peu cette influence négative. Voici ce dont nous parlerons dans ce billet.
Qu’est-ce que le droit à l’oubli ?
Le déréférencement des moteurs de recherche (déréférencement Google par exemple), encore connu sous le nom de droit à l’oubli, est le fait de pouvoir adresser aux moteurs de recherche une demande de suppression de certains résultats, de certaines données fournies par ces moteurs après une recherche faite en inscrivant dans la barre de recherche le nom et le prénom d’un individu.
Ces informations peuvent être jugées obsolètes, excessives, ou inappropriées, portant ainsi atteinte à l’e-réputation de personnes physiques et morales. Cependant, ces informations ne disparaissent pas pour autant.
Elles ne changent pas et sont toujours accessibles par une requête avec d’autres mots-clés ou en allant directement sur le site internet à l’origine de la diffusion.
Le déréférencement Google est assez aisé, car un formulaire est disponible sur le site de Google pour accélérer la démarche.
Que dit le droit sur le déréférencement ?
Le Règlement Général sur la Protection des Données (RGPD) qui régit la protection des informations personnelles dans toute l’Union Européenne encadre parfaitement le traitement des données personnelles et renforce leur protection.
L’article qui aborde la notion de déréférencement tout en définissant tous ses tenants et aboutissants est l’Article 17 libellé par Le Droit à l’effacement (« droit à l’oubli »). Cet article comporte trois paragraphes :
Paragraphe 1 de l’Article 17 du RGPD
Ce premier paragraphe dispose que l’individu en question a la légitimité d’obtenir de la part du moteur de recherche, la suppression dans des délais relativement courts, des informations sur sa vie privée.
Il dispose également que le moteur de recherche a l’obligation de supprimer ces informations privées dans les plus brefs délais au cas où l’une des situations suivantes se présente :
- « Les informations à caractère personnel n’ont plus vraiment d’importance vu les raisons pour lesquelles elles ont été rassemblées ou traitées d’une autre manière.
- L’individu en question n’est plus consentant avec l’accord de traitement, et ce dernier ne repose plus sur aucun accord juridique.
- L’individu en question est contre le traitement de ses données grâce à l’article 21 et le traitement n’a aucun motif valable pour surplomber ce refus.
- Les informations privées ont été traitées de façon illicite.
- Les données à caractère personnel doivent être effacées pour respecter une obligation légale qui est prévue par le droit de l’Union ou par le droit de l’État membre auquel le responsable du traitement est soumis.
- Les informations personnelles ont été rassemblées sous couvert de l’offre de services de la société de l’information ciblée à l’article 8 ».
Paragraphe 2 de l’Article 17 du RGPD
Lorsqu’il a rendu publiques les données à caractère personnel et qu’il est tenu de les effacer en vertu du paragraphe 1, le responsable du traitement, compte tenu des technologies disponibles et aussi de la somme que cela va coûter, fait tout ce qui est en son pouvoir pour informer les techniciens en charge de ce traitement que l’individu en question a exigé la suppression de tout lien se rapportant à ces données sensibles et de toute reproduction de ces dernières.
Paragraphe 3 de l’Article 17 du RGPD
Les paragraphes 1 et 2 ne s’appliquent pas dans la mesure où ce traitement est nécessaire :
- à la non-violation du droit garantissant la libre expression et information ;
- au respect d’une obligation légale envers le traitement prévu par le droit de l’Union Européenne ou par le droit de l’État membre auquel le responsable en charge du traitement rend compte, ou pour exécuter une mission d’intérêt public ou relevant de l’exercice de l’autorité publique dont est investi le responsable du traitement ; (UE ou Hors UE ; Russie ; Etats-Unis…)
- pour des raisons d’intérêt national dans le domaine de la santé publique ;
- pour des raisons de sauvegarde dans l’intérêt général, pour des raisons de recherche scientifique ou historique ou pour des raisons d’études statistiques, le paragraphe 1 peut rendre impossible ou compromettre sérieusement la réalisation des objectifs dudit traitement ;
- pour des raisons de constat, ou de défense de droits en justice.
Qu’est-ce que l’anonymisation de contenu
L’anonymisation de contenu est la modification ou l’altération de données ou de leur agencement au niveau de la base de données, par l’utilisation de diverses techniques. Ceci, dans le but de compliquer ou d’empêcher carrément la « réidentification » des individus ou des structures en lien avec ces données.
La raison est très souvent la protection de ces individus et de leurs informations personnelles du fait d’un problème d’e-réputation déontologique, juridique et éthique.
Comment anonymiser du contenu ?
Dans le processus d’anonymisation de contenu, il convient d’établir certaines bases :
- définition de la finesse idéale et acceptable pour les données conservées ;
- séparation distincte des informations supprimables de celles qui ne le sont pas ;
- identification des données à ne pas supprimer, classées par ordre d’importance ;
- effacement des éléments d’identification directs, de même que les données moins sensibles qui permettraient quand même la ré-identification facile des individus.
Ces étapes préliminaires permettent de définir le choix ou la combinaison de techniques à utiliser pour anonymiser lesdites informations. Il en existe principalement deux familles :
- la randomisation : ces techniques consistent généralement à changer les attributs des données, altérant ainsi la véracité de ces informations. Voici une petite illustration de cette famille de technique. Si la date de naissance de l’individu X est 02/03/1991, la randomisation peut permuter le jour et le mois de naissance. On aura donc finalement 03/02/1991 comme date de naissance de l’individu X dans la base de données : identification désormais rendue difficile.
- La généralisation : elle vise à affecter l’échelle des attributs des données ou leur degré de précision, de sorte à augmenter de manière significative le nombre de cas possibles. Si nous prenons toujours le cas de la date de naissance de l’individu X, celle-ci peut être totalement remplacée par l’année de naissance uniquement, en l’occurrence 1991. Cette information n’est pas fausse, car X est effectivement né en 1991, mais manque cruellement de précision.
Autres articles sur le site ereputation déréférencement