L’anonymisation est le processus par lequel suffisamment d’éléments d’un jeu de données vont être retirés afin de rendre l’identification impossible. C’est une méthode de protection de la vie privée.
L’anonymisation ne doit pas être confondue avec la pseudonymisation. En effet, à l'inverse de l’anonymisation, la pseudonymisation se base sur le remplacement de données directement identifiantes par des données indirectement identifiantes. Cela signifie que l'identité des individus peut être retrouvée par l'utilisation de données tierces ou par des clés de chiffrement alors que l’anonymisation est, elle, irréversible.
Le processus d’anonymisation cherchant à éliminer toute possibilité de ré-identification plusieurs types de méthodes vont être utilisés. Mais ces dernières se rejoignent autour de deux principes:
- la transformation des données pour qu’elles ne se réfèrent plus à une personne réelle
- la généralisation des données de façon à ce qu’elles ne soient plus spécifiques à une personne mais communes à un ensemble de personnes.