La legislación relativa a la protección de datos incluye:
REGLAMENTO (UE) 2016/679 DEL PARLAMENTO EUROPEO Y DEL CONSEJO de 27 de abril de 2016 relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos y por el que se deroga la Directiva 95/46/CE (Reglamento general de protección de datos, RGPD)
Cabe mencionar que los datos anónimos o anonimizados, es decir, los datos que no permiten la identificación de individuos, no están sujetos a la legislación sobre protección de datos.
Recursos de interés:
Según el Reglamento General de la Protección de Datos (RGPD) un dato personal es toda información sobre una persona física identificada o identificable, como por ejemplo:
Además, la Ley Orgánica de Protección de datos (LOPD) identifica una serie de datos que requieren un tratamiento especial:
El tratamiento de estos datos está restringido salvo consentimiento explícito de la persona interesada o por causa justificada.
La LOPD recoge entre otros los siguientes derechos para las personas interesadas, que podrán ser ejercidos en cualquier momento:
Los datos anónimos son datos que no guardan relación con una persona física identificada o identificable. Por otra parte, los datos anonimizados son datos personales convertidos en anónimos de forma que el interesado no sea identificable.
Los datos anónimos y los datos anonimizados no son datos personales y, por tanto, no están sujetos a la protección de datos personales (RGPD, considerando 26).
La anonimización es un proceso que trata de encontrar el equilibrio adecuado entre la reducción del riesgo de reidentificación (por debajo de un determinado umbral) y el mantenimiento de la utilidad de un conjunto de datos para los fines previstos.
Aunque una anonimización del 100% es el objetivo más deseable desde el punto de vista de la protección de los datos personales, en algunos casos no es posible y debe contemplarse un riesgo residual de reidentificación. Cualquier proceso sólido de anonimización evaluará el riesgo de reidentificación, que debe gestionarse y controlarse a lo largo del tiempo
El RGPD diferencia la anonimización de la seudonimización:
Los datos seudonimizados sí se consideran datos personales y es necesario tomar las medidas de protección necesarias.
La Agencia Española de Protección de Datos ha elaborado una guía con los 10 malentendidos relacionados con la anonimización:
La k-anonimidad es una herramienta que nos ayuda a disminuir el riesgo de reidentificación de los individuos a través de sus cuasi-identificadores. La K-anonimidad permite cuantificar hasta qué punto se preserva la anonimidad de los sujetos presentes en un conjunto de datos en el que se han eliminado los identificadores.
Por ejemplo, en determinados conjuntos poblacionales, podría reidentificarse ciertos individuos al combinar cuasi-identificadores como el género, la fecha de nacimiento o el código postal

Fuente: Manolis Terrovitis - Amnesia Webinar June 2020
Según la Agencia Española de Protección de Datos, "se dice que un individuo es k-anónimo dentro del conjunto de datos en el que se encuentra incluido si, y sólo si, para cualquier combinación de los atributos cuasi-identificadores asociados, existen al menos otros k − 1 individuos que comparten con él los mismos valores para esos mismos atributos."
Es decir, la k-anonimidad permite la creación de grupos de individuos que no se diferencian entre sí en una serie de cuasi-identificadores:

Fuente: Manolis Terrovitis - Amnesia Webinar June 2020
Los métodos más comunes para lograr cierta k-anonimidad son la generalización a través de jerarquías o, en su caso, la supresión de datos.
La Agencia Española de Protección de Datos recomienda un umbral entre 3 y 5. Es necesario analizar en cada caso dependiendo del tamaño de la población identificable, las variables escogidas, etc.
La guía básica de anonimización, elaborada por Autoridad Nacional de Protección de Datos de Singapur y traducida por la Agencia Española de Protección de Datos recomienda las siguientes herramientas:
Además, existen herramientas que usan la inteligencia artificial (IA) y el procesamiento del lenguaje natural (LNP) para la anonimización automática:
Es importante recordar que la Agencia Española de Protección de Datos remarca la importancia de la intervención humana en todos los procesos de anonimización y que la vulneración de los derechos de las personas interesadas en materia de protección de datos personales puede constituir infracciones graves o muy graves (Ley Orgánica de la Protección de Datos Personales).
Amnesia es una aplicación de software de código abierto elaborado en el marco del proyecto OpenAIRE. Está destinada a la anonimización de datos personales.
Amnesia permite filtrar datos, crear máscaras y jerarquías de generalización La plataforma de Amnesia cuenta además con recursos y tutoriales.