‘El "Clean" de la DCR: privacidad y seguridad’, por Marta Herrero

“Data Clean Room” son tres palabras que, por separado, nos definen exactamente los tres pilares de la plataforma a la que nos referimos: datos, limpios, en un espacio específico. Lo que hace “Clean” a una DCR, son todos los mecanismos de privacidad, gobernanza de datos y seguridad añadidos a ésta.

Analizamos el “Clean” de la DCR

Las herramientas técnicas que dan seguridad y privacidad a mi DCR, se definen como PETs (Privacy Enhanced Technologies) y, no dejan de ser, controles de privacidad granulares que se adaptan a la necesidad de cada marca, partner, set de datos, caso de uso o, incluso, campaña.

La teoría da un nombre específico a cada una de esas herramientas de privacidad. Hoy vamos a verlo desde un punto de vista más de “calle”. ¿Qué controles de seguridad suelen tener las Data Clean Rooms?

  • Encriptado y pseudonimización

Consiste en añadir “capitas” extra a ciertos datos más sensibles, como pueden ser datos PII o IDs propios de los clientes (loyalty card, ID Cliente). Existen métodos para pseudonimizar el PII como identificadores más seguros. También se aplican hasheos extra para todos esos identificadores de cliente. Todo ello con el objetivo de hacer más segura una transferencia de datos o compartición de los mismos.

  • Reglas de uso de los datasets 

En una colaboración de datos, se garantiza el uso de datasets de un partner a otro. Mantener el control de forma granular sobre qué se está compartiendo es una pieza clave dentro de la colaboración. 

Imaginemos que damos acceso a diferentes datasets a través de un cuadro de creación de queries para poder navegar esos datos de forma avanzada. Es aún más imprescindible que podamos definir exactamente sobre qué datos se pueden aplicar qué queries, qué campos vamos a mostrar de forma individual o agregada, y qué dos datasets permitimos unir o no.

  • Adición de ruido

Además de la creación de datos agregados, podemos añadir “ruido” a los mismos, para que la información se sea aún más difícil de identificar, sin interferir con el objetivo que se busca con la creación del segmento. Es decir, si el objetivo es realizar análisis sobre esos datos, el ruido se añade de tal forma que se mantienen tendencias que no interfieran en una estadística final. La integridad de los datos se mantiene.

  • Límites mínimos

También podemos jugar con una selección de un límite mínimo que consideremos que puede dar información relevante, sin que exista ningún riesgo de re-identificación o revelación extra de información. De esta forma, la agregación de resultados cobra aún más sentido.

  • Minimización de datos

Esta es una norma que nos habla de compartir el mínimo de datos posible que sea requerido para el objetivo final, ya que compartir todos los datos que tenemos, muchas veces, no es necesario para extraer ciertos outputs. Poder seleccionar de forma granular qué tipo de datos sí quiero compartir para cierto caso de uso sigue esta norma. Por ejemplo, probablemente compartir el DNI de tus clientes no agrega valor para una colaboración de datos con activación final, por ende, no es necesario compartirlo.

  • Revocación de accesos y expiración de tiempos

Esta regla hace mención al garantizar un horizonte finito temporal para la compartición de esos datos, donde el dueño de los mismos pueda revocar ese acceso en el momento en el que decida. Es necesario poder establecer unas fechas de inicio y final, garantizar que ese acceso será revocado y, desde ese momento, solo el dueño de los datos podrá acceder a ellos.

Estas herramientas sólo son un ejemplo de técnicas que aseguran una privacidad extra en la gestión de datos. Aunque existen más estándares de mercado, este artículo aborda lo más básico e interesante para poder adentrarnos en el mundo de la DCR.

La conclusión de todo ello es que una Data Clean Room ha sido construida y diseñada con estos mecanismos como pilar base de la misma. Es por esto que otras herramientas de gestión de datos de first party no consideran como parte de su ADN algunos de estos mecanismos. Si pensamos en un CDP, es perfecto a la hora de gestionar datos de una misma empresa pero incapaz de realizar una colaboración de datos con el mismo nivel de privacidad y seguridad. Una Data Clean Room cubrirá la gestión de datos de first party así como la colaboración segura con partners externos.

Marta Herrero

Anterior
Anterior

‘MediaMarktSaturn y Unlimitail: ¿cambian las reglas del juego?’, por Salvatore Cospito

Siguiente
Siguiente

‘Cómo la desaparición de un player impacta en el performance global de Google Shopping’, por Miguel Aguado