Diferencias entre datos de identidad deterministas y probabilísticos

Los datos de identidad "deterministas" y "probabilísticos" se han convertido en las nuevas palabras de moda en los círculos publicitarios digitales. Estos términos son conocidos desde hace años por los anunciantes on line, los editores y los ejecutivos de la industria adtech. Pero, ahora que todo el sector está buscando alternativas a las cookies de terceros, parece que se utilizan con más frecuencia, sobre todo al describir el funcionamiento de los nuevos identificadores sin cookies.

La tecnología publicitaria, por supuesto, está plagada de terminología inventada. Esta vez no. Los métodos deterministas y probabilísticos para establecer conexiones de datos identificables existen desde hace años y en relación con una variedad de áreas temáticas que no tienen absolutamente nada que ver con la publicidad digital, desde la salud pública hasta la educación y el análisis de riesgos.

¿Qué son los datos deterministas?

Los datos deterministas son información que se sabe que es verdadera y exacta porque la suministran directamente las personas o es personalmente identificable, como los nombres o las direcciones de correo electrónico. A menudo se denominan datos autentificados.

¿Qué son los datos probabilísticos?

Los datos probabilísticos se basan en probabilidades. Se componen de piezas individuales de información, como el sistema operativo de un dispositivo o la dirección IP, y se compilan para llegar a una conclusión. En el caso de la tecnología publicitaria, los datos probabilísticos pueden utilizarse para crear un identificador.

¿Cómo se utilizan los datos deterministas para la identidad publicitaria?

Los identificadores deterministas utilizan datos deterministas para asignar una identidad a una persona en línea o que utiliza un dispositivo móvil con el fin de rastrear a esa persona identificada a través de sitios web o aplicaciones para la orientación publicitaria o la medición. El ingrediente clave de la identidad determinista suele ser la información que alguien ha proporcionado por sí mismo, normalmente al iniciar sesión con un nombre, una dirección de correo electrónico o un número de teléfono.

Entonces, ¿los datos deterministas son lo mismo que los datos de origen?

Bueno, a veces. Los datos de origen recogidos directamente de las personas por una marca o un editor incluyen datos deterministas como nombres, correos electrónicos o números de teléfono. Pero los datos de origen también incluyen una variedad de información que refleja las acciones realizadas en un sitio web, los artículos leídos, las transacciones de compra u otros datos de comportamiento.

Entonces, ¿cómo se utilizan los datos deterministas para asignar la identidad?

La identidad determinista se consigue cuando una dirección de correo electrónico suministrada por un editor o anunciante coincide con la misma dirección de correo electrónico en una base de datos de usuarios conectados. O bien, una coincidencia de identidad determinista podría ocurrir si dos entidades reconocen una identidad y pueden hacerla coincidir con precisión. A veces se pueden utilizar tres piezas de información determinista para conectar los puntos. Por ejemplo, si se sabe que ID1234 es pepe@cerezo.com y pepe@cerezo.com es ID6789, entonces ID1234 es una coincidencia determinista con ID6789. En definitiva, para conseguir una coincidencia determinista, los campos de datos deben coincidir.

Entonces, ¿qué son los datos probabilísticos y cómo se utilizan para la publicidad?

En primer lugar, hay que explicar por qué se utilizan los datos probabilísticos. Los datos deterministas son difíciles de conseguir. Muy a menudo los sistemas de tecnología publicitaria no pueden hacer coincidir las identidades porque alguien no ha iniciado la sesión o porque no se dispone de una dirección de correo electrónico u otro dato determinista. Cuando los anunciantes se quejan de las bajas tasas de coincidencia, es porque hay una falta de enlaces de datos deterministas.

Los sistemas que utilizan métodos probabilísticos emplean una serie de datos para descifrar quién puede ser un usuario. La forma más fácil de pensar en estos métodos es que asignan una identidad que probablemente sea exacta. Básicamente, toman su mejor conjetura para inferir la identidad.

Cuando los editores quieren asignar una identidad a alguien que no ha iniciado sesión, o una plataforma de demanda o un proveedor de gráficos de identidad quiere averiguar si hay una coincidencia entre un visitante del sitio y otra identificación existente, emplean métodos probabilísticos para asignar la identidad basándose en una serie de puntos de datos probabilísticos.

¿Comunican las empresas si una identidad ha sido asignada basándose en datos deterministas o probabilísticos?

Aunque las empresas de tecnología de la identidad proporcionan información sobre cómo crean o vinculan las identidades en la documentación técnica y en los materiales proporcionados a los clientes, sus propias identidades no revelan si se utilizan métodos deterministas o probabilísticos. De hecho, algunas empresas adoptan un enfoque híbrido para crear o relacionar identificadores.

¿Qué tipo de información se utiliza para asignar la identidad probabilística?

Algunas empresas de tecnología de la identidad llaman a la información utilizada para reconstruir la identidad probabilística "señales blandas" o "características no únicas del dispositivo". Los datos típicos que se utilizan son la dirección IP, las marcas de tiempo, la versión del navegador o la resolución de la pantalla.

Pero, no es esto los mismo que una huella digital?

La huella digital también triangula una variedad de puntos de datos para establecer la identidad, pero los ejecutivos de tecnología de publicidad e identidad a menudo enfatizan que hay distinciones entre los dos. Están particularmente obligados a establecer distinciones porque la práctica de la huella digital ha caído en desgracia, especialmente desde 2019, cuando Google dijo que su navegador Chrome restringiría su uso y desde que la compañía prohíbe a los socios proveedores de tecnología publicitaria usar la huella digital para la identificación. Otros navegadores como Safari y Firefox también restringen el fingerprinting.

Las empresas que emplean métodos de identificación probabilística dan diversas razones para explicar por qué sus técnicas son distintas de la huella digital. Pero las distinciones pueden parecer enrevesadas o semánticas.

Por ejemplo, algunas empresas de tecnología de ID argumentan que la toma de huellas digitales suele producirse principalmente en el lado del anunciante, cuando estos o las empresas de tecnología publicitaria quieren crear identificadores persistentes sin el conocimiento o la aprobación de las personas o los editores. Otros, sin embargo, afirman que la huella digital se produce en el lado del editor, cuando los editores quieren crear identificadores. Otros sugieren que la distinción radica en que la toma de huellas digitales sólo se produce a nivel de dispositivo.

Anterior
Anterior

¿Qué son las Cleaning Rooms o salas limpias de datos?

Siguiente
Siguiente

El identificador UID2.0 de The Trade Desk