Fue a principios de 2020 cuando Google anunció que iban a acabar con las cookies de terceros en Chrome marcando un antes y un después en el uso de estas. Fue el primer movimiento clave como parte de la iniciativa 'Privacy Sandbox' con que la dicen estar buscando formas de "crear estándares abiertos para mejorar la privacidad en la web".
Pero antes de poder decir adiós definitivo a las cookies de terceros, Google necesita encontrar un balance entre preservar la privacidad de los usuarios y sostener a una web que vive a base de anuncios, anuncios que en muchos casos provee la misma empresa. Su último experimento es uno en el que el rastreo de usuarios se intenta hacer de forma privada usando grupos con intereses similares para intentar preservar la privacidad individual.
El aprendizaje federado de cohortes
En Genbeta hemos conversado con Chetna Bindra, directora de producto para la confianza del usuario, privacidad y transparencia en Google, sobre una API en la que están trabajando como parte de los experimentos de Privacy Sandbox: Federated Learning of Cohorts (FLoC).
FLoC es una API enfocada en la privacidad que se centra en cohortes o grupos de usuarios que tienen hábitos de navegación similares. El principio general de esta API es que a los usuarios individuales no podrán ser distinguidos dentro de un grupo, puesto que solo se revela el identificador del cohorte y no del individuo.
Como todos los usuarios del grupo tienen intereses similares, entonces los modelos de identificación como los de publicidad personalizada, serían tan buenos como los que rastrean individuos. Con FLoC se utilizarán una serie de algoritmos de aprendizaje automático para crear clusters dentro del navegador.
Lo ideal es que los grupos sean privados, es decir, que no revelen información que sea demasiado personal, ni cuándo se crearon ni cuándo se usan. Los grupos se crean basados en los sitios que visita un individuo, ya sean en las URLs, en el contenido de esas páginas, o en otros factores.
El punto más importante es que toda la información con la que se alimente al algoritmo, incluido el historial web, se mantenga local en el navegador y no se suban ningún otro lado. El navegador sólo expone el cohorte generado, y además debe asegurar que las cohortes estén bien distribuidas, de modo que cada una represente a miles de personas y siempre aprovechar otros métodos de anonimización, como la privacidad diferencial.
Todo será de código abierto
De momento, FLoC es un experimento que aún tiene mucho camino por delante y mucho espacio para mejorar, pues nada se ha probado hasta ahora de forma externa. Google planea publicar esta API en GitHub y será completamente open source.
Mientras tanto, las normas 'SameSite' que se introdujeron en febrero de 2020 con Chrome 80 seguirán siendo la solución temporal para mitigar los riesgos de privacidad y seguridad que supone el rastreo que hacen las cookies de terceros. Al menos hasta el 2022 que fue la fecha límite que pusieron.
Las cookies de terceros representan una de las principales formas de rastrearnos en la web, ya que permiten acceso externo a nuestros datos de navegación a otros dominios que no son los que estamos visitando en ese momento. Navegadores como Firefox las bloquean hace bastante tiempo, y Safari las comenzó a bloquear el pasado mes de marzo con la versión 13.1.
Ver 9 comentarios