Saltear al contenido principal
1-800-987-654 admin@totalwptheme.com
Sobre La Anonimización Del Social Data

Sobre la anonimización del Social Data

Un dato es anónimo cuando no es posible su vinculación con la persona a la que está asociado, teniendo en cuenta que el riesgo de identificación puede aumentar con el tiempo.

Esta definición de datos anónimos es muy completa, pero generalmente se malinterpreta, y aquí es donde surgen los problemas habituales que entran en conflicto con la legislación en materia de tratamiento de datos que nuestras empresas tienen que cumplir.

Primero de todo, porque la anonimización de los datos no se cumple pese a que haya generado una base de datos con identificadores únicos. Si por ejemplo, tenemos datos de nuestros clientes, y queremos compartirlos de forma anónima con un stakeholder, no bastaría con que le pasemos la misma base de datos cambiando los datos identificativos (email, nombre, dni,…) por un identificador único. Mientras exista una base de datos en bruto, no se cumple el principio de anonimización.

Tampoco serviría de nada la pseudonimización (cambiar un identificador como puede ser el email por otro aparentemente no relacionado, como puede ser un número aleatorio). La ventaja del tratamiento de grandes volúmenes de información, y en especial, de herramientas como las custom audiences de Facebook, radica en encontrar patrones que identifican indirectamente a la persona física.

El linkability precisamente ofrece una manera eficaz de identificar los mismos sujetos en dos bases de datos distintas, poniendo entonces en peligro la privacidad de los datos, y quizás, incumpliendo algún tipo de confidencialidad que podría acarrearnos problemas legales mayores.

Conociendo esto, si en realidad lo que queremos es realizar estudios analíticos (cuantitativos o cualitativos) en los que no se exponga ningún tipo de dato que podría, directa o indirectamente, ser asociado con una identidad, hay varias estrategias que podríamos usar:

  • La asignación al azar: Se trata de alterar la integridad de los datos de manera que no haya ningún tipo de vínculo real entre el dato y el sujeto del que se ha obtenido el dato. Claro está, nos sirve únicamente en situaciones en las que el análisis se basa en la vinculación de datos de la misma categoría por separado, y no en el pareado de varios, aunque existen acercamientos (como el de la permutación) que permiten mantener la distribución exacta de la base de datos inicial incidiendo únicamente en los valores. La privacidad diferencial (añadir un margen de ruido que se contabiliza como error) y la adición (agregar ruido en algunos datos manteniendo la misma distribución) son otros modelos de asignación al azar.
  • La generalización: Que nos permite crear grupos de valores disociando la identidad del sujeto con el identificador de los datos anonimizados. Aquí entran en juego varios algoritmos de distribución como los de aggregation y k-anonymity.

Mediante alguna de estas técnicas se puede obtener en verdad una base de datos anonimizada probabilísticamente semejante a la original. Por supuesto, es labor del analista conocer y tratar adecuadamente ese error inherente en cualquier sistema de anonimización.

Esto para cuando la anonimización es necesaria (legal o moralmente) para el estudio que queremos realizar. Si por el contrario prima la exactitud (por ejemplo para realizar campañas publicitarias) y no hay factores exógenos que obliguen a este tratamiento (bien de cara al sujeto, bien de cara a la normativa respectiva), no deberíamos tener problema en tratar la base de datos directamente, o pseudonimizarla para su tratamiento por parte de una consultora especializada, como es el caso de SocialBrains.

En todo caso, conviene saber a qué estamos exponiendo nuestros datos, sean en efecto datos de nuestra compañía, o como no, también datos que otras compañías tienen de nosotros como clientes/usuarios/partners.

¡Felices fiestas!

Pablo F. Iglesias

Analista de información en Nuevas Tecnologías y Seguridad Informática, Consultor de Estrategia y Marca, aportando masa gris como Ejecutivo de Tecnología y Seguridad en SocialBrains, que no es poco :).

Esta entrada tiene 8 comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies

ACEPTAR
Volver arriba