Tutoriales

Fingerprinting: así te identifican sin usar cookies

El fingerprinting es la técnica de tracking y seguimiento de usuarios en páginas web más usada por detrás de las cookies. ¿Sabías que, sin la necesidad de estas últimas, se puede crear una huella digital de tu paso por la red? En este artículo desgranaremos cómo la huella de tu navegador puede “delatarte”, y que conozcas cómo un sitio web puede identificarte sin necesidad de usar ninguna cookie. ¡Comenzamos!

Índice de contenidos

Toggle

Cómo funciona una cookie: ¿por qué buscar alternativas?

Antes de nada, es necesario que conozcas cuál es el mecanismo básico de funcionamiento de un sitio web que usa cookies.

En tu primera visita a esa web, el servidor de la página le dará a tu navegador un archivo muy pequeño (la cookie) que contendrá un identificador junto con otros datos. Entonces, en las sucesivas visitas que hagas a la web (mientras dure la cookie, que tiene una expiración concreta) el navegador le entregará ese archivo al servidor, que generalmente usará el identificador para acceder a una base de datos con toda la información que hayan guardado.

Diagrama de funcionamiento de una cookie.

Este es un mecanismo genial para guardar todo tipo de información de preferencias de un usuario en un sitio web, pero como sabéis también se emplea con fines de seguimiento que a veces se escapan de lo ético. Por eso, desde hace años hay un gran empeño contra las cookies por parte de los gobiernos, y en particular de la Unión Europea, cuyo reglamento de protección de datos (GDPR) obliga a poner el conocido aviso de cookies, que los usuarios pueden rechazar.

De ahí afloran nuevos métodos para hacer seguimiento a las personas por Internet, que son un complemento fácil y poderoso a las cookies.

Fingerprinting: ¿sabes toda la información que dejas al visitar un sitio web?

La base del fingerprinting está en aprovechar todos los metadatos sobre tu dispositivo que dejas al acceder a una página web. Estos los podemos dividir en tres grupos: partes de la cabecera HTTP, información JavaScript, e información de red. Démosles un repaso.

Partes de la cabecera HTTP

Cuando accedemos a una página web, lo que hace el navegador es enviar una petición HTTP al servidor del destino. Estas peticiones cuentan con una cabecera con toda la información necesaria para obtener la página requerida. Además, también incluyen datos básicos del navegador, como son los siguientes:

Agente de usuario, es decir, el navegador y sistema operativo usado: navegador, versión, SO, arquitectura del SO, y motor del navegador.
Tipo de multimedia aceptable para la respuesta.
Métodos de compresión soportados por el navegador.
Preferencias de idioma del navegador para obtener la respuesta.
Preferencia de obtención de página segura o no.
…

Todo esto sienta el primer precedente para la identificación, aunque evidentemente no son unos datos extremadamente variados.

Información JavaScript

Además de toda la información integrada en el protocolo HTTP, que no es demasiado para una acción de fingerprinting, tenemos que mencionar todo lo que se puede obtener mediante JavaScript, aprovechando el potencial de los motores de los navegadores. Sin JS la web no existiría tal y como la conocemos, y desaparecerían muchos servicios interesantes. Pero desde luego también se le puede da run uso malicioso o, cuanto menos, cuestionable.

En este caso os vamos a dar la lista de algunos de los atributos que nos consigue la web AMIUnique de la que os hablaremos a continuación:

Cookies activadas o no.
Zona horaria del usuario.
Idiomas preferidos del navegador del usuario.
Lista de tipografías del equipo.
Uso de la extensión AdBlock
Indicación “do not track” del navegador.
Propiedades del navegador.
Concurrencia de hardware (número de hilos del equipo).
Memoria aproximada del equipo.
Plugins activados.
Resolución de pantalla.
Permisos otorgados.
Renderizador WebGL, para desvelar la tarjeta gráfica del equipo.

Hay todavía más datos, y ciertamente nos permiten dar una imagen bastante clara de identificación del usuario a base de cruzar toda esta información mediante métodos que evidentemente no son sencillos, pero que una empresa con grandes capacidades en cuanto a minería de datos podrá explotar bien.

Información de red

Aparte de la información localizable por las características de JavaScript del navegador, está claro que también se puede extraer mucha información en relación a la red utilizada para acceder al sitio.

Partiendo de nuestra dirección IP pública, el servidor web puede conocer fácilmente una estimación de nuestra geolocalización, evidentemente todo dependerá de lo bueno que sea el sistema usado y de si nuestra IP es propensa a ser bien geolocalizada o no. Se puede dar el caso de que adivinen la ciudad o incluso el pueblo pequeño en el que vivimos, pero también podemos ver a otros servicios identificándonos en una región totalmente distinta a la que habitamos.

Otras características de la red que son fácilmente detectables incluyen, por ejemplo, el sistema autónomo o ASN utilizado, que tiene que ver básicamente con las direcciones IP que se le tienen asignadas. Aquí lo que conseguirían sería una buena determinación de nuestro proveedor de servicios de Internet, por ejemplo en mi caso una simple comprobación en WhatIsMyASN llegaría a uno de los ASN asignados a Vodafone España.

Huella canvas, un tipo muy concreto de fingerprinting

Dentro de este contexto, otra forma de seguimiento muy importante es la huella canvas, también llamada canvas fingerprinting, y que consiste en emplear el elemento canvas de HTML5 en vez de las cookies o los demás datos que os hemos enseñado.

¿Cómo funciona este método? Básicamente, cuando un usuario entra a la página, se intenta dibujar un elemento canvas 3D oculto (un canvas en HTML5 se usa para dibujar gráficos), del que se consiguen extraer ciertos datos como el tiempo de renderización de la GPU, los cuales permiten convertir todas las pequeñas variaciones entre navegadores y equipos a un “token” único que actúa como huella digital.

¿Hasta qué punto puede favorecer el seguimiento? En un estudio con unos 300 participantes, se encontró una variabilidad de unos 5 o 6 bits en la huella obtenida en el mismo usuario. Por ello, no es un método que de por sí vaya a dar un gran potencial de identificación, pero es una herramienta más para ejercer un seguimiento relacionado con publicidad.

¿Qué se puede hacer con tanta información?

Una gran pregunta está en hasta qué punto se puede sacar provecho de tanta información, con los fines económicos a los que estamos acostumbrados. Y es que parece que no podemos sacar demasiado de aquí, puesto que se carece de la personalización implícita en las cookies. Pero mediante el uso del big data y minería de datos, y el poder de gigantes como Facebook y Google, se puede crear un perfil anónimo bastante fiel de un usuario y mostrarle publicidad personalizada, o incluso aprovechar inicios de sesión u otras cookies para determinar de manera fehaciente que quien está navegando es una persona concreta.

Una gran empresa con un volumen de tráfico alto y variado, y donde además millones de otras páginas inyectan su código, tiene un buen potencial para hacer fingerprinting.

Descubre tu vulnerabilidad al fingerprinting con AMIUnique

Una de las páginas webs más interesantes para demostrar la existencia de esta técnica es AMIUnique (“¿soy único?”), donde al entrar se nos registrarán todos los datos antes mencionados, para así determinar hasta qué punto nuestra huella es única en su base de datos.

Para cada dato, nos darán el % de usuarios que comparten esa característica, lo cual nos puede dar una idea muy interesante de qué aspectos nos delatan más. Vamos con un ejemplo, donde me compararé con unas 120.000 huellas distintas recabadas en los últimos 30 días:

Desde luego, el sistema no nos delata y el navegador tampoco, pero sí la versión concreta o en este caso también el idioma, pues tengo seleccionado gallego, español e inglés, algo que la web sabe perfectamente.

Seguimos viendo cómo efectivamente se comprueba mi huella canvas, e incluso el servidor puede conseguir una lista de más de 200 tipografías instaladas en mi sistema, o 40 propiedades concretas del navegador. La clave está claramente en una correcta triangulación de todos estos datos, y evidentemente en analizar todos los demás rastros que vamos dejando a la hora de navegar. Teniendo en cuenta además que se suele seguir recurriendo a las cookies, la combinación de esto con el fingerprinting y otras pequeñas pistas residuales que dejamos a la hora de navegar puede favorecer nuestra identificación.

Cómo evitar el seguimiento por fingerprinting

Es evidente que la mayoría de usuarios no toma acciones contra estas formas de seguimiento, incluso si conocen todos los métodos usados por las grandes empresas como el fingerprinting. Es una cuestión que cada uno debe valorar. Por ejemplo, personalmente no tomo ninguna acción contra esto, pero seguro que mucha gente ve más riesgos que beneficios. Entonces, ¿cuáles son los métodos más razonables para evitar el fingerprinting? Vamos a enumerar rápidamente algunas ideas:

Revisa las extensiones de tu navegador. Si tienen permisos excesivos, podrían estar aprovechando tu navegación para hacer fingerprinting. Idealmente se recomienda no usar ninguna extensión.
Si no puedes evitar ser único, selo varias veces. Podría ser más complicado seguirte si usas varios navegadores o redes para las distintas tareas que haces en Internet.
Usa un navegador respetuoso con la privacidad. No vamos a entrar en grandes detalles, más allá de indicar que por ejemplo Firefox dice bloquear las solicitudes de servidores asociados con empresas conocidas por usar técnicas de fingerprinting.
Usa servicios más respetuosos con la privacidad. Está claro que además del navegador están los propios servicios que usamos. Aunque sea difícil deshacerse al completo de Facebook o Google, puedes intentar buscar alternativas, como hacer búsquedas con DuckDuckGo. Esto es quizás lo más difícil de cumplir pues muchos no están dispuestos a irse a un peor servicio a cambio de mayor privacidad. También puedes intentar deshabilitar todos los ajustes de seguimiento que los servicios que uses te dejen cambiar, o rechazar el uso de cookies, pero siempre habrá cosas inevitables.
¿Quizás usar un VPN? Teóricamente estos servicios evitan tácticas de seguimiento, pero hay un gran debate sobre si realmente cuidan la privacidad de los usuarios, así que lo dejamos como interrogante. Lo que desde luego sí ayudaría sería usar Tor, cuyo navegador se empeña mucho en intentar hacer parecer a todos los usuarios iguales, aunque la desventaja será la velocidad de la red.

Se podrían mencionar muchas más técnicas que podrían ayudar a dificultar el seguimiento, pero no estamos lo suficientemente seguros de su utilidad.

En general, es bastante difícil escapar de las garras de los gigantes tecnológicos, pero desde luego no es imposible si nos empeñamos en hacerlo. Todo dependerá de la decisión de cada uno, pues está claro que una buena parte de las personas que conocen estas prácticas deciden rendirse o simplemente ignorar su existencia. Es sin duda una interesante materia de debate que se sale de los propósitos de este artículo, pero para ello también está la caja de comentarios.

Conclusiones

La Web ha avanzado muchísimo en los últimos años. No solo tenemos una mayor cantidad de servicios y utilidades disponibles, diseños más detallados y únicos, funcionalidades antes impensables, mejoras en seguridad… Pero también han aflorado muchas cosas malas. Y no hablamos de sitios insistiendo en activar notificaciones y suscribirse a newsletters, sino de técnicas de seguimiento de los usuarios que se emplean con propósitos comerciales o incluso maliciosos.

La técnica de tracking por excelencia son las cookies, donde un “acuerdo” entre navegador y servidor web, con el beneplácito implícito del usuario, llevan a almacenar un pequeño fichero en nuestro equipo que servirá de identificador en las sucesivas visitas al sitio web. Algo que nos permite guardar preferencias, sesiones u otra información importante, pero también permite que sigan nuestro rastro por la página. En el caso de los gigantes tecnológicos como Facebook o Google, también consiguen seguirnos por miles de sitios web gracias a la integración de sus servicios con ellos, y así nos muestran todo tipo de publicidad personalizada.

Tenemos más guías que te podrían interesar:

Con las cookies en el punto de mira, también afloran técnicas alternativas de trackeo. El fingerprinting es la más importante, y a ella le hemos dedicado este artículo. Se basa en algo tan simple como recabar todos los metadatos posibles que dejamos al acceder a la web, con banalidades como el idioma preferido, navegador usado, preferencias, y decenas de pequeños detalles más. Cuando se combinan todos, consiguen identificarnos de forma única. No sabrán cómo nos llamamos, pero no importa: con técnicas similares a las cookies pueden llegar a saberlo, y en todo caso sí sabrán cientos de preferencias e intereses que podrán usar con fines comerciales.

Es importante saber que esto existe, y a partir de ahí cada uno podrá decidir si tomar acciones al respecto o no. Esta cuestión ya se saldría de los propósitos originales del artículo, que no van más allá de informar, pero desde luego es una materia de debate muy interesante, y como siempre queda abierta la caja de comentarios 😉

Siguiente Comparativa entre HDR y SDR, ¿merece la pena pagar más por un monitor? »

Anterior « Antec P120 Crystal White, caja con diseño totalmente blanco y con cristal

MSI MPG 321CURX QD-OLED Review en Español (Análisis completo)

MSI MPG 321CURX QD-OLED es el nuevo monitor gaming de gama premium de la marca…

29 minutos atrás

Tutoriales

Cómo ver el código fuente de una web en el PC y en el móvil

En esta guía te voy a explicar cuáles son los pasos que debes seguir en…

1 hora atrás

Tarjetas gráficas

Game Ready 576.15 es lanzado y soluciona un bug con los sensores de temperatura

Los controladores Game Ready 576.15 han sido publicados, que vendría a ser un “hotfix” basado…

2 horas atrás