¿Cuánto saben de nosotros?

Cada vez que visitamos un sitio web, damos nuestra información a raudales.  Unas veces conscientemente otras no tanto. A la fecha, los sitios web se han vuelto los vehículos para entregar información a terceros, con lo que se ha vuelto imposible saber cuánto saben de nosotros. El anonimato es una utopía.

Lo que entregamos conscientemente

Navegando en Internet, cada vez que entramos a un sitio web, nuestro navegador envía algunos datos al lugar que estamos visitando.

Por ejemplo (extraído de la Wikipedia):

127.0.0.1 jimbowales jimbo [17/Abr/2017:20:10:36 -0600] "GET /wiki.png HTTP/1.1" 200 51200

Un "-" indica la ausencia de ese dato.
  • 127.0.0.1 es la dirección IP del host remoto quien hace la petición al servidor.
  • jimbowales es el identificador descrito en el RFC 1413.
  • jimbo es el userid de la persona que pide el documento.
  • [17/Abr/2017:20:10:36 -0600] es la fecha, hora y la zona horaria en la cual se recibió la petición, normalmente en el formato strftime %d/%b/%Y:%H:%M:%S %z.
  • "GET /wiki.png HTTP/1.1" es la línea de petición del cliente. El método GET, /wiki.png el recurso pedido, y HTTP/1.1 el protocolo HTTP.
  • 200 es el código de estado HTTP devuelto por el servidor.
  • 51200 es el tamaño del objeto devuelto al cliente, medido en bytes.
Toda esta información se entrega desde siempre. No hay novedad en ello.

¿Se puede aprovechar esa información?


En el transcurso de los años, se ha evidenciado que hay mucha información oculta en esos pocos datos. Por ejemplo, el IP puede ser utilizado para localizar desde donde se ha conectado el visitante (país, ciudad, incluso --no en Bolivia--, la dirección).

Si a la fecha y hora se combinan el recurso solicitado, se puede «trazar» la conducta del visitante, es decir, qué le gustó y cómo llegó hasta ahí.

Empresas como Google, aprovechan toda esta información mediante herramientas como Analytics, que analiza cada una de las conexiones realizadas al sitio web e informan a los dueños del sitio mediante estadísticas y tendencias.

Desde la perspectiva de los dueños del sitio web, la mayor riqueza de la información radica en obtener las «tendencias» de los visitantes. Es decir, de qué país se conectan más, a qué horas o cuáles son sus patrones de conducta dentro el sitio web. Qué páginas gustaron. Cuáles no. Qué productos fueron más vistos. Etc.

Para los sitios web, los usuarios son anónimos y la información individual no es suficiente: se requieren grandes volúmenes de datos (conexiones de los diferentes visitantes) para determinar las tendencias.

Las cookies

Si el dueño de un sitio web requiere identificar al usuario, se usa un truco. En las convenciones donde van muchas personas que no se conocen, se escribe el nombre de la persona en una tarjeta y esa tarjeta se cuelga en un lugar visible de la persona, normalmente, en el pecho  (¿se acuerdan?) En inglés, a esas tarjetas con los datos de la persona se les conoce como cookies.

De igual manera, cuando una persona es identificada en el sitio web, el sitio web le coloca una cookie, para que la próxima vez que visite, sepa de quien se trata.

En la web, las cookies son pequeños archivos que son guardados en el navegador. Cada vez que el visitante vuelve al sitio web, el sitio web revisa si tiene su cookie y si la tiene, le trata con la familiaridad que corresponda. Si no, le pide que se autentique (login/password) y una vez conectado, le da una nueva cookie.

Los visitantes saben que están siendo identificados y no les importa porque precisamente esperan ser tratados de forma diferente, al ser identificados.

Cuando los dueños de los sitios web además saben de quien se trata, pueden hacer más mezclas de datos para «personalizar» la experiencia del visitante.

Este comportamiento en la web ha sido claro durante muchos años. Incluso, cuando no hay necesidad de conexión, se advierte al usuario si le estan dando una cookie para que no piense que se está atentando a su privacidad.

Las redes sociales lo cambian todo


En los últimos años se ha presentado un nuevo jugador cuyo principal rol, es averiguar tanto como se pueda de los navegantes. Ese nuevo jugador es la red social.

Nosotros, somos seres sociales y de vez en cuando nos gusta departir con nuestros semejantes a través de estas aplicaciones llamadas redes sociales.

Por su parte, los dueños de las redes sociales viven de poner anuncios que no sean evitados por los usuarios. Cada anuncio visto es cobrado. Los anuncios no vistos, no son cobrados.

La clave para que los anuncios sean vistos es predecir lo que el usuario aceptará

Si pueden llegar a conocer mucho, muchísimo al usuario, quizá sepan exactamente qué anuncio será bien recibido (y no rechazado o ignorado).

Conocer todo lo posible del usuario, es imperativo para las redes sociales. Cada vez que nos conectamos a la red social, cada uno de nuestros pasos está siendo cuidadosamente registrado. Nuestras preferencias, los gustos en memes, en noticias, en personas. Si nos reímos o si nos disgustamos. Las personas que conocemos (o que decimos conocer).

Todo. Todo lo que interactuamos es considerado información de valor.

Para la red social, conocer a cada uno de los individuos es la clave del éxito. La tendencia por otroa parte, es interesante para vender como segmentos a quienes quieren colocar publicidad.

Más datos, más combinaciones que hacer. Más información. La almacenan y la procesan buscando lo que el usuario quiere. La edad, el género, los estudios, los posts y memes que le gustaron... todo.

Cambridge Analytica Ltd. ha sido una empresa que simplemente recuperó información de Facebook y con eso -se afirma-, puedo manipular la conducta de las personas para la votación en EE.UU.

Simplemente poderoso.

Cuando la red social salta la barda

Siempre nos imaginamos que la red social únicamente registra nuestra actividad dentro de la red social. Así que lo que hagamos fuera de la red social, ya no compromete nuestra identidad. ¿Verdad?

No es así.

Las redes sociales tienen unos aliados (que para el colmo no saben que trabajan para ellos): los dueños de los sitios web.

¿Cómo lo hacen?

Los dueños de los sitios web colocan inofensivos widgets para que el visitante a su página, pueda compartir en la red social aquello que al dueño le interesa, normalmente, para promocionar su sitio web.

Pero (el odioso pero), las redes sociales «saben» quién es el usuario. Repito. Las redes sociales «saben» quién es el usuario. Simplemente piden la cookie al navegador y ya saben quien es. Pero además, ahora saben que sitio web ha visitado. Y ya han creado una nueva relación entre el usuario y el sitio web.

Es más, cada nuevo click que hacen es registrado, definiendo nuevas tendencias del usuario. Desnudándo al usuario en su vida fuera del red social.

Estamos seguros que los dueños de los sitios web que visitamos están advertidos que están regalando nuestros datos. Pero realmente no es así.

Simplemente lo hacen porque está de moda.

Buscando privacidad

 Los dueños de los sitios web tienen todo el derecho a promocionar su negocio o lo que sea que hagan. Sin embargo, hay una forma correcta de hacerlo y otra incorrecta.

La forma correcta es colocar un enlace a la red social con la suficiente información acerca de lo que busca el navegante.

La forma incorrecta es llamar dentro de la página web entregada al navegante, a un recurso del sitio web de la red social. Por ejemplo, descargar una inocente imagen.

Al solicitar el visitante desde su navegador el recurso, está también enviando las cookies que le haya dado la red social (aparte de todo lo mencionado en las primeras líneas) identificándose plenamente... y contándole a la red social qué está haciendo en ese sitio web.

La responsabilidad del dueño del sitio web

Los dueños de los sitios web deben tener cuidado con los recursos que le piden al usuario descargar. De otra forma, se vuelven cómplices de la recolección no autorizada de información.

Además que eso, no les beneficia. No pueden usar esa información. El visitante anónimo para ellos seguirá siendo anónimo. No importa que la red social sepa todo del visitante, no compartirá con el dueño del sitio web.

¿Porqué suceden estas cosas?

Normalmente, por incapacidad de los técnicos que hacen la página web. Muchas veces solicitan recursos que ni siquiera saben lo que hacen. Los piden y punto.

Incluso hay quienes ponen código que hace la solicitud del recurso automáticamente cada 10 segundos. Es decir, no sólo le informan a la red social de que el visitante está ahí, sino que además le dicen cuánto tiempo se ha quedado.

Protegiéndonos

Una buena forma de protegerse es... nop. No hay forma. Estamos entrampados. Si entramos a un sitio web que tiene este tipo de widgets, ya nos vendieron paraditos. A llorar al río.

Sólo nos queda aprender a ver si el sitio tiene o no estas trampas. Si no las tiene, visitarlo con confianza. En caso contrario, hacer tanto lío como se pueda.

Espero te sirva esta información.

Hasta pronto.

Comentarios

Entradas populares de este blog

Cuando el Estado entrega tus datos a terceros

Migrar un proyecto de github a gitlab