el valor del dato

Overview

Todos somos conscientes de que hoy en día los datos han pasado a ser una mercancía y posiblemente de las más valiosas que tenemos actualmente en el mercado.

Muchas compañías compiten por nuestro tiempo de conexión para obtener el preciado oro digital, datos y metadatos con el fin de convertirnos en perfiles que puedan ser vendidos a compañías que, con su mejor voluntad, quieren proporcionarnos el anuncio más adecuado a nuestros gustos, hábitos o aficiones.

Como plantearemos posteriormente, no solo las empresas privadas están interesadas en obtener nuestra información. Aunque con distintas motivaciones gobiernos y ciberdelincuentes realizan grandes esfuerzos para obtener todos los datos que sean capaces de conseguir.

Tampoco todos los motivos serán perjudiciales o negativos, los datos son ya un elemento indispensable para el desarrollo de las tecnologías, para la ayuda a la toma de decisiones con el big data o para el entrenamiento de inteligencias artificiales.

En definitiva, el mundo entero está interesado, por un motivo u otro, en nuestra información. ¿Por qué?

mitmproxy

Como ejercicio práctico, para ver de primera mano qué datos está enviando cierta aplicación podemos usar mitmproxy. Esta herramienta nos permite estar en medio de una comunicación, ya esté cifrada o no, viendo todo el tráfico sin cifrar.

Dispone de dos interfaces, consola o web, según como la ejecutemos, pero en ambas podemos analizar todas las comunicaciones del dispositivo o aplicación que estemos analizando.

Podemos ver sus características y configuración en su página web.

En la mayoría de las apps, encontraremos información necesaria para su funcionamiento: tipo de dispositivo, sistema operativo, tamaño y resolución de la pantalla, tipo de conexión wifi o red móvil, etc. Pero en ocasiones, podremos ver también como obtienen otros datos que no son necesarios para su funcionamiento como la posición GPS, operador de telefonía, número de teléfono, correo electrónico, edad, genero, etc.

Mal usados, todos estos datos pueden ser empleados para para crear perfiles y ser vendidos para campañas publicitarias, electorales, etc …

Como analizaremos a continuación el dato puede ser un muy buen aliado para el desarrollo, la eficiencia y la toma de decisiones o nuestro peor enemigo.

El poder del dato

No es nuevo el concepto de datadriven, lo usan las empresas que tienen la capacidad de tratar sus datos o aquellos que les puedan afectar a sus resultados con suficiente eficiencia y pericia como para convertirlos en inteligencia. Esta información debidamente tratada por sistemas de big data, machine learning o inteligencias artificiales se convierte en inteligencia, indicadores e informes que permiten tomar decisiones motivadas a partir de datos empíricos y no por sensaciones o intuiciones.

No solo las compañías usan este tipo de técnicas, la policía de New York hace uso de los datos para saber dónde será más eficiente enviar cada uno de los coches patrulla de que dispone.

También se puede hacer uso del machine learning en la domótica. Es posible optimizar en un rascacielos el sistema de ascensores para que una inteligencia artificial decida que ascensor enviar a cada planta y cuando, según los datos que recoge del propio uso de los ascensores.

Por no hablar de las campañas de publicidad, cuanta más información se dispone de cada uno de nosotros más fácil es crear anuncios a medida que aumenten su eficiencia. A su vez estos se autoevalúan para corregirse según van obteniendo más información durante la campaña.

Es también conocido el uso que se ha dado a nuestra información para, de algún modo, vulnerarnos e influirnos en la toma de decisiones durante periodos electorales, lo sucedido con Cambridge analytica es solo un ejemplo.

De hecho, vivimos en una sociedad altamente sugestionada, en la que de forma sutil y continua se nos somete a gran cantidad de estímulos, en forma de anuncios, noticias, eventos, modas … por todo tipo de medios como la televisión, redes sociales, periódicos, etc. Es difícil discernir en ocasiones la opinión de los hechos. Nos tenemos que interrogar y tratar de eliminar el ruido de los medios para escuchar nuestra propia opinión.

Algoritmos con prejuicios

Podríamos pensar que los algoritmos nos ayudaran a universalizar y democratizar algunos servicios, posiblemente así será, pero tenemos que anotar algunas debilidades que estos pueden tener.

El algoritmo, de por sí, no puede ser racista, clasista o pensar en diferencias por raza o sexo. Y siendo todo lo anterior cierto, en ocasiones parece que los algoritmos discriminan. La debilidad está en los datos que proporcionamos al algoritmo para realizar su trabajo, si el set de datos que le proporcionamos para su entrenamiento está sesgado, el resultado puede que solo sea válido para una parte de la población. Esta debilidad se conoce como algorithmic BIAS.

Se ha dado el caso de sistemas de reconocimiento facial que, al realizar sus entrenamientos con bases de datos de personas caucásicas, tenían dificultades para identificar a personas de otras razas.

Otro caso, que podría ser peligroso es el de la policía de Nueva York. Al algoritmo se le ofrecen los registros de detenciones y este prevé que en barrios más pobres se cometen la mayor parte de los delitos. Al enviar allí más patrullas, efectivamente se realizarán también más detenciones, por lo que por un círculo pernicioso estará sesgando los datos que alimentaran al algoritmo en el futuro. Esto nos puede llevar a que, en vez de ser más justos, estemos acentuando los prejuicios, y esta vez apoyados por datos que empíricamente lo respaldan.

Este tipo de debilidades, desde mi punto de vista, no nos tienen que detener en la aplicación de sistemas de machine learning, son cuestiones técnicas que tienen solución. Únicamente tenemos que estar atentos y buscar el modo de compensarlas o corregirlas.

De hecho, ya en muchas empresas dedicadas a las IA se están demandado perfiles de ciencias humanistas, filósofos, psicólogos y pedagogos para analizar cómo se puede corregir el algorithmic BIAS.

Lo mío es tuyo

Muy posiblemente todos estaremos de acuerdo con la afirmación anterior sobre que los datos tienen un gran valor. Como seres contradictorios que somos, aunque estemos de acuerdo con la afirmación anterior, parece que no tengamos en cuenta este gran valor en relación a nuestros propios datos, puede que por desconocimiento de como estos datos pueden ser empleados en nuestra contra, tendemos a regalar nuestros datos, a cambiarlos por servicios gratuitos o descuidarlos.

En la mayoría de los casos aceptamos todas las cláusulas de los contratos de uso y privacidad donde las compañías nos indican que, a cambio del uso de sus servicios, ellos podrán hacer uso de nuestros datos y compartirlos con terceros. ¿Se podría decir que el valor que le damos a nuestros datos es de 20 minutos? Ese es el tiempo necesario para leer la mayoría de los contratos.

No estoy diciendo que no se puedan usar servicios gratuitos, ni que no podamos cambiarlos por nuestros datos. Lo importante es ser consciente de ello, ver qué datos usarán, cómo y con quien los podrán compartir. Es importante preocuparnos por nuestros datos personales y darles el valor que estos merecen. No los regalemos por pereza.

Es cierto también que la mayoría de las empresas no nos lo ponen fácil, largos contratos, con lenguaje técnico difícil de entender y letras pequeñas que, posiblemente a propósito, desalientan su lectura.

Ciberdelincuentes

En los últimos tiempos, otros que se están beneficiando de nuestros datos o de los datos de las empresas son ciberdelincuentes que comprometen nuestra información con malware como el ransomware, que cifra toda la información de nuestro ordenador personal, o en el caso de las empresas comprometen también la de todas las unidades de red a las que el usuario tenga derechos de escritura, para solicitarnos, posteriormente un rescate para descifrar la información de nuevo y poder recuperarla.

Esta técnica últimamente también ha cambiado ya que la mayoría de las empresas han puesto a punto sus sistemas de backup, disponiendo de copias de seguridad offline que les permiten recuperar la información sin pagar al cibercriminal. Es por ello que ahora exfiltran los datos y nos chantajean con publicarlos, exponiendo dañar la reputación de la empresa y a una multa por parte de la GDPR.

Sé que no todas las situaciones son iguales y que es fácil hablar cuando no se está en la situación, pero no puedo terminar este punto sin apuntar que, mientras paguemos los rescates, este tipo de extorsión será rentable y por lo tanto no terminará. No pagar es la única forma de terminar con este negocio. Proteger es mejor que lamentar.

Vigilancia permanente

Es difícil hablar de este tema y no hablar de personas como Eduard Snowden o Julian Assange, que han sacrificado su libertad para proteger la libertad digital de los demás, denunciando los abusos que cometen los estados vulnerando en muchas ocasiones sus propias leyes.

Los estados son los que tienen más recursos y, posiblemente, más motivos para almacenar y explorar nuestros datos en busca de indicios de delitos o de amenazas terroristas. Puede que todo ello sea para un fin licito y podría decir que lo es siempre que se realice bajo la supervisión de jueces que emitiendo ordenes, vigilen que no se está vulnerando el derecho a la intimidad de las personas y que se accede únicamente a la información de personas, relevantes para la investigación.

Es una cuestión muy compleja, que no resolveremos hoy, pero como técnico soy consciente de que una vez un sistema empieza a almacenar datos personales de forma masiva, como mínimo hay un sysadmin que tiene acceso a ellos y, normalmente, de forma ilimitada.

Autoprotección

No nos podemos dejar llevar por las conspiraciones paranoicas sobre lo que hacen o harán con nuestros datos. Nuestra civilización evoluciona en parte con nuestros datos, de hecho, se podría decir que son estos los que la moldean, nuestras “necesidades” del ahora puede que terminen siendo las tendencias de mañana.

Debemos ser conscientes de ello y poner las medidas que tenemos a nuestra disposición para protegernos en la medida de lo posible. Los datos son como la virginidad, es más fácil protegerlos que recuperarlos.

Así que, leamos los contratos en los que se nos informa del trato que darán a nuestros datos. Verifiquemos los parámetros de privacidad de nuestros terminales móviles o aplicaciones. En la medida de lo posible eliminemos las cookies de nuestro explorador web, es posible realizar excepciones para llegar a un compromiso entre privacidad y usabilidad.

Los buscadores como Google, Bing DuckDuckGo son casi una necesidad hoy en día, pero no todos ellos tratan nuestros datos del mismo modo, una vez más leamos sus políticas de privacidad.

También es interesante el uso de VPNs, estas, entre otras cosas, ayudan a anonimizar nuestras conexiones. Buscar un buen proveedor de pago puede no ser una mala opción.

Conclusiones

Ya que todos les dan valor, puede no ser una tontería que se los demos nosotros también y que seamos consecuentes y demos valor a nuestros propios datos.

Pongamos las medidas necesarias, adecuadas al tipo de dato que estemos protegiendo. Hagamos uso de las herramientas que tenemos a nuestra disposición para no facilitar, al menos, le recolección de la información que a lo largo del día generamos.

La concienciación en esta materia es obligatoria, para nuestra familia, empleados y conocidos.

Hasta aquí el post de hoy. Espero haya sido de vuestro interés.
No dudéis en contactar mediante el formulario para hacerme llegar vuestros comentarios.