El problema de la veracidad de los datos en un mundo Data Driven

  • Opinión

José Antonio Cano, director de análisis y consultoría de IDC Research

La capacidad para determinar la validez de los datos que una persona u organización maneja en su día a día se está volviendo cada vez más difícil, dice José Cano, Director de Análisis y Consultoría de IDC España en esta tribuna de opinión.

La introducción de contenido deepfake y basado en IA incrementa la probabilidad de manejar este tipo de datos, por lo que las empresas cada vez más se encontrarán compitiendo para convertirse en una fuente de datos válidos para un tercero (sea empresa o persona).

Este contenido fue publicado en el número de mayo de la revista IT Digital Security, que puedes descargar desde este enlace.

En este sentido, IDC prevé que durante 2020 se crearán 41ZB de nuevos datos en todo el mundo, pero… ¿datos reales? Por supuesto, los datos en sí son reales, se habrán generado, pero la pregunta que debemos hacernos es si esos datos son auténticos; es decir, provienen de una fuente u origen válido y pueden ser confiables. Esto último es cada vez más importante puesto que esos datos han cambiado desde el momento en el que fueron creados o capturados hasta el instante justo de ser consumidos. Por ello, esto es lo que se pone en tela de juicio, especialmente con el surgimiento de deepfake e informes creados por IA.

Las tecnologías de tercera plataforma que utilizamos en la actualidad están permitiendo la introducción de economías exponenciales, que habilitan un conjunto muy elevado de posibilidades para incrementar de una forma muy positiva la productividad de las organizaciones. Pero al a vez, casi cualquier cosa puede utilizarse tanto para lo bueno y lo malo. Lo que se denomina "espada de doble filo".  De hecho, la palabra deepfake es una composición de los términos deep learning (aprendizaje profundo) y fake (palabra falso en inglés). Es decir, es el uso de una tecnología de IA para generar contenido falso).

Y es justo este concepto el que aparece cuando analizamos el impacto que estas tecnologías han tenido en las organizaciones. El aumento de la capacidad de almacenamiento y computación en la nube ha permitido que deepfake está habilitado por la capacidad de procesar gran cantidad de datos y tecnologías de aprendizaje profundo.

Pensemos un momento en una aplicación que permite la fusión de imágenes humanas reales con otras imágenes reales para crear una sola imagen o vídeo donde el resultado sintetizado parece tan real como los originales, pero es falso. ZAO es una empresa china que tiene una aplicación que permite intercambiar las caras de los usuarios con las de personajes en películas. Este ejemplo, aunque benigno y con fines de entretenimiento (¿a quién no le gustaría ser el protagonista de su película favorita?), muestra que en realidad la tecnología podría trascender este escenario y utilizarse en multitud de otros casos de uso no tan benignos ni tan controlados. Los políticos han sido víctimas de deepfake y aparecen en vídeos diciendo cosas que nunca han dicho, actores que aparecen en vídeos comprometidos que jamás han grabado y por tanto, que tienen el potencial de causar daño y vergüenza extrema.

Sin embargo, deepfake puede ir mucho más allá y los informes creados por IA podrían tener un impacto en el lado empresarial y social. Desde la generación de informes financieros que omitan cierta información importante para una empresa (informes financieros de competidores que están disponibles públicamente y que se utilizan para ayudar en la definición de la estrategia de negocio), la generación de noticias falsas

para influir en las elecciones políticas o fomentar el caos entre un determinado grupo social, así como generar informes generados que modifican indicios o pruebas que utilizan los cuerpos y fuerzas de seguridad del estado para descubrir y atrapar aun delincuente en serie.

Este auge de las tecnologías de tercera plataforma ha favorecido la digitalización de las organizaciones y ha colocado los datos en el corazón de este mundo digitalizado, convirtiéndolo en un recurso como el agua y utilizándolos para obtener información sobre los flujos de trabajo del negocio con el fin de optimizar los procesos, mejorar la eficiencia, reducir costes, ofrecer servicio en tiempo real y aumentar los ingresos y la rentabilidad. Pero incluso en nuestra vida personal. Usamos los datos para hacer más eficientes nuestras actividades cotidianas, para ayudarnos en la toma de decisiones y personalizar nuestras experiencias (dentro y fuera de casa).

Por eso es más importante que nunca entender que la veracidad de los datos que se espera en el momento del uso o consumo de éstos está garantizada por el proveedor de esos datos. Los consumidores que más en riesgo están dada su limitada capacidad para determinar la autenticidad de los datos que consumen, ya sea que estén siendo leídos, vigilados o escuchados. Sin duda, las empresas deben hacer más (y, de hecho, se encontrarán compitiendo) para llegar a ser conocidas como una fuente confiable de datos en un nuestro mundo cada vez más digital.

José Cano, Director de Análisis y Consultoría de IDC España