El lenguaje muchas veces nos lleva a terrenos confusos en los que las palabras no representan realmente lo que parecen, y las nuevas tecnologías están creando un nuevo mundo con una nueva terminología que aún tenemos que aprender.
La digitalización nos está dejando palabras como ciberseguridad, big data o blockchain con las que ya nos estamos familiarizando, y surgen otras nuevas como 'espacios de datos compartidos', que parece más asequible y representativa y, sin embargo, nos puede llevar a equívoco. Y merece la pena comprenderla, porque se perfila como una de las principales herramientas para gestionar los datos en un futuro no tan lejano.
En primer lugar, no nos estamos refiriendo a ningún espacio concreto, sino al conjunto de los datos que están disponibles para los usos que sus tenedores hayan determinado al publicarlos, se encuentren almacenados donde se encuentren. Y digo tenedores, porque puede que quien los ponga a disposición no sea el poseedor, ni el originador, sino un intermediario que actúa en nombre de ellos.
Por tanto, los espacios de datos compartidos no son espacios físicos, ni tampoco son espacios virtuales, sino que son espacios sociotécnicos donde se garantiza que los datos se publican y se utilizan de acuerdo con unas reglas predeterminadas, que velan porque esos datos siempre se empleen de acuerdo con las condiciones expresadas por el tenedor, y para todo ello existe la certificación correspondiente.
Los datos pueden estar en cualquier sitio: en nuestro ordenador, en los sistemas de una organización, en la nube de un proveedor menor, o en la nube de uno de los grandes proveedores internacionales. Todos ellos pueden utilizar los componentes técnicos y adherirse a las reglas de participación para integrarse en los espacios de datos. Aquellos datos que crean que merezcan la pena ser publicados, porque les causa rentabilidad, monetaria o intangible, lo serán, mientras que otros que no cumplan esas expectativas, quedarán ocultos.
Hay que tener en cuenta que cuando se habla del potencial de la compartición de datos no se refiere a su exposición, sino a los nuevos servicios que van a ofrecer unas terceras partes. Éstas van a poder trabajar con esos datos diversos para ofrecer y, prácticamente siempre, sin necesidad de desentrañar las características de los datos, es decir, la atribución, que reventaría todo secreto industrial o profesional. Para ello, hay diversas técnicas de anonimización, la preferencia por trabajar con datos agregados, o entrenamiento de modelos de inteligencia artificial de modo opaco.
Entonces, si preguntamos en las empresas: ¿estaría dispuesta a que unos proveedores de servicio utilizaran sus datos de forma agregada, sin copiarlos, sin desvelar su origen (sin conocerlo, de hecho), con el fin de entrenar herramientas que luego le van a proporcionar mejores o nuevos servicios, inclusive con la posibilidad de que haya una compensación, ya sea directamente de pago, o de rebaja en los servicios?
O ¿admitiría que una empresa de seguridad informática conociera las prácticas de sus empleados, por medio del análisis de unos datos que usted recoge, y que se almacenan de modo no atribuible, con el fin de ofrecerle mejores productos o servicios relativos a la seguridad informática, teniendo en cuenta que si, al igual que usted, otras empresas lo admitieran, el potencial de mejora se incrementaría considerablemente?
Por ejemplo, ¿admitiría usted que un proveedor de servicios utilizara los datos de entradas y salidas de vehículos de su almacén, para que, junto con los de otras empresas del mismo polígono industrial, se conociera el flujo de entrada y salida, y, con ello, se pudiera ordenar el tráfico en las inmediaciones, o facilitar la agregación de carga para los operadores logísticos, sin que ello diera pistas a sus competidores de cómo le va el negocio?
Y supongamos otro caso: ¿admitiría que una empresa dedicada a servicios de recursos humanos utilizara los datos de su personal, convenientemente anonimizados –le va la ley en ello–, para segmentar mejor sus servicios y que, de esa manera, pudiera ofrecerle mejores perfiles, dependiendo de la evolución del negocio, de la dinámica de la formación profesional, de los vaivenes del mercado laboral en general, y ello gracias a que esta empresa es capaz de utilizar tanto los datos de su empresa, como los de otras, pero también datos públicos, ya sean de fuentes abiertas, o de open data de las administraciones?
Quienes promueven estos escenarios novedosos de compartición de datos deben ser tan exigentes consigo mismos a la hora de explicar susventajas efectivas, como de explicar que los componentes técnicos se encuentran en fase de desarrollo y prueba. Por tanto, hoy sólo se puede aspirar a realizar pruebas de concepto en las que se demuestre la viabilidad y también que los agentes se encuentren cómodos con los nuevos conceptos, y las nuevas prácticas.
Esta es la labor en la que se ha enfrascado el sector en los últimos meses, afinando los aspectos técnicos de las tecnologías disponibles, que cambian día a día, y promoviendo la confianza para los agentes que intervienen, ayudándolos también en la identificación de los datos valiosos, en su disponibilidad y en la comprensión de las posibilidades de explotación que se abren gracias a ello. Sin dejar de repetir que, en este caso, compartir no significa regalar nada.
*** Javier Herrera es responsable de Mercado ICT de Industria y Movilidad de Tecnalia.