Hace unos años, uno de los coches autónomos de Uber atropelló y mató a un peatón que cruzaba una calle fuera de un paso de peatones. ¿Qué falló? Cuando los técnicos entrenaron al coche para reconocer peatones, utilizaron sobre todo imágenes que contenían un paso de peatones. Sin darse cuenta, habían ‘enseñado’ al sistema de inteligencia artificial que el paso de peatones era la parte importante.
Aunque la mayoría de las empresas que aplican la IA en sus operaciones no se ocupan de algo tan importante como la vida humana, hay una lección importante aquí: si damos a los sistemas datos erróneos, obtendremos malos resultados. La inteligencia artificial se convertirá sin duda en el próximo gran diferenciador empresarial, pero sólo para las empresas que puedan tener sus datos bajo control.
Malos datos, mala IA
La inteligencia artificial responsable está de moda porque muchas empresas tienen un grave problema con sus datos: no saben qué datos tienen. Son incoherentes e inseguros. E introducir datos desconocidos y no gestionados en un sistema de IA es sólo pedir que se produzca una violación de datos, una infracción de la legislación vigente, decisiones estratégicas mal informadas, sesgos no intencionados o daños reputacionales.
El problema es que muchas empresas tienen un lío de datos entre manos. O bien tienen una estrategia desordenada o no tienen estrategia alguna para la gobernanza de datos, las normas y procesos para recopilar, utilizar y almacenar datos.
Las empresas no se paran a pensar en su estrategia de datos, sino que persiguen proyectos ‘pintones’ que generen ingresos. Sin embargo, cuando las empresas quieren reunir esos datos, por ejemplo, para una herramienta de IA, no pueden hacerlo porque no existen normas generales sobre cómo manejar los datos. Se quedan con un gran lío que requiere una gran cantidad de tiempo e inversión para desenredarlo.
En otras palabras, la gobernanza de datos puede no parecer emocionante o llamativa, pero constituye la base del éxito de cualquier proyecto de inteligencia artificial. Una obviedad que parece no serlo.
Un enfoque pragmático para arreglar los datos
Aplicar retroactivamente la gobernanza de datos a toda la información de una organización es una empresa colosal. Pero tranquilos, afortunadamente, no es necesario ir tan lejos para embarcarse en vuestro próximo proyecto de IA.
Aquí tenéis un enfoque pragmático y puntual para arreglar vuestros datos, aprovechar el poder de la inteligencia artificial y crear valor de forma incremental por el camino:
· Elegid un caso de uso: empezad por elegir un único caso de uso. ¿Cuál es el principal mandato empresarial en el que la IA os puede ayudar? ¿Sabéis dónde tenéis datos propios o de terceros que se pueden aprovechar? En este caso, seguid el ejemplo de Ricitos de Oro y elegid un caso de uso que no sea ni demasiado grande ni demasiado pequeño, idealmente algo interno. Vuestro primer caso de uso también debe tener requisitos de dominio de datos limitados, es decir, un caso de uso que sólo requiera datos de una fuente. A continuación, averiguad el estado de los datos con los que vais a trabajar. ¿Qué hay que corregir antes de introducir los datos en un sistema de inteligencia artificial?
· Fijad los datos necesarios para ese caso de uso: una vez que tengáis un caso de uso factible y hayáis evaluado el estado de los datos necesarios para avanzar, es hora de realizar un trabajo de limpieza. No es necesario que los datos sean perfectos, pero sí que comprendáis sus defectos antes de aprovecharlos. Tendréis que poner en marcha tanta gobernanza y estrategia como sean necesarias para ese único caso de uso.
Por ejemplo, si la inteligencia artificial añade información a los registros genéricos de los clientes que hace identificables a los individuos de forma protegida, eso se llama clasificación por compilación y hay que protegerse contra ella. Todos estos elementos juntos conforman la gobernanza de datos, un plan sobre cómo se van a obtener los datos, cómo se pueden utilizar y los controles y políticas adecuados para evitar su uso indebido.
· Cread una estrategia de datos global. Al mismo tiempo que exploráis vuestro caso de uso, elaborad un marco y una estrategia de datos globales. Esto os dará información sobre cómo recopilar, mantener y proteger los datos en toda la organización de cara al futuro.
Una vez completado el primer caso de uso, escoged otra área en la que centrarse. Aprovechad los éxitos y las lecciones aprendidas en el primer caso. ¿Cómo despejar la fecha para vuestro próximo proyecto? ¿Cómo debéis ajustar su estrategia de datos? Seguid repitiendo, limpiando vuestros datos durante el proceso.
El mantra de este enfoque es pensar a lo grande pero empezar poco a poco. Al ir un caso de uso a la vez que se ponen en orden los datos de la organización, se creará valor con la IA de forma incremental al tiempo que se construye una base sólida de gobernanza de datos para impulsar cualquier iniciativa futura de inteligencia artificial.
Venga, ¡manos a la obra!