Investigadores del Observatorio de Contenidos Audiovisuales (OCA) de la Universidad de Salamanca, junto a la Fundación Al Fanar para el Conocimiento Árabe y con el apoyo del Centro de Supercomputación de Castilla y León (SCAYLE), analizarán de forma masiva en Facebook y Twitter la propagación de mensajes ofensivos y de odio contra la comunidad musulmana en España, utilizando técnicas manuales y computacionales de última generación. El objetivo es evaluar un detector automatizado de este tipo específico de discurso de odio para que pueda ser utilizado en la detección temprana de amenazas y en la planificación de campañas que apuesten por la tolerancia social.
El proyecto, denominado ISHADE (ISlamophobic HAte DEtector) y dirigido por el profesor Carlos Arcila, ha sido beneficiario de las ayudas de la Fundación Pluralismo y Convivencia (dependiente del Ministerio de la Presidencia, Relaciones con las Cortes y Memoria Democrática) para la promoción del conocimiento y el acomodo de la diversidad religiosa en un marco de diálogo, fomento para la convivencia y lucha contra la intolerancia y el discurso de odio. Los análisis que se realizarán con el detector propuesto podrán generar insumos valiosos para otros proyectos de investigación, como es el caso del proyecto europeo Evaluando Campañas de Odio (ECO), liderado por la Universidad de Murcia, y en que también participan miembros del equipo de ISHADE.
Según el profesor Arcila, el detector propuesto se desarrollará en tres fases: la primera será la búsqueda activa de mensajes islamófobos en redes sociales que servirán como ejemplos para los futuros modelos; la segunda será la construcción de un diccionario de términos islamófobos; y la tercera el desarrollo y evaluación de un modelo de clasificación supervisada de textos con los ejemplos de la primera fase. Todas las técnicas se implementarán en Caléndula, el supercomputador de Scayle, en Castilla y León.
Métodos computacionales
Este proyecto se enmarca en una línea de investigación iniciada por el OCA hace ya 5 años, en la que se ha priorizado el uso de métodos computacionales para tratar de detectar y monitorizar automáticamente los discursos de odio propagados en línea y a gran escala. En 2020 los mismos investigadores monitorizaron el discurso de odio contra inmigrantes en Twitter entre 2015 y 2020; y este año han monitorizado también el odio contra la comunidad LGTBI en torno a las discusiones en redes sociales sobre la denominada “Ley Trans”.
De manera paralela al desarrollo de este detector, pero sirviéndose del conocimiento generado en el proceso, se organizarán jornadas de sensibilización y capacitación, en colaboración con la fundación Al Fanar, donde diversos expertos en el tema impartirán seminarios destinados a docentes y a jóvenes usuarios de redes sociales, con el objetivo de hacerles tomar partido para contrarrestar el odio islamófobo. De acuerdo con el Estudio Demográfico sobre Conciudadanos Musulmanes de 2022, aunque el islam es una de las religiones minoritarias en España, representa alrededor del 4% de la población en el país (algo más de 2 millones de personas). Esta información resulta relevante, teniendo en cuenta que los datos presentados en el Informe sobre la intolerancia y la discriminación hacia los musulmanes en España (OBERAXE, 2020), concluyen que existe un elevado nivel de rechazo y discriminación hacia la comunidad musulmana extendido por todo el territorio español.
Inteligencia artificial
Las actividades del proyecto se desarrollarán a lo largo 2023, comenzando con el diseño del detector automatizado, mediante técnicas de inteligencia artificial, que identificará el discurso de odio islamófobo, siguiendo una estrategia de detección a gran escala basada en el cómputo intensivo de datos y utilizando procesamiento de lenguaje natural y diferentes técnicas de aprendizaje automático supervisado. Todo esto será posible a través de la recolección de grandes bases de datos obtenidas mediante la interfaz de programación de aplicaciones (API) de Twitter y Facebook, las cuales permiten recuperar mensajes publicados en estas redes sociales para su posterior análisis y clasificación. Toda esta información, después de ser procesada, analizada y clasificada, permitirá desarrollar algoritmos para que el superordenador Caléndula, ubicado en el campus Vegazana de la Universidad de León, logre identificar y clasificar los mensajes en las redes sociales, y de esta manera genere alertas frente al incremento de discursos de odio tanto en histórico como en tiempo real.
ISHADE cuenta con un equipo de investigadores multidisciplinario de la Universidad de Salamanca (Javier Jiménez, Patricia Sánchez Holgado, María Marcos, William González y Beatriz González) y de otras instituciones como la Universidad Rey Juan Carlos (María Cristina Fuentes) y la Fundación Al Fanar (Pedro Rojo).