El objetivo desde el que partió este proyecto, llevado a cabo entre los meses de febrero y junio de 2015, era ahondar en la naturaleza de las Sociedades de Inversión de Capital Variable (Sicav), que a menudo saltan a la palestra informativa envueltas en escándalos económicos. Y, sobre todo, proporcionar una serie de evidencias a partir del análisis de datos y de las entrevistas realizadas que sustentaran las hipótesis iniciales.
Como punto de partida se tomó la información pública sobre estos vehículos de inversión disponible en la página web de la Comisión Nacional del Mercado de Valores (CNMV). Las Sicav están obligadas por ley a remitir a la CNMV informes trimestrales sobre su situación mercantil y financiera. Dichos documentos están publicados en el portal web de la Comisión en formato PDF y XBRL (un tipo de fichero utilizado para almacenar e intercambiar información económica, escrito en lenguaje XML).
La descarga automática de los cerca de 12.000 documentos –que se corresponden con unas 120.000 páginas en formato PDF– y la extracción de información de los mismos se realizó utilizando las posibilidades de web scraping y parseo que ofrece el lenguaje de programación Python. Como resultado se obtuvieron varios set de datos que fueron analizados en Excel.
Tras examinar las tendencias que revelaban los datos, se realizaron cerca de 20 entrevistas a personas del ámbito financiero, tributario y mercantil; en algunas de ellas, los entrevistados pidieron mantener el anonimato.
La investigación realizada sobre las Sicav se enmarca dentro del Trabajo Fin de Máster del posgrado en Periodismo de Investigación, Datos y Visualización de Unidad Editorial y la Universidad Rey Juan Carlos.