En el reciente debate sobre la reforma de las pensiones, hábilmente manejado por el Gobierno, han sorprendido las declaraciones del secretario de Estado de Seguridad Social y Pensiones del Ministerio de Inclusión, Seguridad Social y Migraciones a elDiario.es en las que afirmaba: "Con toda modestia, quien tiene la mejor información para hacer proyecciones sobre el gasto en pensiones es el Ministerio".

La frase ha llamado la atención entre los economistas por varios motivos. En primer lugar, por las formas: la arrogancia que denota una frase que comienza presumiendo de modestia.

En segundo lugar, porque buena parte de los investigadores económicos pensaban que disponer de la base de datos de la Muestra Continua de Vidas Laborales (MCVL) era más que suficiente para hacer todas las simulaciones necesarias y conseguir una proyección del gasto en pensiones al menos tan buena como la que puede hacer el propio gobierno. Al fin y al cabo, se trata de una muestra que abarca al 4% del total de los 20 millones de afiliados (unos 800.000 individuos) y que es plenamente representativa de la situación del mercado laboral pasado, presente y futuro.

¿Cuál es esa "información superior" que tiene el Ministerio y que invalida la calidad del análisis del Instituto de Actuarios Españoles, FEDEA, FUNCAS y BBVA Research?

La discusión sobre la sostenibilidad del sistema se basa en un conjunto de hipótesis, todas discutibles y aceptables, sobre las que se elaboran una serie de escenarios. En definitiva, un tema esencialmente técnico que algunos tratan de vestir de ideológico, pese a que los fundamentos del Pacto de Toledo precisamente trataban de excluir el debate sobre las pensiones de la lucha partidista y de la confrontación electoral.

Sin embargo, el punto de partida es que los datos de la MCVL eran más que suficientes para que los investigadores pudieran llevar a cabo proyecciones del máximo rigor. ¿Cuál es, entonces, esa "información superior" que tiene el Ministerio y que invalida la calidad del análisis del Instituto de Actuarios Españoles, FEDEA, FUNCAS o BBVA Research, que han sido críticos con el proyecto de reforma sin disponer de esa información adicional? ¿Y por qué esa información superior solo la tiene el Ministerio?

El tercer motivo para la sorpresa es que el Ministerio había dado pasos en la buena dirección en 2020, al poner en marcha dos salas de investigación, una en Madrid y otra en Barcelona, con el objetivo de facilitar el trabajo de investigadores y académicos con bases de datos y microdatos de la Seguridad Social.

Aunque las condiciones eran rígidas (solicitud previa, asociada a un proyecto de investigación, prohibición de usar ningún dispositivo electrónico, imposibilidad de descargarse no sólo los datos, sino los propios resultados, que les serían remitidos por la Gerencia de Informática al usuario en cuestión, etcétera) la iniciativa demostraba la intención del Ministerio de mejorar la accesibilidad a los datos de la Seguridad Social.

El secretario de Estado reabre el debate sobre quién es el 'propietario' de los datos macroeconómicos oficiales

Esta iniciativa fue posteriormente complementada por el Portal del Dato para facilitar el acceso de instituciones públicas y privadas, sin ánimo de lucro, tanto a la MCVL como al Panel de Empresas y Trabajadores (PET), aunque es verdad que el secretario de Estado impulsor de estas iniciativas fue cesado el pasado mes de junio. ¿Se trata ahora de un giro a esa política aperturista a los datos más difíciles y opacos de la Administración pública española?

El cuarto motivo de inquietud por la desafortunada frase, el que más me concierne, es que reabre el debate sobre quién es el propietario de los datos macroeconómicos oficiales

Para mí ha sido un caballo de batalla permanente en mi vida profesional. A la vuelta de mi doctorado en la Universidad de Minnesota, a finales de los años 80, fui contratado por el Ministerio de Economía y Hacienda para formar parte de un grupo de macroeconomistas cuyo objetivo era construir un modelo macroeconómico de la economía española, que posteriormente se llamó el MOISEES (Modelo de Investigación y Simulación de la Economía Española). 

Nuestra primera tarea fue recopilar una base de datos macroeconómicos anuales (no existía la Contabilidad Nacional [CN] trimestral) con series lo más largas posibles (la CN comenzó en 1964).

Resistencias

Buena parte de ese trabajo se resumió en el libro La Economía española, 1964–1985. Datos, Fuentes y Análisis, Instituto de Estudios Fiscales (1987) de Baiges, J., Molinas, C. y Sebastián, M. El gran historiador Francisco Comín nos honraba unos años después, con esta reseña de nuestro libro en la Revista de Historia Económica: "Es de loar que ofrezcan gratuitamente a otros investigadores sus investigaciones, en una academia en la que cada cual se guarda sus cifras hasta que presenta el análisis acabado de las mismas. La finalidad de los autores reseñados no puede ser más encomiable: presentar series macroeconómicas homogéneas largas, elaboradas y reconstruidas con el rigor imprescindible para que sean útiles y fidedignas".

Tuvimos serios problemas para elaborar esa base de datos, pese a formar parte del Ministerio de Economía y Hacienda y tener el mandato del entonces Secretario de Estado de Hacienda, Josep Borrell. Problemas que surgían de la resistencia de muchos funcionarios a compartir o ceder "sus datos".

Si el todopoderoso Ministerio de Economía y Hacienda tenía dificultades para arrancar esos datos de los cajones de los empleados públicos, ¿qué opciones tendría un investigador de Universidad o un ciudadano cualquiera? Como anécdota, recuerdo que la serie larga de "quiebras y suspensiones de pagos", que era necesaria para nuestro modelo, sólo la tenía un viejo funcionario de nuestro propio ministerio, que la guardaba celosamente en un cuadernillo que se negaba a entregarnos. Tras muchos cafés, conversaciones sobre lo divino y humano, y entablar una cierta relación de confianza, e incluso de amistad, conseguimos el ansiado cuadernillo y pudimos publicar la serie histórica.

La conclusión que sacamos en ese intenso año fue bastante deprimente. España todavía no había superado muchos de los tics de la administración franquista, que entendía dos cosas: en primer lugar, que los datos son peligrosos en manos de cualquiera, y segundo, que la "propiedad" de los datos es de los funcionarios y/o del Estado.

En una democracia de calidad, los datos son de los ciudadanos, no de los gobiernos

Para nosotros, que los datos estuvieran disponibles para todos los investigadores era enriquecedor, porque se podrían hacer muchos más estudios de los que la administración puede llevar a cabo. Y aumentar el conocimiento de todos, también de la propia Administración. Es decir, se generaba una externalidad positiva.

También pensábamos que la disponibilidad gratuita de los datos macroeconómicos oficiales era esencial para el análisis y la toma de decisiones económicas públicas y privadas. Y que, en una democracia de calidad, los datos son de los ciudadanos, no de los gobiernos.

Con la revolución tecnológica, la aparición de internet y de las redes sociales, uno esperaría que la disponibilidad de los datos sería mucho más fácil e inmediata. Y, en general, ha sido así.

Por ejemplo, el Banco de España, donde también trabajé desde 1990 a 1994, se ha avanzado mucho en la difusión de sus estadísticas de forma gratuita y anónima. Algo que desde 1991 ofrecen ejemplarmente sus colegas del Banco de la Reserva Federal de San Luis (FRED). En la actualidad, ponen a disposición de los usuarios la friolera de 819.000 series temporales, tanto de Estados Unidos como internacionales, y que cualquier usuario puede descargar de forma gratuita, anónima y amigable.

Apagón estadístico

También nos beneficiamos los investigadores y profesores de la disponibilidad universal y gratuita de la gigantesca base de datos con horizonte de largo plazo de la Penn State University (antigua base de Summers y Heston), imprescindible para la estimación de modelos de crecimiento económicos.

Los problemas con los datos oficiales no acabaron con el cambio de siglo. En 2003, siendo director del Servicio de Estudios del BBVA, tuve un enfrentamiento con el Gobierno de Aznar-Rato, al denunciar en un artículo el Apagón Estadístico que se estaba produciendo con muchas series macroeconómicas. Un artículo que me consta que molestó, y mucho, al equipo del vicepresidente económico.

En estos últimos años, además del Banco de España, el INE también ha mejorado su oferta estadística, aunque a veces se cuestiona la homogeneidad de sus series más largas.

En los últimos tres años he defendido que el INE debería haberse hecho cargo de las estadísticas de la pandemia, dados sus recursos y su experiencia en la coordinación de los datos de las comunidades autónomas. También porque son responsables de los datos de población y, con el tiempo, serán los que tengan la última palabra en la estimación de la verdadera mortalidad de la Covid-19 en nuestro país, a partir de sus cálculos sobre el exceso de mortalidad en estos años. Pero, recientemente desde el Instituto Complutense de Análisis Económico (ICAE) tuvimos algún problema con el INE, por el cambio de la base de datos de los precios de la electricidad.

La serie de IPC presenta una discontinuidad inmanejable para el análisis econométrico

Hasta enero, sólo se consideraban los precios de la tarifa regulada (PVPC), que es la que más había subido durante 2022. Sin embargo, desde principios de 2023 han incluido también los precios del mercado libre, que fueron más estables en la subida, pero ahora están cayendo menos que el PVPC, por lo que la serie de IPC presenta una discontinuidad inmanejable para el análisis econométrico.

Pese a que el ICAE solicitó la publicación de la serie con la metodología antigua, al menos el dato de enlace, la negativa ha sido rotunda. Personalmente me ha sorprendido esta cerrazón, dada mi defensa acérrima de nuestro gran instituto estadístico.

En los dos últimos años he criticado la baja calidad de los datos de la Covid-19 por parte del Ministerio de Sanidad y las comunidades autónomas. Incluso le dedico un capítulo (La insoportable levedad de los datos Covid en España) dentro del libro El virus interminable (Penguin Random House, 2022).

En ese capítulo trato de argumentar por qué la base de datos sobre la pandemia en España es de las peores del mundo, tanto en su frecuencia como en su calidad. Tampoco se dispone de un sitio de acceso a series largas homogéneas y fiables. Y ese es otro problema en la oferta de datos públicos en nuestro país. Incluso en los casos en que hay disponibilidad, hay muchas dudas sobre su accesibilidad y calidad. Muchas veces la presentación de los datos en los sitios web oficiales es confusa y difícil de navegar. Otras veces los datos no siempre se actualizan con la frecuencia suficiente, lo que dificulta el seguimiento de las tendencias económicas.

Finalmente, queda el espinoso tema de la privacidad y seguridad de los datos de los ciudadanos y de las empresas, algo que afecta a los ya mencionados casos de la Seguridad Social, a los de la Agencia Tributaria y a los de la Central de Balances del Banco de España, por poner algunos ejemplos. Pero, una vez más, las nuevas tecnologías resuelven el problema, al ser capaces de extraer muestras anónimas y representativas que permitan a los investigadores acceder a unos datos de la máxima calidad estadística sin poner en riesgo la privacidad de los ciudadanos. Es decir, consiguiendo un equilibrio entre el derecho a la información y el de la protección de los datos de los ciudadanos.

La decisión de otorgar o no el acceso a esas muestras representativas sigue estando en manos de la Administración

Sin embargo, continuamos con el problema de la accesibilidad. La decisión de otorgar o no el acceso a esas muestras representativas sigue estando en manos de la Administración y, en no pocos casos, se requiere de un contacto o un amiguete para conseguirlo.

La Ley de Transparencia, Acceso a la Información Pública y Buen Gobierno establece que los ciudadanos tienen derecho a acceder a la información pública, y esta debe ser la guía principal en el comportamiento de la Administración en relación a las estadísticas oficiales. Los límites justificados por los casos de privacidad y seguridad deben ser la excepción, no la regla. Y el principio básico debe ser que los datos son propiedad de los ciudadanos, no de los gobiernos. Con toda modestia.