Qué pasó con las encuestas del 20-D
La falta de datos en la última semana provocaron que las encuestas fallasen con C's y con Podemos. El resultado obtenido por el resto de partidos -incluidos PP y PSOE- caen dentro de los intervalos previstos.
22 diciembre, 2015 11:41En España una ley prohíbe difundir sondeos cinco días antes de las elecciones. Las últimas encuestas que los medios podíamos publicar fueron las del lunes 14 de diciembre. Esas encuestas fallaron con Podemos y Ciudadanos porque no podían ver los movimientos que se produjeron la última semana.
El gráfico añadido a continuación muestra las encuestas públicas antes de las elecciones y las que se publicaron tras el cierre de urnas.
Las encuestas del lunes 14 sí apuntaron dos tendencias que luego se han confirmado: Ciudadanos caía y Podemos crecía.
Las encuestas del 20 de diciembre ratificaron esos movimientos antes del escrutinio. Tanto el sondeo pie de urna que TNS hizo para las televisiones públicas como el tracking de GAD3 anticiparon los resultados con relativa precisión. Ambos observaron la caída de Ciudadanos y el ascenso de Podemos.
A la vista de todo eso —las tendencias el día 14, la evolución del mercado de frutas en Andorra y los sondeos del 20 de diciembre—, mi opinión es que el fallo de las encuestas se debió a su antigüedad. A continuación repaso el acierto y desacierto de los sondeos y mis estimaciones.
La estimación de escaños del 14D
El 17 de diciembre publiqué nuestra última estimación de escaños. Usé solo las encuestas públicas disponibles el día 14 porque esas son las que podíamos difundir. En la tabla siguiente podéis comparar los resultados con los intervalos que estimó el modelo al 50% y al 90% de confianza.
Los escaños que han obtenido PP, PSOE, IU, CDC, ERC, PNV y CC caen dentro del intervalo que según el modelo tenía un 50% de probabilidad. Solo los resultados de Ciudadanos y Bildu eran poco probables de acuerdo al modelo (tenían menos del 5% de probabilidad).
La estimación de escaños del 14D al proyectar tendencias
En la estimación del 17 de diciembre incluí un escenario hipotético en el que proyectaba las tendencias de Podemos y Ciudadanos hacía adelante. Asumía un 19% de votos para Podemos y un 17,5% a Ciudadanos. Estos son los resultados de esa simulación.
En esta caso solo los resultados de Ciudadanos y Bildu caían fuera de lo que el modelo consideraba posible al 50%. Los resultados del resto de partidos entran dentro de lo que el modelo consideraba probable al 50%.
El siguiente gráfico compara los resultados con las 15.000 simulaciones. El PP aparece en el centro de la predicción. También PSOE y Podemos aparecen en zonas probables. Solo el resultado de Ciudadanos aparece en una cola: que cayesen hasta los 40 escaños tenía una probabilidad algo inferior al 10%.
También podéis ver en ese gráfico que los partidos más pequeños fueron bien estimados. ERC, PNV, CC y GB tuvieron exactamente los escaños que el modelo consideraba más probable (ocho, seis, uno y ninguno). Solo el resultado de Bildu parecía improbable.
Este modelo con los sondeos del día 14 proyectados hacía adelante también decía que el PSOE sería probablemente segundo (tenía un 70% de probabilidades de serlo), y que Podemos tenía ya más opciones de ser tercero que cuarto.
La estimación de escaños del 20D
El domingo antes del escrutinio hice una estimación de escaños a partir de los sondeos de TNS y GAD3 de ese mismo día. Hice un promedio de sus estimaciones de voto a nivel nacional y luego repartí esos votos por provincias usando la distribución de nuestro modelo. Estos fueron los resultados.
Esta estimación fue la mejor de todas. No es una sorpresa: tenía información actualizada en un momento en el que los votantes estaban variando sus intenciones. Solo los malos resultados de Bildu nos volvieron a sorprender.
Esta última estimación fue ya muy precisa al calcular las distintas coaliciones con opciones de sumar 176 escaños. Acertó al considerar improbable la suma PP y C's, y la de PSOE, Podemos y el resto de fuerzas de izquierda. Los resultados cayeron siempre del lado que el modelo consideraba más probable (quizás con algo de fortuna). También ocurre que, aunque parezca paradójico, es más fácil predecir la suma de dos partidos que los resultados de cada partido porque en el primer caso los errores pueden —y suelen— compensarse.
A la luz de las encuestas
A la vista de los resultados creo que los encuestadores hicieron un buen trabajo. Quizás mucha gente no estará de acuerdo pero eso depende de las expectativas que uno ponga en la precisión de las encuestas. La que yo pongo está clara: se define por los intervalos que he dado arriba.
En las elecciones catalanas de septiembre un modelo similar a este fue más preciso. Pero en aquel momento ya dije que creía que el modelo había fallado por acertar demasiado. Entonces los sondeos tuvieron algo de fortuna y esta vez lo contrario.
Mi reto para las próximas elecciones es tratar de capturas las tendencias de los últimos días, cuando los medios tenemos prohibido difundir sondeos.
En esta ocasión el fallo de las encuestas anteriores a las elecciones se debió, creo, a su antigüedad. Por eso el mercado de frutas de Andorra y los sondeos de TNS y GAD3 del mismo día 20 hicieron un mejor trabajo. Si las encuestas a las que el público tuvo acceso antes de votar no fueron más precisas, fue por culpa de una ley que nadie sabe justificar.