Presentación

Tiempo de elecciones. Tiempo de encuestas

Rafael Leonisio*

Universidad Nacional de Educación a Distancia (UNED)

* Correspondencia a/Correspondence to: Rafael Leonisio. Universidad Nacional de Educación a Distancia (UNED) - rafael.leonisio@poli.uned.es - https://orcid.org/0000-0001-7167-4166

Cómo citar/How to cite: Leonisio, Rafael (2023). «Presentación. Tiempo de elecciones. Tiempo de encuestas»; Inguruak, 74, 1-5. (https://doi.org/10.18543/inguruak.240/a>.

Recibido/Received: 2 mayo, 2023; Versión final/Final version: 20 junio, 2023.

ISSN 0214-7912 / © 2023 UPV/EHU

by-nc.png Esta obra está bajo una Licencia
Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional

La proliferación de elecciones en España en los últimos años ha hecho de la prospección electoral parte del paisaje cotidiano del consumidor de medios de comunicación. Hoy en día no hay prácticamente semana que no tengamos una noticia que nos dice qué pasaría si en ese momento se celebrasen elecciones (normalmente generales, pero no sólo). Incluso, tras la llegada de Tezanos, el CIS se apuntó a la moda, transformando en mensual la hasta hace poco habitual periodicidad cuatrimestral de sus estimaciones. Además del CIS, en España nos hemos acostumbrado a nombres de empresas como Metroscopia, GAD3 o Sigma2, y es que, como digo, lo de las encuestas electorales es un no parar. En cuanto a su calidad hay de todo, desde prospecciones rigurosas elaboradas desde la academia o el ámbito profesional hasta auténticas chapuzas normalmente perpetradas por medios de comunicación de sesgo ideológico muy marcado. En el medio, una amplia gama de colores.

En relación a esta cuestión suele hablarse mucho, y mal, de la cocina electoral. «Esa encuesta está cocinada» suele espetar aquel a quien no le gustan en demasía los datos que esta le muestra. Pero esto de la cocina suele ser un concepto equivocado. Las encuestas no se cocinan (traducción: no se manipulan sus datos para que digan lo que queremos que digan) sino que lo que se cocinan son las estimaciones electorales porque sin ese trabajo previo sobre el «producto» estas serían imposibles. Me explico. La gente suele contestar (lo de la sinceridad lo dejamos para otro día) a las preguntas de una encuesta, situándose siempre el índice de no respuesta (el famoso no sabe/no contesta) en porcentajes muy bajos. Pero hete aquí cuando preguntamos por quién votaría (o votará) en las siguientes elecciones. En ese caso la no respuesta se dispara, llegando en ocasiones hasta un 40%, o bien porque no quieren decirnos sus preferencias o bien porque no saben lo que harán. Esto no sería un problema si ese 40% se repartiera de manera homogénea en todos los electorados. Pero no es así y de ahí la necesidad de esa cocina que simplemente trata de estimar (de ahí lo de estimación) que harían esas personas en caso de convocatoria electoral.

Hacer cocina electoral es todo menos fácil. No diría que solo al alcance los mejores chefs pero no puede hacerlo cualquiera. No hay una receta universal, pero siempre es imprescindible conocer muy bien el producto, es decir, la base de datos que se maneja (normalmente solo seremos capaces de hacer una buena estimación si tenemos una serie larga y homogénea, porque nos permite conocer los sesgos que tenemos) y la sartén donde vamos a cocinarlo, es decir, la arena electoral sobre la que vamos a hacer predicciones. Que un politólogo suela clavar los resultados de las elecciones generales españolas no significa que pueda trasladar su sapiencia a Polonia. Conocer el terreno que se pisa es imprescin­dible.

¿Qué ingredientes suelen usarse en los fogones? Además del principal e indispensable, la intención directa de voto,[1] si la encuesta es completa y está bien diseñada, hay para dar y tomar: el recuerdo de voto de elecciones anteriores, cercanía a partidos o simpatía por los mismos, la posición ideológica, la valoración de líderes o de gobiernos, valores, identidad nacional, posición en issues o cualesquiera cuestiones que la experiencia nos haya dicho que son relevantes.

Su elección depende mucho del estilo de cada cual. Hay partidarios de recetas más tradicionales y minimalistas mientras que por otro lado hay quien aboga por una cocina de diseño con mucho nitrógeno líquido en forma de artificio estadístico, algo que, como sabemos bien, produce mucho humo.[2] La más básica, como nos recuerda Alberto Penadés es voto directo más simpatía ponderado por recuerdo de voto, es decir, significa «asignar a los indecisos en función de su partido más cercano, ignorar la cuestión de la participación —asignando a los restantes de forma proporcional y no restando de ningún partido— y corre­gir el resultado haciendo que los totales del voto recordado de la encuesta coincidan, o se aproximen, a los totales del voto pasado en la realidad, para lo que hay que encontrar unos coeficientes de ponderación adecuados» (Penadés, 2015: 9). Eso sí, como dirían en Master Chef siempre hay que respetar el producto. Es decir, si uno no puede cocer un «txuletón», tampoco debe retorcer los datos para que reflejen una realidad que no existe. Esto lo dejaré aquí sin mirar a nadie, aunque podría hacerlo en varias direcciones.

Para cocinar bien hay que tener siempre una buena materia prima. De hecho, cualquier experto o experta en cocina nos dirá que más vale una receta sencilla con un buen producto que una muy artificiosa con uno malo. Y la materia prima en las encuestas no es otra que la muestra. Elemento imprescindible al que suele hacerse poco caso y, cuando se hace, suele mirarse en la dirección equivocada, o por lo menos no en la esencial: el tamaño. Que sí importa, pero mucho menos de lo que la sabiduría popular piensa. Lo ilustraré con un caso real de hace unos pocos años.

Tras el éxito de Podemos en las elecciones europeas de 2014, este partido político comenzó a subir como la espuma en las encuestas nacionales, llegando a desafiar la hegemonía del viejo bipartidismo. Sin embargo, algunos oráculos politológicos vascos (de esos que no tienen datos de ningún tipo, pero sientan cátedra porque saben mucho) decían que el partido de Pablo Iglesias era un fenómeno español que nunca podría cruzar la muga, no en vano en Euskadi ya había otra fuerza que monopolizaba el voto de protesta. Sin embargo, desafiando esa «sabiduría popular», a finales de 2014 el Euskobarómetro publicó unas estimaciones electorales en las que Podemos no solo es que aparecía sino que disputaba la primera plaza al PNV. Dicha estimación no gustó demasiado y de la nada comenzaron a salir a la palestra, tanto en el ámbito académico como, y esa era la mayor novedad, en el político,[3] expertos en estadística que hablaban de conspiraciones, tamaños muestrales inviables e invenciones de datos que no hacían sino esconder oscuros intereses.

Veamos algunas de las frases (mostraremos solo el pecado y obviaremos a los pecadores), que se dijeron entonces por parte de unos cuantos políticos, suponemos que expertos en demoscopia: «La muestra del Euskobarómetro no parece muy sólida, pero quien se responsabiliza de esta encuesta normalmente suele trasladar también, más allá de datos, mensajes y la tesis que abunda en sus trabajos es que esto no es diferente a España»; «Estos datos son absolutamente escandalosos y son trucos de mano que se han sacado de la manga para hacer aparecer, a martillazos, unos datos que no tienen coherencia interna siquiera entre los porcentajes que atribuyen a cada formación y los escaños»; «Carece de la más mínima credibilidad en torno a la atribución de porcentajes y escaños»; «No sé cómo una persona con experiencia en el mundo de la sociología puede pretender que creamos que con 600 entrevistas se puede hacer una muestra significativa cuando no tenemos los datos por territorios»; «Aquellas encuestas que busquen arrojar unos datos muy cambiantes necesitan de un campo mucho mayor. Con 600 encuestas sabemos que el universo al que hay que dirigir esto debe ser mucho más significativo y habría que multiplicarlo por bastante»; «Es una encuesta que, en su cocina, en su gestación, es muy deficiente porque representa un espectro social muy pequeño». Como puede verse, aparte de descalificar al mensajero, la crítica principal se refería al tamaño de la muestra, que era de tan solo de 600 cuestionarios.

La muestra es la columna vertebral, sin ella no hay inferencia estadística. En palabras de un experto: «Una parte grande de la magia de la estadística es esta: nos permite decir cosas sobre la población a partir de un número relativamente pequeño de entrevistas con una precisión no solo aceptable sino, además, previsible. Es magia blanca» (Penadés 2015: 4). Así pues, una buena muestra, es decir, una que refleje de manera válida la realidad que pretende reflejar, es condición necesaria si queremos hacer unas buenas estimaciones electorales (y en general si queremos tener buenos datos de encuesta). Pero, como digo, una buena muestra no es solo su tamaño. De hecho, en determinadas circunstancias y cumpliendo un mínimo, el tamaño es algo secundario. Es mejor tener un buen diseño de pequeño tamaño que miles de personas con una mala muestra. A mí eso me lo enseñaron el primero de ciencias políticas, hace ya unos pocos años.

El ejemplo del Euskobarómetro es paradigmático. Independientemente de que el grado de «acierto» fuera bastante grande, como se comprobó un año después con Podemos ganando en Euskadi las elecciones generales de 2015 (y 2016),[4] la clave está en que si bien es cierto que 600 encuestas podían parecer pocas, la muestra sí estaba bien construida. Estaba realizada con metodología del Eustat de manera que sólo se podía encuestar de manera presencial en determinados distritos y secciones con cuotas de edad y sexo, gracias a lo cual se reflejaba a la perfección la diversidad socioeconómica, cultural y lingüística de Euskadi. Nada de hacer llamadas telefónicas al azar (fracaso garantizado si a posteriori no se tratan los datos). Esa calidad en el muestreo compensaba que el número de personas encuestadas fuera pequeño.

Al hilo de esta cuestión quiero aquí apuntar a la hipótesis de que algunos de los problemas actuales que tiene el CIS puedan tener que ver con la forma de administrar el cuestionario y, en consecuencia, con los cambios que ha habido en la muestra a raíz de la pandemia. Históricamente el CIS ha hecho entrevistas personales (más fiables, aunque más caras) pero desde la llegada del COVID19 a nuestras vidas decidieron ir a un modelo telefónico, el cual quizá se pensó como solución provisional para épocas de confinamientos y mascarillas pero de momento parece que ha venido para quedarse. Si diseñamos una muestra en principio debería dar igual que las entrevistas las hagamos en persona o por teléfono de cara a la selección de individuos. Podría cambiar la calidad en las respuestas pero en teoría la muestra debería ser igual (no las mismas personas, obviamente, pero sí del mismo perfil, el que representara en miniatura a toda la población). Sin embargo esa teoría no resiste la comparación empírica.

Vamos a poner como ejemplo la comparación entre el último barómetro precovid (marzo de 2020, entrevista personal) y el primero postcovid (abril de 2020, entrevista telefónica). En el primer caso (casi 4.000 encuestados y encuestadas) la distribución por nivel de estudios era la siguiente: 6% sin estudios, 13% estudios primarios, 37% secundarios, 21% FP y 23% superiores. Un mes después, con 3.000 encuestas, la distribución de la muestra era la siguiente: 2% sin estudios, 9% primarios, 27% secundarios, 22% FP y 41% superiores.[5] Es evidente que mucha gente sacó provecho intelectual del confinamiento pero no pudo dar para tanto. Así que salta a la vista que una de las dos muestras no refleja la realidad y por tanto está mal diseñada y/o ejecutada. No hay datos (o yo no los he encontrado) sobre los datos reales pero algunos fragmentarios nos pueden servir para saber cuál de las dos muestras estaba mejor diseñada. Según el INE, en 2021 (último dato que ofrecen) tenían estudios universitarios un 44% de mujeres y un 37% de hombres (es decir, un 40% del total) que estaban entre los 25 y los 64 años. Teniendo en cuenta que los menores de 25 y los mayores de 64 suman en torno a un tercio de la población y que en esas dos franjas de edad las personas con educación superior son mucho más escasas, todo parece indicar que cuando se hacían entrevistas presenciales la «foto» que nos daba la muestra era mucho más realista. Y esa foto movida influye en las estimaciones porque, como bien se sabe, el nivel de estudios influye en el comportamiento electoral (siempre ha habido más personas que han pasado por la universidad en los electorados de IU o Podemos, por ejemplo). Si no se tiene en cuenta ese problema y no se pone solución, el desatino continuará.

En resumen, cuando queramos juzgar la bondad de una estimación electoral en lo primero que tenemos que fijarnos es en la muestra porque sin buena materia prima y sin respetar el producto podemos sacar un plato muy espectacular y colorido, pero seguramente insípido. Así que, antes de juzgar fijémonos bien en la muestra y en sus posibles sesgos (por ejemplo, les recomiendo que comparen el recuerdo de voto en los barómetros del CIS con los datos reales, verán que hay claros «ganadores y perdedores»). Y, por supuesto, no dudemos en sospechar cuando la información que se nos ofrece sobre la muestra es escasa o nula.

Bibliografía

Ferrándiz, José Pablo y Camas García, Francisco (dirs.) (2019), La cocina electoral en España. La estimación de voto en tiempos de incertidumbre, Madrid, La Catarata.

Penadés, Alberto (2015), «Especial encuestas: errores, cocina y predicción», Zoom Político 25.

[1] Es decir, la clásica pregunta: si mañana se celebrasen elecciones generales (o autonómicas o locales), ¿a qué partido votaría usted?

[2] Quien quiera hacer un curso rápido tiene a su disposición dos textos bastante recomendables, de la escuela más sobria. Son sencillos (que no simples). Sin excesiva artificiosidad estadística pero muy completos ya que tienen todo lo necesario y nada de lo prescindible. Véase Ferrándiz y Camas (2019) y Penadés (2015). Quien prefiera la alta cocina, siempre puede ponerse el reto de comprender las cambiantes metodologías que el CIS aplica en barómetros y encuestas preelectorales.

[3] En los últimos tiempos, con los vaivenes metodológicos y las estimaciones poco ortodoxas del CIS, nos hemos acostumbrado a críticas a las cocinas electorales desde un punto de vista técnico/metodológico, pero entonces no era tan habitual.

[4] Lo cual no es relevante para el argumento ya que las estimaciones no son una predicción de futuro (salvo que las elecciones sean inmediatas). Cuando se hacen estimaciones a muchos meses vista, como era el caso, no se está diciendo qué pasará cuando haya elecciones sino que pasaría si las hubiera en ese momento (nótese la diferencia en tiempos verbales, Futuro simple vs. Condicional simple).

[5] La distorsión sigue igual. En el último barómetro que tengo disponible (marzo 2023) la distribución era así: 3% sin estudios, 6% primarios, 28% secundarios, 19% FP y 44% superiores. Y por tomar uno de años antes, en junio de 2015 era así: 6% sin estudios, 18% primarios, 38% secundarios, 17% FP y 20% superiores.