Otra receta de la cocina de las que descubrimos para Aula Electoral, por una verdad más cierta en la red. Escrito por Jaime Miquel
Estimación de resultados por equivalencia a absolutos poblacionales.
Se trata de una técnica de estimación muy precisa, pero que exige de una formación sólida para su empleo y compromete mucho más de lo que un pollster al uso puede aceptar. Formación sólida porque hay que fijar una tasa de participación probable, y esto exige conocer el comportamiento electoral en el ámbito al que se refieren las estimaciones; hay además que trabajar con los números absolutos (miles de votantes), y esto requiere del conocimiento del censo electoral. Y es mucho más comprometida, porque situar al PP en 11,5 millones de votos en elecciones generales, por poner un ejemplo, es una medida exacta, mientras que es aproximada un 47% de los votos válidos, que cubre del 46 al 48% dentro de la idea de un buen alguno, y se puede producir con distintas tasas de participación.
Con la primera receta vimos que basta con conocer los % sobre censo de los partidos y la abstención en el año 2008, para producir una estimación aceptable, que no hace falta tener mucha más idea sobre tamaños censales o resultados conocidos. Quien es capaz de producir una estimación con la técnica que presentamos en esta segunda entrega, define una estructura del comportamiento electoral en ámbito que está estudiando y empieza donde termina el anterior, que se ha limitado a producir un estado de la intención de voto; desde ahí puedes intentar explicar algo, pero los resultados estimados para cada partido son la suma de los movimientos que se están produciendo respecto a posiciones conocidas, las del año 2008 en este caso, como objeto central de estudio y cuantificación que plantea esta técnica.
La técnica parte de un supuesto teórico contrastado o premisa:
“Un entrevistado que ha votado a un partido e informa de ello en una encuesta, es electoralmente más parecido al que vota al mismo partido pero no informa, que a cualquier otro”.
Dicho de otra forma, informen o no, votarán lo mismo y distinto de lo que votarán aquellos otros, por lo que eliminamos del estudio los que no contestan en el recuerdo de voto (datos sombreados en naranja y en amarillo en la TN1).
Primer paso: selección de datos.
Trabajaremos exclusivamente con los entrevistados que informan sobre su comportamiento electoral pasado, los datos recuadrados en azul en la TN1. De paso, la técnica resuelve tres problemas:
Todos los entrevistados están clasificados respecto a un comportamiento electoral conocido, en este caso las elecciones generales del año 2008 (datos sombreados en azul).
Los que no contestan en la intención de voto, son informantes que están indecisos (verde), puesto que hemos eliminado a los no informantes (amarillo).
No importará que en la muestra se sobrerepresente o se subrepresente a unos u otros partidos políticos, se trabaja cada origen electoral de modo independiente, lo entenderemos luego.
Presenta una ventaja que puede ser su inconveniente principal, lo que la plantea como reto: el cálculo integrado de los votos a candidaturas o blancos, y la abstención -si fallamos en la tasa de participación estimada, falla la estimación-. Ese es un reto que el pollster convencional no puede asumir, porque su trabajo es otro: proporcionar estimaciones precisas, simultaneando hasta 10 o más estudios en cada proceso electoral.
Tabla nº 1. INTENCIÓN ACTUAL DE VOTO SEGÚN COMPORTAMIENTO EN GENERALES 2008.
E2859 del CIS, barómetro de enero de 2011. % verticales.
En la TN2 tenemos la selección de datos originales del barómetro de enero de 2011 del CIS, los únicos que necesitamos para producir la estimación (recuadrados en azul en la TN1). Hemos totalizado el NS y el NC. En la fila Base figura el número de entrevistas correspondientes a cada segmento de voto GEN 08 (sombreado en azul en la TN1).
Tabla nº 2. INTENCIÓN ACTUAL DE VOTO SEGÚN COMPORTAMIENTO EN E. GENERALES 2008.
Selección de datos del E2859 del CIS, barómetro de enero de 2011. % verticales.
Segundo paso: correcciones (I). Área restringida y datos extremos.
En esta TN2 hemos sombreado en celeste un área que llamamos restringida, en la que cualquier intervención tiene que estar mucho más que justificada, y hemos señalado dos datos extremos que, excepcionalmente, vamos a corregir:
-La encuesta dice que el 6,8% de los votantes de IU del año 2008, tienen intención de votar al PP, lo que serían 65.000 electores; el dato es extremo y lo hemos atenuado en un 50% (TN3).
- La encuesta dice que no hay votantes de “otros partidos” en el año 2008 (entre los que se encuentran los de Coalición Canaria), con intención de votar a CC. Es imposible que hayan desaparecido, por lo que hemos agregado dos puntos de “otros partidos” a CC (TN3).
No hay ninguna otra intervención justificable en el área restringida, incluso es cuestionable el ajuste hecho con los meigas IU-PP (existir no existen, pero haberlos hailos), aunque sabríamos defenderlo con numerosos ejemplos.
Tercer paso: Correcciones (II). Área de trabajo y tasa de participación.
En las TN2 y TN3 hemos sombreado un conjunto de datos en amarillo, lo llamamos área de trabajo y está integrada por los entrevistados que dicen no haber votado en las últimas elecciones generales, y otros que si, pero ahora votarían en blanco, se abstendrían o están indecisos. El trabajo no es otro que concretar la participación que esperamos, sistemáticamente sobrerepresentada en la encuesta, lo mismo que la intención de votar en blanco.
La TN3 refleja las correcciones de datos extremos sobre el área restringida (celeste), que hemos visto antes, y el conjunto de ajustes realizados en el área de trabajo (amarillo), para obtener una tasa de participación de referencia del entorno del 69%, unos 4,5 puntos de censo inferior a la del año 2008.
Tabla nº 3. CORRECCIONES SORE LA MATRIZ DE DATOS ORIGINALES.
Del E2859 del CIS, barómetro de enero de 2011
Se interviene para ajustar la tasa de participación respecto a una referencia dada (la del año 2008, el 73,4% CERA incluido); el ajuste es simple -será superior o inferior-, y la pista está en los propios datos, si hay desmovilización del PSOE, como en este caso, será inferior.
Convenimos por referencias externas un 69% de participación, como en el año 2000, y hacia ahí dirigimos los ajustes. No vamos a explicarlos pormenorizadamente, aunque sí algunas pautas:
- El abstención 2008 que no contesta en intención de voto, (15,3% de éstos), es abstención.
- El abstención 2008 que votaría al PSOE o al PP ahora, contiene ocultación y está sobredimensionado. Hay electores que han cambiado de partido, y dicen haberse abstenido para ocultar este cambio (p. ej. un entrevistado que votó al PSOE y ahora votará al PP, pero manifiesta no haber votado en el año 2008).
- La intención de votar en blanco está sistemáticamente sobrerepresentada en las encuestas, y esto hay que compensarlo con la abstención decidida, que aparece siempre subrepresentada.
En la TN4 tenemos la matriz de datos corregidos, preparada para operar. Los valores que se han alterado figuran en rojo (al alza), o en azul (a la baja).
Tabla nº 4. MATRIZ DE DATOS CORREGIDOS (GEN 08 x GEN 12).
% verticales.
Cuarto paso: equivalencia a absolutos poblacionales.
En paralelo, hemos aplicado mortalidad e incorporado 460.000 nuevos votantes, para actualizar la variable comportamiento en elecciones generales 2008 (TN5): el censo estimado actual CERA incluido es de 35,2 millones de electores, de los que 11.193.000 votaron al PSOE, 10,190.000 al PP, etc.
Tabla nº 5. ACTUALIZACIÓN DE LA VARIABLE ELECCIONES GENERALES 2008.
En miles.
La TN4 nos dice que el 49,7% de los votantes del PSOE del año 2008, volvería a votar a este partido, y la TN5 que los supervivientes del PSOE del año 2008 son 11,193.000 electores, luego el núcleo fiel del electorado del PSOE es de 5.562.920 votantes (5.563 en la TN6, que expresa la información en miles).
Este es el concepto que vamos a emplear para transformar los porcentajes de la matriz de datos corregidos (TN4), en números absolutos (TN6).
En la columna de la derecha de la TN6, figuran los datos directos de esta equivalencia: hemos conseguido un 29,5% de abstención antes de distribuir indecisos, y tenemos 2.551.000 de éstos, de los que 1,4 millones procede del PSOE, 673.000 del PP, etc., nada que ver con los datos directos de la encuesta que figuran en las TN1 y TN2, que no distinguen entre indecisos y no informantes, sobrerepresentan el voto en blanco y subrepresentan la abstención.
La TN6 viene a representar el 90% de la estimación final, puesto que solo falta distribuir estos casi 2,6 millones de electores indecisos, un 7,2% del censo total CERA incluido, cifra por cierto de lo más razonable.
Tabla nº 6. INTENCIÓN ACTUAL DE VOTO SEGÚN COMPORTAMIENTO EN E. GENERALES 2008.
En miles.
Se entiende ahora el comentario de que esta técnica empieza donde termina la otra, y que requiere de una formación sólida, primero para hacer los ajustes, pero sobre todo para aprovechar las posibilidades analíticas que descubre la TN6: cuántos son fieles, cuántos cambian, hacia dónde, qué pasa con el PSOE, por qué gana el PP etc.
Se entiende la idea de que la estimación no explica nada, que no es mas que la suma de los movimientos que se han producido, y que esta técnica conduce a un terreno que no puede asumir el pollster convencional, que bastante tiene con producir tantas estimaciones precisas como encargos reciba su empresa, con independencia de las posiciones sobre censo o el número de votos que signifiquen.
Quinto paso: distribución de indecisos.
En la primera entrega dimos razones para trabajar con censo total CERA incluido, o la intención directa de voto sin simpatía u otra variable que asignara indecisos, entre otras particularidades que no vamos a repetir ahora. Una ventaja que presenta esta técnica es que a estas alturas de su desarrollo la incertidumbre ha quedado reducida a un 7,2% de la muestra, los números están ya muy centrados.
La experiencia nos dice que no hay mejor asignación de los indecisos que la que nos indiquen las transferencias de voto observadas, es decir, que terminarán por decidirse en las mismas proporciones en las que estos últimos lo han hecho, o dicho de otra forma, que respetaremos la estructura de la información de la TN6 como mejor criterio, o en todo caso, como el más prudente y además objetivo. Nos alejaremos de cualquier planteamiento multivariable o modelo de predicción que asigne a estos indecisos de otra forma, no funciona, esto no es una ciencia exacta.
La TN7 expone la distribución proporcional a la transferencia de voto observada en la TN2: si el 49,7 % de los votantes del PSOE del año 2008 volverán a votar al PSOE, también lo harán el 49,7% de los indecisos, 706.000 electores (TN7); análogamente, el 11,0% de los electores indecisos del PSOE votarán ahora al PP (156.000), etc. El marginal de la izquierda recoge los totales que estamos asignando a cada partido: 729.000 al PSOE, 768.000 al PP, etc.
Tabla nº 7. DISTRIBUCIÓN DE INDECISOS SEGÚN COMPORTAMIENTO EN E. GENERALES 2008.
En miles.
Hay un ajuste en esta matriz del que daremos únicamente el concepto, de modo que alguna duda quede que pueda motivar consultas posteriores. En la TN7 vemos que los indecisos que se asignan a la abstención suman 577.000, que es el resultado de agregar los que corresponden a la abstención decidida, y los que corresponden a sí mismos.
Sexto paso: Estimación de resultados en elecciones generales 2012.
En definitiva, los porcentajes de votos válidos, que lo son todo en las técnicas al uso, no son más que un producto derivado de la cuantificación de los movimientos particulares que se han producido, objeto de estudio que se aborda mediante el empleo de esta técnica. La estimación de resultados por equivalencia a absolutos poblacionales, es la suma de las matrices de equivalencia a electores (TN6), y de distribución de indecisos (TN7).
Esta adición proporciona 7 millones de votos al PSOE, 11,5 millones al PP….y deja 11 millones de electores en la abstención, el 69% que habíamos convenido.
Tabla nº 8. ESTIMACIÓN GENERALES 2012 SEGÚN COMPORTAMIENTO EN GENERALES 2008.
En miles.
Podríamos empezar a destacar datos, como los 1,4 millones de electores que votaron al PSOE en el año 2008 que ahora van a votar al PP (periodistas: pues claro que hay trasvase), o los 2,1 millones de electores socialistas desmovilizados, o cómo se configura el electorado de UPyD, pero estamos describiendo una técnica y no es el objeto de este trabajo.
Séptimo paso: Presentación de las estimaciones.
El marginal de la izquierda de la TN8 es la estimación de la intención de voto en unas eventuales elecciones generales, expresada en miles de electores. Se entiende ahora que una de las ventajas de esta técnica, que también inconveniente, es el cálculo integrado de la abstención, una materia en la que la metodología de la encuesta no proporciona muchas certidumbres, por aparecer sistemáticamente subrepresentada, y no proporciona criterios o valores constantes que permitan corregirla; una materia difícil, sobre todo si consideramos que la participación electoral en España es el promedio de tres comportamientos claramente diferenciados en lo territorial que no vamos a detallar ahora.
Pero el marginal izquierdo de la TN8 es ilegible para el gran público, no expresa lo que nos interesa conocer, que son las posiciones relativas de los partidos y coaliciones en % de votos válidos. Comentamos aquí que las estimaciones de escaños en elecciones generales con muestras de 1000 casos que nos ofrecen los encuestadores, son un puro invento; hacen falta un mínimo de 384 casos por circunscripción para no inventárselo, unas 20.000 entrevistas y vamos muy justos, porque allí donde se reparten muchos escaños (Madrid), o hay muchas candidaturas que pueden obtener representación (Gipuzkoa, habrá que acostumbrarse), hacen falta por lo menos 500 casos.
Presentaremos la estimación como figura en la TN9: hemos sombreado los porcentajes de votos válidos, y los que se produjeron en el año 2008, y entre ambas columnas hemos situado las diferencias. Así, por ejemplo, el PSOE obtendría ahora el 28,9% de los votos válidos, 15,0 puntos menos que en el año 2008, mientras que el PP mejoraría 7,6 puntos hasta alcanzar el 47,5% de los votos válidos. La tabla presenta otras informaciones, como los porcentajes sobre censo y miles de votos que se registraron en el año 2008, los que se esperan ahora y las diferencias entre ambos pares de registros. Se presentan en color azul los valores claramente inferiores a los el año 2008, y en color rojo los valores claramente superiores.
Tabla nº 9. ESTIMACIÓN DE LA INTENCIÓN DE VOTO EN ELECCIONES GENERALES 2012.
Vamos por último a presentar un gráfico con el que matamos tres pájaros de un tiro. Por un lado, situamos la estimación que nos ocupa (receta nº 2), en el continuo de resultados que se han producido desde el año 1977, expresados en % de votos válidos, una información que el lector apreciará. Por otro lado, comparamos la estimación con la que resulta de aplicar la receta nº 1 -corrección de desviaciones respecto a un comportamiento electoral conocido-, y comprobamos que ambas conclusiones numéricas son muy parecidas.
ANTECEDENTES HISTÓRICOS E INTENCIÓN DE VOTO EN ELECCIONES GENERALES (1977-2012).
En % de votos válidos.
Y por último, comparamos nuestras estimaciones con la estimación oficial del barómetro de enero de 2011 del CIS, y concluimos que sus números no son posibles. Hemos llegado por dos procedimientos a las mismas conclusiones, y el CIS, con la misma información, llega a otras. No vamos a pedir que nos explique cómo calcula las posiciones porque no hay nada que explicar, el organismo de Presidencia está sobreestimando al PSOE. La TN10 es suficientemente expresiva: entre las recetas 1 y 2, apenas hay discrepancias, mientras que el CIS considera que el PSOE tiene 5 puntos más de votos válidos, de los que 3 se restan al PP, 1 a UPyD, y el otro se lo descuentan a IU y los demás partidos.
Tabla nº 10. ESTIMACIONES DE LA INTENCIÓN DE VOTO EN ELECCIONES GENERALES 2012.
En % de votos válidos.
JMA, 25.02.11