Está en la página 1de 25

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/348169227

Aplicación del método de evaluación indirecta de la calidad de encuestas


electorales (EICE) a la posible detección de sesgos sistemáticos en los
escrutinios de España del 28 de abr...

Article · January 2022

CITATIONS READS

0 30

1 author:

Guillermo Enrique Ramos


Universidad de Morón
32 PUBLICATIONS   2 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Distribuciones Discretas y su aplicación en el análisis de problemas reales View project

Modelos Estadísticos de Curvas de Lactancia en vacas Holando Argentino View project

All content following this page was uploaded by Guillermo Enrique Ramos on 25 February 2021.

The user has requested enhancement of the downloaded file.


Statistical Reports 45 (2022), 1-24.
© Statistical Reports, ISSN 1988-7825.

Aplicación del método de evaluación indirecta de la calidad de encuestas electorales (EICE) a la posible detección de
sesgos sistemáticos en los escrutinios de España del 28 de abril de 2019

Guillermo E. Ramos

Universidad de Morón (Argentina)

Resumen

Se desarrolla un nuevo método de Evaluación Indirecta de la Calidad de Encuestas electorales, que a diferencia del anterior
Ramos y Verón (2022a, 2022b), no supone el conocimiento de los resultados finales de un escrutinio electoral, en cambio
supone que se cuenta con encuestas insesgadas, como resultado del trabajo de diferentes consultoras a lo largo del
tiempo. Se estima mediante un modelo parsimonioso la evolución de la intención de voto hasta las elecciones y finalmente
se contrasta lo predicho por el modelo para las elecciones, con lo que efectivamente salió. Idealmente todos o casi todos
los parámetros (Porcentaje de votos para cada candidato) del escrutinio definitivo deberían ser compatibles con la
predicción obtenida del modelo, si eso no ocurre se tendría indicios o de que la inmensa de la mayoría de las encuestas
fueron sesgadas, o bien, que el escrutinio es sesgado.

Summary

A new method of Indirect Evaluation of the Quality of Electoral Surveys is developed, which unlike the previous by Ramos
and Verón (2022a, 2022b), it does not imply knowledge of the final results of a vote count, but rather assuming that there
are unbiased surveys, as a result of the work of different consulting firms over time. A parsimonious model is estimated
through the evolution of the intention to vote until the elections, and finally what is predicted by the model is contrasted
with what actually came out. Ideally, all or almost all the parameters (Percentage of votes for each candidate) of the
definitive scrutiny should be compatible with the prediction obtained from the model, if this does not happen, it is
indicative or that the vast majority of the surveys were biased or that the final scrutiny is biased.

Palabras claves

Muestreo - Evaluación de Calidad - Encuestas Electorales - Efecto de Diseño - Margen de Error - Escrutinio Electoral
Definitivo - Sesgo electoral.

Keywords

Sampling - Quality Assessment - Electoral Surveys - Design Effect - Margin of Error - Definitive Electoral Scrutiny - Electoral
bias.

Introducción

Para su aplicación inicial a las elecciones argentinas del año 2003, Ramos y Verón (2003, 2005) desarrollaron y presentaron
en sendos congresos de SAIMO 1 y la SAE 2, un método de Evaluación Indirecta de la Calidad de encuestas electorales (EICE),
en términos de eficiencia, que luego publicaron Ramos y Verón (2022a, 2022b). Estos métodos EICE tratan de juzgar la
calidad, supliendo el desconocimiento de los detalles específicos del diseño de cada encuesta, como la información sobre el
trabajo de laboratorio y de los resultados a campo, que solo están en manos de quienes diseñaron los correspondientes

1 SAIMO: SOCIEDAD ARGENTINA DE INVESTIGADORES DE MARKETING Y OPINIÓN


2
SAE: SOCIEDAD ARGENTINA DE ESTADISTICA
1
operativos muestrales y les permitirían hacer una Evaluación Directa de la calidad de sus encuestas. Así puede
determinarse el valor relativo de cada opinión en las encuestas electorales y comparar las distintas encuestas entre sí, aún
cuando fueran hechas por empresas diferentes y en momentos diferentes.

Básicamente el método EICE1 consiste en, después de conocer el resultado del escrutinio definitivo, aplicar el concepto de
Efecto del Diseño Muestral (Def) propuesto por Kish (1972), para juzgar las últimas encuestas preelectorales de cada
consultora. Como este efecto, se supone constante en diferentes encuestas hechas con la misma metodología y por la
misma consultora, su empleo hacia atrás en el tiempo permite obtener una medición mejorada de la evolución de la
intención de voto y además obtener, cuando está disponible, una estimación mejorada de los resultados de una eventual
segunda vuelta, como ocurrió en las elecciones para Jefe de Gobierno de la Ciudad de Buenos Aires del año 2003.

Una de las características interesantes de estos métodos EICE es que permite ajustar los tamaños muestrales de las
𝑛𝑛
diferentes encuestas por ese factor de diseño (Def) obteniendo el ajuste del respectivo tamaño muestral, 𝑛𝑛𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 = 𝐷𝐷𝐷𝐷𝐷𝐷 .
El tamaño muestral ajustado es el tamaño muestral de una muestra aleatoria simple sin reemplazo, que habría obtenido
una precisión equivalente a la obtenida por esa muestra. Cuanto mayor sea el Def de una encuesta, peor es la calidad de
esa encuesta en cuanto a aprovechamiento de la información de cada encuestado, pues requiere mayor tamaño de
muestra final para alcanzar la misma precisión que alcanzaría cualquier otra encuesta con menor Def, haciendo la salvedad
de que en ocasiones se logra un mayor Def con un costo del operativo menor que podría compensar. Entonces este
aspecto de la calidad es más relevante para los diseñadores y para quien paga la encuesta electoral. En cuanto a la
información que provee, una encuesta es mejor cuanto mayor sea su n ajustado, este es el criterio que finalmente decide
las cosas para el lector de la encuesta y será mayor el valor de una encuesta cuanto mayor sea el n ajustado o equivalente.

La mayoría de las encuestas electorales tienen un efecto de diseño mayor que 1, compensando su menor precisión con un
tamaño muestral muy grande. Aún así, suele ser mucho más económico tomar una muestra grande con un diseño diferente
al muestreo aleatorio simple, como diferentes tipos de muestreo por conglomerado en estratos, por las dificultades
operativas que aparecerían ante el intento de hacer directamente una muestra aleatoria simple sin reemplazo en el
contexto de las campañas electorales.

Conociendo los tamaños muestrales ajustados de un grupo de encuestas independientes y contemporáneas es posible
obtener intervalos de confianza realistas, mucho más precisos, combinando la información de dichas encuestas, y cabría
esperar que si estas encuestas están dentro de los 10 días del escrutinio, que dentro de estos intervalos estén los
resultados del escrutinio realizado. Cuando el autor intentó aplicar este método EICE1, sobre las encuestas electorales de
las elecciones españolas del 28/4/2019, se llevó una desagradable sorpresa, pues todo parecía conspirar contra su validez.

En primer lugar los efectos de diseño hallados con el método EICE1, eran mucho mayores de los que se conocían de
situaciones similares en Argentina y en segundo lugar con los tamaños muestrales ajustados, se fracasaba en obtener
intervalos de confianza combinados que contuvieran los resultados del escrutinio.

Comenzó a dudar de algunos de los supuestos del método, o bien el resultado del escrutinio había sido adulterado o las
encuestas preelectorales habían sido sesgadas, sin descartar la posibilidad de que ocurrieran ambas cosas
simultáneamente, sobre el escrutinio y sobre algunas de las encuestas.

Pero si no se puede confiar en los resultados publicados para el escrutinio definitivo, el método EICE1 original no se puede
emplear. En este artículo se presenta una modificación del método anterior al que llamaré EICE2, que considera
desconocido el resultado real del escrutinio electoral. El método EICE2 estima como el anterior, por máxima verosimilitud
sobre la distribución normal multivariada asintótica que siguen los resultados de las encuestas, siguiendo la evolución de la
intención del voto a lo largo del tiempo y mide al mismo tiempo por separado el efecto de diseño de cada consultora
(fuente). Finalmente estima, en base a un modelo que describa bien la evolución del voto a medida que se acercan las
elecciones, el resultado para el día del escrutinio, hace intervalos de confianza y se fija si dentro de ellos están los
resultados publicados.

2
Estadísticamente el tema considerado comprende aspectos de teoría de distribuciones de la familia exponencial, en
particular de la Multinomial con sobre dispersión, y su aproximación asintótica, la Normal Multivariada, así como una
metodología general de abordaje de los problemas aplicados de estas distribuciones, conocida como Modelo Lineal
Generalizado. También se relaciona con los estimadores Máximo verosímil y Quasimáximo verosímil de los parámetros de
dichas distribuciones y métodos de comparación de verosimilitud de los modelos anidados que se requieran.

Afroz y Shabuz (2020) explican y proponen dos modelos teóricos (Dirichlet-Multinomial y mezcla finita de variables
multimoniales) que podrían explicar la relación entre los modelos multinomiales y los modelos multinomiales con sobre
dispersión, que acá se aplican y desarrollan una comparación de las respectivas bondades de esos modelos mediante un
ejemplo de simulación de la estimación de sus parámetros. La gran diferencia entre este problema, y el que ellos abordaron
en su simulación, es que acá hay tantos parámetros de sobre dispersión (Def) como consultoras, mientras que en los
modelos considerados por ellos hay un solo parámetro de sobre dispersión para todo el conjunto de datos.

El nuevo método EICE2 sigue descansando en el supuesto de que en general las encuestas son insesgadas aunque tienen un
error muestral bastante mayor al que cabría esperar con los tamaños muestrales empleados. Si hubiera alguna encuesta
sesgada, se espera que ésta se presente en forma contemporánea con otras que sean insesgadas, lo cual permitiría
detectarla y darle un peso relativo menor en la estimación de la evolución. La función que describe el cambio en el tiempo
de la intensión del voto es continua y derivable. Esta función será estimada en base a la transformación logística
generalizada con modelos polinómicos del orden necesario para obtener un ajuste satisfactorio.

Materiales y métodos.

Los resultados oficiales publicados fueron los siguientes, luego de eliminar los votos inválidos:

Partido Diputados Votos % Votos/diputado


PSOE 123 7480755 28,68% 60819,15
PP 66 4356023 16,70% 66000,35
Cs 57 4136600 15,86% 72571,93
Podemos-IU-EQUO 35 3118191 11,95% 89091,17
VOX 24 2677173 10,26% 111548,88
Resto 45 4316511 16,55% 95922,47
ERC-SOBERANISTES 15 1015355 3,89% 67690,33
ECP-GUANYEM EL CANVI 7 614738 2,36% 87819,71
JvCAT-JUNTS 7 497638 1,91% 71091,14
EAJ-PNV 6 394627 1,51% 65771,17
EH Bildu 4 258840 0,99% 64710,00
CCA_PNC 2 137196 0,53% 68598,00
NA+ 2 107124 0,41% 53562,00
COMPROMIS 2019 1 172751 0,66% 172751,00
PRC 1 52197 0,20% 52197,00
PCMA 0 326045 1,25%
En blanco 0 740000 2,84%
350 26085253 100,00%

Acá vamos a trabajar sobre los votos a las 5 primeras fuerzas y el resto agrupados.

Resultados
Partidos 28/04/2019
PSOE 28,68%

3
PP 16,70%
Cs 15,86%
Podemos-IU-EQUO 11,95%
VOX 10,26%
Resto 16,55%
100,00%

Santiago Abascal (2019) "manifestaba su descontento la mañana del lunes (29/4/2019) después de las elecciones con el
sistema de distribución de escaños. Según la ley, Vox necesitaba 111.548 votos para conseguir un diputado, mientras que el
PSOE necesitaba 60.602; el PP, 65.694; Ciudadanos, 72.246; y Podemos, 88.707 sufragios. Y es que los pequeños partidos
salen perdiendo con el sistema de la ley D'Hont, que beneficia a los grandes y a los nacionalistas -partidos con fuerza en
circunscripciones concretas". La cita anterior viene a cuento porque cualquier error en el recuento final de los votos puede
tener serias implicaciones en la distribución de escaños de la cámara de diputados y por lo tanto en la conformación del
gobierno. No solo importa la magnitud global del error, sino también donde ocurre ese error.

La información de las encuestas electorales españolas para el escrutinio del 28/4/2019, se fueron publicando en diferentes
medios nacionales que generalmente las habían solicitado. Pero luego aparecieron publicadas en algunos medios digitales
especializados. Los resultado en las encuestas aquí consideradas fueron bajados de https://electocracia.com/

Aplicación inicial del método EICE1

Los datos publicados durante los últimos 8 días de encuestas antes del escrutinio fueron los siguientes:

Tamaño Muestral
Otros /Blancos
PUBLICACIÓN

FIN CAMPO

proporción de
equivalente
MEDIO FUENTE Def/n
Tamaño

ajuste:
Def**
El País 40dB 20/04 18/04 2000 28,8 17,8 14,1 13,2 12,5 13,6 0,00282096 5,64192845 354,5 17,72%
Eldiario.es Celeste-Tel 21/04 20/04 1100 28,9 23,5 15,1 13,5 7,9 11,1 0,01069038 11,7594147 93,5 8,50%
Demoscopia
OkDiario 22/04 22/04 950 28,1 21,8 14,4 12,6 12,7 10,4 108,7
y Servicios
0,00920249 8,74236173 11,44%
Demoscopia
Esdiario 22/04 18/04 950 28,4 21,6 14,7 12,7 12,4 10,2 112,3
y Servicios
0,00890398 8,45878022 11,82%
Levante DYM 21/04 17/04 1025 29 20,4 15,5 13,7 10,4 11 0,0058973 6,04473468 169,6 16,54%
ABC GAD3 22/04 19/04 10000 31,5 20,1 13,9 12,1 11,4 11 0,00639925 63,9924555 156,3 1,56%
El Imop
21/04 18/04 ? 29,8 19,8 15,1 14,1 10 11,2 ? 180,1 ?
Confidencial insights 0,00555236
La Sexta Invymark 22/04 20/04 ? 28,1 20,4 15,3 13 12,7 10,6 0,00746372 ? 134,0 ?
20 Minutos Metroscopia 22/04 16/04 4775 29,1 19,6 14,2 14,3 11,1 11,7 0,00526464 25,1386388 189,9 3,98%
La Razón Nc Report 22/04 13/04 1000 28,1 23,8 14,9 13 9 11,2 0,01012835 10,1283467 98,7 9,87%
El Mundo Sigma Dos 21/04 17/04 8000 30,3 20,1 15 13,2 10,2 11,2 0,00537849 43,0278941 185,9 2,32%
El Español Sociométrica 22/04 20/04 1800 29,5 18,2 15,1 13,6 12,6 11 0,00562667 10,1280125 177,7 9,87%
La Voz de
Sondaxe 21/04 18/04 1000 30,9 18,3 13,8 13,6 10,5 12,9 307,0
Galicia 0,00325785 3,25785324 30,70%
37840
2268,2
*
* En las muestra indicada con ? se desconoce el tamaño muestral, lo cual no impide obtener el tamaño muestral equivalente y por lo tanto aprovechar la información
pero impide el cómputo del Def y la proporción a la cual tiene que ajustarse la muestra original. El n total surge de una estimación suponiendo que en las encuestas con
información incompleta la relación entre n y n ajustado es similar al promedio de las relaciones en las otras encuestas.

** Estimados empleando el EICE1

4
Puede verse que los porcentajes de intención de voto una semana antes de las elecciones, fluctúan entre 28,1 y 30,9% para
Psoe, 17,8 y 23,8 para Partido Popular, entre 13,8 y 15,5 para Ciudadanos, entre 12,1 y 14,3 para Podemos y entre 10,2 y
13,6 para Vox. El resto fluctúa entre 10,6 y 12,9.

Para calcular Def/n en base al EICE1 se hizo uso de la fórmula:


𝑑𝑑𝑑𝑑𝑑𝑑 1 ʹ
� − 𝑷𝑷
= 5 �𝒑𝒑 � 0 )−1 + 1 𝟏𝟏𝟏𝟏ʹ � �𝒑𝒑
� 0 � �𝛥𝛥(𝑷𝑷 � 0�
� − 𝑷𝑷 (1)
𝑛𝑛 𝑃𝑃 6

derivada por Ramos y Verón (2022a) de la estimación máximo verosímil de def cuando se conocen las
� 0 son los valores publicados
proporciones poblacionales por disponer de un buen escrutinio definitivo, y donde 𝑷𝑷
por el escrutinio. El tamaño muestral ajustado es simplemente la recíproca de def/n y se define como el tamaño
muestral que tendría que tener una muestra aleatoria simple sin reemplazo para alcanzar la misma precisión que
esta encuesta. A medida que aumenta el def, disminuye el tamaño muestral ajustado. Una muestra aleatoria
simple sin reemplazo tiene por definición def=1, existen diseños con def<1 pero en general en encuestas
electorales el def supera a 1 pues para abaratar costos se entrevista a personas que están vinculadas entre si y
por lo tanto piensan políticamente parecido.
Puede verse que el tamaño muestral ajustado es aproximadamente solo el 6% (100 x 2268,2/37840 %) del
tamaño real, lo cual deja mucho que desear en términos de eficiencia pues se corresponde a un efecto de diseño
promedio de 1/0,06 ≈ 17. Se gasta mucho y mal para conocer la intención de voto.
El efecto de diseño abultado también podría haber sido afectado por valores escrutados sesgados y tal vez no sea tan mala
la situación en cuanto a las encuestas, si se contara con un escrutinio sin sesgo.

A partir de los tamaños muestrales ajustados puede obtenerse una estimación mejorada, combinando los valores de todas
las encuestas. Si las encuestas tuvieron procedimientos insesgados, cualquier promedio de ellas también daría una
estimación insesgada, pero la varianza de esta estimación se minimiza si los valores de cada encuesta se pesan en
proporción al tamaño muestral ajustado de cada una. Los resultados de esa encuesta mejorada son equivalentes a tener
una muestra aleatoria simple de tamaño igual a la suma de las muestras ajustadas.

% de votos pronosticado Resto


para cada Partido

Porcentaje estimado
combinando las muestras
de los últimos 8 días 29,45% 19,78% 14,58% 13,35% 11,17% 11,68%
Error Estándar 0,96 0,84 0,74 0,71 0,66 0,67
Ajustado(ee)
27,57 18,14 13,13 11,95 9,88 10,35
Límite inferior
31,32 21,42 16,03 14,75 12,47 13,00
Límite superior
Valor Escrutinio 28,68% 16,70% 15,86% 11,95% 10,26% 16,55%
¿Cómo cae el valor del
escrutinio en el intervalo dentro fuera - dentro fuera - dentro fuera +
combinado?
Amplitud de los intervalos 3,75 3,28 2,90 2,80 2,59 2,64

5
El error estándar ajustado se puede calcular haciendo: 𝑒𝑒𝑒𝑒𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 = �𝑝𝑝𝑝𝑝/𝑛𝑛𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 , y los límites se calcularon como para
hacer intervalos individuales del 95% de confianza, es decir al porcentaje estimado de cada partido se le restó y sumó 1,96
ee. Se puede apreciar que el valor del Psoe está dentro de lo que previsible, igual que los valores de Ciudadanos y Vox
(pues supera al límite inferior y está por debajo del superior), pero en cambio el partido de centro derecha: Partido Popular
y el comunista Podemos fueron perjudicados, mientras que algunos partidos pequeños del resto (como los
independentistas fue favorecido).

De cualquier modo, ya es bastante malo que estos intervalos no contengan todos los porcentajes escrutados, pero en este
caso 3 de los 6 porcentajes comparados caen por fuera. La chance de que 3 o más de los 6 intervalos simultáneos fallen en
contener sus respectivos parámetros, cuando cada uno tiene 5% de probabilidad de fallar, si estos intervalos fueran
independientes (aunque no lo son) es de algo más de 0,1%. El más desfavorecido fue Partido Popular con algo más del 3%
del total, es decir una subestimación del 15,5% de sus electores, que seguramente le quitó alrededor de una decena de
diputados.

Ahora bien, todo este análisis descansa en la validez de la idea de que se conocen los verdaderos valores escrutados, que
las encuestas en sí son mayoritariamente insesgadas y que en el plazo de 8 días difícilmente pasó algo que explique tanto
cambio en la intención de voto, pero examinando los resultado anteriores, ante las dudas de que el escrutinio fuera
alterado, se cae la condición fundamental para aplicar el método EICE1 original (Ramos y Verón, 2022a). Además al existir
problemas con los porcentajes publicados en los escrutinios, la situación puede ser aún peor, pues el mismo instrumento
que estamos empleando (el def de la fórmula (1)), sería afectado por cualquier sesgo sistemático del escrutinio.

Método EICE2

Surgió entonces el interés de modificar este método EICE, sin usar los resultados del escrutinio. En su lugar se comparan los
resultados de las encuestas a lo largo de los meses que precedieron el escrutinio, con respecto a un resultado combinado
de las encuestas contemporáneas. Se obtuvieron de la misma página de internet (https://electocracia.com/) un total de
100 encuestas desde el 30/9/2018, cuando faltaban 210 días para el escrutinio, hasta el 22/4/2019, cuando faltaban solo 6
días, entre las cuales están incluidas todas las mencionadas arriba. Se contó entonces con un total de 100 encuestas.

Se calculó el tiempo que faltaba en días entre la fecha de publicación y la fecha del escrutinio, y al valor resultante se lo
discretizó de modo que hubiera alrededor entre 3 y 6 encuestas por intervalo temporal, asignándole como días de anticipo
al escrutinio, a los días que faltan para la fecha central de cada intervalo. Hubo un intervalo con solo 2 encuestas al
principio cuando eran muy escasas y al mismo tiempo se presumía que eran bastante estables.
Demoscopia y Servicios

Número de Encuestas
Simple Lógica
Imop Insights

Sociométrica
Metroscopia

disponibles
Celeste-Tel

Sigma Dos

Días que faltan


NC Report
Invymark

Sondaxe

desde las
GESOP

Varios

encuestas hasta
GAD3
40dB

el Escrutinio
CIS

Electoral (t)
-209 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 2
-199 0 0 1 0 0 0 0 0 0 1 0 1 0 0 0 3
-184 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 4
-167 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 5
-137 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 3
-131 0 0 0 0 1 0 1 0 1 1 0 0 1 0 0 5
-126 0 0 0 0 0 0 0 1 0 0 1 1 0 0 0 3
6
-108 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 3
-90 0 0 0 0 1 0 0 2 0 1 0 0 0 0 1 5
-73 0 0 1 0 1 1 0 0 0 0 0 1 1 0 0 5
-64 0 0 0 0 1 0 0 1 1 1 1 0 0 1 0 6
-45 0 0 1 0 1 0 0 1 0 1 0 1 1 0 0 6
-34 1 0 0 0 1 0 1 0 0 1 0 0 0 1 0 5
-30 0 0 1 1 0 0 1 0 1 0 0 0 0 0 0 4
-25 0 0 1 0 0 0 2 1 0 1 0 0 1 0 0 6
-20 0 0 0 0 1 1 1 0 0 1 0 0 0 0 0 4
-18 0 1 0 0 1 0 1 0 0 0 0 1 0 0 0 4
-14 0 0 1 0 1 0 1 1 0 1 0 0 1 0 0 6
-9 1 0 1 1 1 0 1 0 0 0 0 0 2 0 1 8
-7 0 0 1 0 0 0 1 0 0 0 1 0 0 1 2 6
-6 0 0 0 2 1 0 0 1 1 1 0 0 1 0 0 7
Número de
Encuestas
disponibles 2 2 11 4 12 3 10 12 5 11 4 8 9 3 4 100

Vemos que algunas de las encuestadoras tienen muchas encuestas distribuidas a lo largo de todo este tiempo,
otras recién aparecen al final. En la categoría varios se pusieron encuestas de 3 encuestadoras diferentes, dos
que tienen una sola encuesta y otra (DYM) que tiene dos encuestas pero dentro del mismo intervalo temporal y
que por lo tanto no permitían una buena estimación de su efecto de diseño, para este conjunto de
encuestadoras se hizo una estimación de su efecto de diseño combinado.
Aquí asumiremos que, ante el tamaño muestral considerado, el teorema central del límite es aplicable para la
verdadera distribución del vector de proporciones, sobre todo porque en general el muestreo suele ser
probabilístico, si es por área en las primeras etapas (hasta manzana), y si es telefónico dentro de todas las
etapas. En el muestreo telefónico suele ser un problema el elevado rechazo que lleva a sobre muestrear con una
probabilidad desconocida a quienes son más accesibles, sin hacer los ajustes necesarios en las probabilidades de
selección.
�𝑐𝑐𝑡𝑡 de proporciones estimadas por
Entonces bajo las condiciones explicadas por Ramos y Verón (2022a) el vector 𝒑𝒑
la encuestadora c cuando faltan t días para las elecciones, se distribuirá asintóticamente Normal, con media
𝐸𝐸 �𝒑𝒑 � 𝑡𝑡 y varianza 𝑉𝑉 �𝒑𝒑
�𝑐𝑐𝑡𝑡 � = 𝑷𝑷 �𝑐𝑐𝑡𝑡 � = 𝑊𝑊𝑡𝑡 = defc Vt
𝑐𝑐

donde 𝑷𝑷� 𝑡𝑡 es la intención de voto desconocida que va variando con el paso del tiempo como resultado de los
cambios de opinión del electorado, es decir en función de los días que faltan, t, y en vista al escrutinio electoral
ocurrirá cuando t=0.
� 𝑡𝑡 tiene dimensión 5 pues son las probabilidades de los 5 principales: PSOE, PP, Ciudadanos, Podemos y Vox, la
𝑷𝑷
probabilidad del Resto ( 𝑃𝑃6𝑡𝑡 ) se obtiene por diferencia:
� 𝑡𝑡 = 1-∑5𝑖𝑖=1 𝑃𝑃𝑖𝑖
𝑃𝑃6𝑡𝑡 = 1 − 𝟏𝟏′ 𝑷𝑷 𝑡𝑡

por otro lado: �𝑐𝑐𝑡𝑡 � = 𝑑𝑑𝑑𝑑𝑑𝑑𝑐𝑐 𝑽𝑽𝒕𝒕 = 𝑑𝑑𝑑𝑑𝑑𝑑𝑐𝑐


𝑉𝑉 �𝒑𝒑
1
� 𝑡𝑡 � − 𝑷𝑷
�𝛥𝛥�𝑷𝑷 � 𝑡𝑡 ʹ �
� 𝑡𝑡 𝑷𝑷
𝑛𝑛𝑡𝑡𝑐𝑐

7
1
y con � 𝑡𝑡 )−1 + 𝟏𝟏𝟏𝟏ʹ �
𝐕𝐕𝐭𝐭 −1 = 𝑛𝑛𝑡𝑡𝑐𝑐 �𝛥𝛥(𝑷𝑷 𝑃𝑃 6𝑡𝑡

� 𝑡𝑡 � es una matriz diagonal cuyos elementos no nulos son las respectivas probabilidades de voto por los
y 𝛥𝛥�𝑷𝑷
partidos 1, 2, 3, 4 y 5 cuando faltan t días para las elecciones.
Así cuando faltan t días para el escrutinio la intención de voto medida por la consultora c se puede modelar
haciendo:
−5�2
𝑑𝑑𝑑𝑑𝑑𝑑𝑐𝑐 −1�2
� �𝑛𝑛𝑡𝑡 � � 𝑡𝑡 ) − 𝑷𝑷
�𝛥𝛥(𝑷𝑷 � 𝑡𝑡 ′ �
� 𝑡𝑡 𝑷𝑷
𝑛𝑛𝑡𝑡𝑐𝑐
𝑐𝑐
− �2 𝑑𝑑𝑑𝑑𝑑𝑑 �𝒑𝒑 � 𝑡𝑡 �′ �𝛥𝛥(𝑷𝑷
�𝑐𝑐𝑡𝑡 −𝑷𝑷 � 𝑡𝑡 )−1 + 1 𝟏𝟏𝟏𝟏′ ��𝒑𝒑
�𝑐𝑐𝑡𝑡 −𝑷𝑷
� 𝑡𝑡 �
�𝑐𝑐𝑡𝑡 )
𝑓𝑓(𝒑𝒑 = 𝑒𝑒𝑒𝑒𝑒𝑒 𝑐𝑐 𝑃𝑃6𝑡𝑡

√2𝜋𝜋

Tomando logaritmo
−1�2 𝑑𝑑𝑑𝑑𝑑𝑑𝑐𝑐 𝑛𝑛 ′
� 𝑡𝑡 ) − 𝑷𝑷
𝐿𝐿𝐿𝐿 �𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 )� = 𝐿𝐿𝐿𝐿 ��√2𝜋𝜋 �𝛥𝛥(𝑷𝑷 � 𝑡𝑡 ′ ��
� 𝑡𝑡 𝑷𝑷 5
� − 𝐿𝐿𝐿𝐿 � � 𝑡𝑡 )−1 + 1 𝟏𝟏𝟏𝟏′ � �𝑝𝑝�𝑡𝑡𝑐𝑐 − 𝑷𝑷
�𝑛𝑛𝑡𝑡 � − 𝑡𝑡𝑐𝑐 �𝑝𝑝�𝑡𝑡𝑐𝑐 − 𝑃𝑃�𝑡𝑡 � �𝛥𝛥(𝑷𝑷 � 𝑡𝑡 � (2)
2 𝑐𝑐 2𝑑𝑑𝑑𝑑𝑑𝑑𝑐𝑐 𝑃𝑃6 𝑡𝑡

� 𝑡𝑡 �, podríamos estimar defc , derivando con respecto


Si conociéramos el valor esperado de estas proporciones �𝑷𝑷
a defc e igualando a 0 y obtendríamos el estimador Máximo Verosímil Asintótico de def tal como se explicó en
Ramos y Verón (2020a).

� = 𝑛𝑛 �𝒑𝒑
𝑑𝑑𝑑𝑑𝑑𝑑 � �ʹ �𝛥𝛥(𝑷𝑷
� − 𝑷𝑷 � )−1 + 1 𝟏𝟏𝟏𝟏ʹ � �𝒑𝒑 ��
� − 𝑷𝑷 (3)
5 𝑃𝑃 6

pero lamentablemente no es el caso, entonces hay que estimar los valores de def de cada consultora estimando
� 𝑡𝑡 = ℎ(𝑡𝑡) que se describirá a continuación.
simultáneamente las probabilidades de cada partido con la función 𝑷𝑷
� 𝑡𝑡 = �𝑃𝑃1𝑡𝑡 , 𝑃𝑃2𝑡𝑡 , 𝑃𝑃3𝑡𝑡 ,
Para situaciones de este tipo suele modelarse a cada proporción de 𝑷𝑷 𝑃𝑃4𝑡𝑡 , 𝑃𝑃5𝑡𝑡 �'

mediante la función logit general (4), que permite transformar cada proporción en una función lineal para luego
emplearla en lo que se conoce como Modelo Lineal Generalizado.

𝑃𝑃𝑖𝑖
𝐿𝐿𝐿𝐿𝐿𝐿 �𝑃𝑃 𝑡𝑡 � = 𝛼𝛼𝑖𝑖 + 𝛽𝛽1𝑖𝑖 𝑡𝑡 + 𝛽𝛽2𝑖𝑖 𝑡𝑡 2 + 𝛽𝛽3𝑖𝑖 𝑡𝑡 3 + 𝛽𝛽4𝑖𝑖 𝑡𝑡 4 + 𝛽𝛽5𝑖𝑖 𝑡𝑡 5 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑖𝑖 = 1,2,3,4,5 (4)
6𝑡𝑡

y esta función puede invertirse haciendo:


2 +𝛽𝛽 𝑡𝑡 3 +𝛽𝛽 𝑡𝑡 4 +𝛽𝛽 𝑡𝑡 5
𝑒𝑒 𝛼𝛼𝑖𝑖 +𝛽𝛽1𝑖𝑖𝑡𝑡+𝛽𝛽2𝑖𝑖 𝑡𝑡 3𝑖𝑖 4𝑖𝑖 5𝑖𝑖
𝑃𝑃𝑖𝑖𝑡𝑡 = 2 +𝛽𝛽 𝑡𝑡 3 +𝛽𝛽 𝑡𝑡 4 +𝛽𝛽 𝑡𝑡 5 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑖𝑖 = 1,2,3,4,5
1 + ∑5𝑗𝑗=1 𝑒𝑒 𝛼𝛼𝑗𝑗 +𝛽𝛽1𝑗𝑗𝑡𝑡+𝛽𝛽2𝑗𝑗𝑡𝑡 3𝑗𝑗 4𝑗𝑗 5𝑗𝑗

1
y 𝑃𝑃6𝑡𝑡 = 𝛼𝛼 +𝛽𝛽 𝑡𝑡+𝛽𝛽2𝑗𝑗 𝑡𝑡2 +𝛽𝛽3𝑗𝑗 𝑡𝑡3 +𝛽𝛽4𝑗𝑗 𝑡𝑡4 +𝛽𝛽5𝑗𝑗 𝑡𝑡5
(5)
1+∑5𝑗𝑗=1 𝑒𝑒 𝑗𝑗 1𝑗𝑗

para su estimación. Como el autor no logró resolver este problema en forma analítica lo hizo numéricamente. El
vector h(t) se incorporó en la ecuación (2) para maximizarla con respecto a los parámetros que en número de 45

8
explican la evolución en el tiempo. De estos parámetros, 30 permiten modelar la evolución a lo largo del tiempo
de cada candidato y los otros 15 sirven para modelar el def o sobre dispersión propio de cada consultora, con la
aclaración de que solo se consideran 14 consultoras por sí mismas y el último parámetro para el resto (que como
se mencionó tienen solo una o dos encuestas en este estudio y por ende no tienen información).
Se optó por resolver este problema de maximización (2) en forma numérica usando alguno de los
procedimientos de optimización para el Modelo Lineal Generalizado incorporados en el SAS/STAT 9.22. Se
consideraron así los procedimientos NLIN, el CATMOD, el GENMOD, el PROBIT, el LOGISTIC, el GLIMMIX y el
NLMIXED, pero ninguno de ellos se adecuó completamente, ya sea porque no era fácil implementar en ellos la
distribución multinomial o normal multivariada subyacente en este problema, o porque solo podían emplearse
en forma univariada, o como el GENMOD que permite trabajar con multinomiales pero no con la función de
ligadura requerida (el logit generalizado), o como el LOGISTIC, en el cual aunque se podía usar el modelo aquí
propuesto, pero había que conformarse con estimar un def común para todas las consultoras y esto perjudicaba
de plano el interés del tema y empeoraba la calidad del ajuste obtenido.
Cabe aclarar que el SAS fue enriquecido, luego de la versión empleada (ej. SAS/Studio, SAS/Viya) con muchos
otros procedimientos que podrían emplearse para el Modelo Lineal Generalizado, pero no estuvieron disponibles
para considerarles aquí. Finalmente se logró modelar la ecuación (2), con las instrucciones de programación que
el NLIN trae incorporadas, pero haciendo uso de un par de trucos interesantes que pasare a explicar:

• El procedimiento NLIN, permite ajustar modelos univariados no lineales por mínimos cuadrados, y trae
incorporada la capacidad de modificar, mediante un lenguaje de programación análogo al del paso DATA,
el proceso de cada observación. Es un problema de minimización.
• Acá en cambio se quería maximizar la verosimilitud de la información multivariada de las 100 encuestas
de un total de 17 consultoras.
• Cambiar el problema de maximización a uno de minimización se puede lograr multiplicando la función del
logaritmo de verosimilitud por -1, pero no alcanza pues aún no establecimos como transformar esto en
un problema de mínimos cuadrados.
Es decir en apariencia es un problema totalmente diferente donde el NLIN trabaja con variables univariadas,
nosotros trabajamos con una función de densidad conjunta pentavariada.
El NLIN calcula el residual entre la variable respuesta y el valor predicho y minimiza sus cuadrados, pero acá no
tenemos en el sentido del NLIN, ni variable respuesta univariada, ni un residual que calcular sobre él. Entonces se
los fabricó.
Se creó en primer lugar una variable respuesta llamada cero, que siempre vale 0. Además como la ecuación (2)
puede tomar valores positivos o negativos ya que aunque 𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 ) es siempre positiva, podría superar a 1,
entonces su logaritmo (aunque siempre está definido) podría tomar valores negativos. Se requiere que
−𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 )) sea siempre positiva, lo cual se logró en este problema sumándole la constante 50 a cada
−𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 )) . Luego se elevó a la raíz cuadrada al resultado de 50−𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 )) y se lo puso a la derecha de la
sentencia MODEL del NLIN.
En el procedimiento NLIN se escribió la sentencia:

MODEL cero=�(50 − 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 ))) ;

9
Es decir que el NLIN está tratando de acercarse al 0 cuanto es posible minimizando el valor de la derecha.
Mediante esta sentencia se le pide al NLIN que calcule la Suma de Cuadrados Residual (SCR), donde los residuales
están escritos dentro del paréntesis :
100 2 100 2
𝑐𝑐 𝑐𝑐
𝑆𝑆𝑆𝑆𝑆𝑆 = � �𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 − �(50 − 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡 )))� =� �0 − �(50 − 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡 )))� =
𝑗𝑗=0 𝑗𝑗=1

100 2 100 100


𝑐𝑐
=� ��(50 − 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡 )))� =� (50 − 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 ))) = 100 ∗ 50 − � 𝑙𝑙𝑙𝑙𝑙𝑙(𝑓𝑓(𝑝𝑝�𝑡𝑡𝑐𝑐 ) =
𝑗𝑗=1 j=1
𝑗𝑗=1

=5000 - Log(Verosimilitud de la función de densidad conjunta de las 100 encuestas) (6)

Entonces, cuando se minimiza la SCR en este modelo artificial, en realidad se está minimizando el negativo del logaritmo
de verosimilitud, que equivale a maximizando la verosimilitud del modelo buscado para este problema. Este método me
fue sugerido por un ejemplo del procedimiento NLIN (60.3 Probit Model with Likelihood Function en SAS/STAT, 2012),
donde se lo emplea para encontrar la estimación máximo verosímil de un problema de regresión logística sobre variables
binomiales.

El procedimiento NLIN tiene 4 métodos de optimización por mínimos cuadrados METHOD=GAUSS, MARQUARDT, NEWTON
y GRADIENT, aquí se empleó el NEWTON que resultó de rápida convergencia. En estos métodos se les puede proporcionar
las derivadas, pero si uno no lo hace, el procedimiento las estima numéricamente. Una vez lograda la convergencia, el
programa entrega los estimadores obtenidos para cada parámetro y la supuesta SCR que en realidad es una constante
menos el logaritmo de la verosimilitud (5). Como explica la documentación del procedimiento NLIN, los test de Wald que
proporciona para cada uno de los parámetros, no están correctamente calculados pues se basan en los residuales que acá
no existen. A partir de estos residuales, por defecto se estima 𝜎𝜎 2 y de este surgen los test de Wald que se computan con el
correspondiente elemento de la matriz Hessiana multiplicada por el estimador de 𝜎𝜎 2 . En lugar de eso acá conviene fijar el
valor de 𝜎𝜎 2 en 1 (opción SIGSQ=1), con lo cual se puede obtener directamente la matriz de varianzas y covarianzas del
vector de parámetros en la matriz Hessiana. Esta se puede exportar del procedimiento y en un paso posterior calcular test
t aproximados para cada parámetro.

Una vez conseguido el procedimiento para maximizar la verosimilitud y luego de verificar que el ajuste era satisfactorio, se
fueron probando nuevos modelos anidados buscando que sean parsimoniosos y así reducir el orden de los polinomios
requeridos tras cada ecuación del logit generalizado (4). Al trabajar con modelos anidados se fueron eliminando los
parámetros uno a uno comenzando por el que tiene orden 5 para cada logit y bajando el orden, cuando el correspondiente
test del cociente de verosimilitud mostraba que al sacar el parámetro de mayor orden y simplificar el modelo, el ajuste era
prácticamente el mismo.

Una vez hallado un modelo que proporciona un ajuste satisfactorio se estimaron las probabilidades a lo largo del tiempo,
los def de cada una de las principales consultoras y se extrapoló unos pocos días el modelo para predecir el resultado de las
elecciones, es decir la probabilidad de cada partido en el día t=0. Acá suprimiré en la notación de las probabilidades el
subíndice t para mayor claridad, entonces 𝑃𝑃𝑖𝑖0 = 𝑃𝑃𝑖𝑖 para i=1, 2, 3, 4, 5 y 6.

Para el cómputo de los intervalos de confianza de cada proporción de votos se empleó el método delta (ver e.g. Xu y Long,
2005), que consiste en aproximar la varianza de una función sobre el vector de parámetros con los primeros términos de su
expansión en series de Taylor.

10
𝛿𝛿𝛿𝛿(𝛽𝛽̂ ) 𝛿𝛿𝛿𝛿(𝛽𝛽̂ )
𝑉𝑉𝑉𝑉𝑉𝑉(𝐺𝐺(𝛽𝛽̂ ))) = ( � ̂ )′ 𝑉𝑉𝑉𝑉𝑉𝑉(𝛽𝛽̂ ) ( � ̂)
𝛿𝛿𝛽𝛽 𝛿𝛿𝛽𝛽

𝛿𝛿𝛿𝛿(𝛽𝛽̂ )
Donde ( � ̂ ) es un vector columna y 𝑉𝑉𝑉𝑉𝑉𝑉(𝛽𝛽̂ ) una matriz cuadrada de orden igual a pxp donde p es el número de
𝛿𝛿𝛽𝛽
parámetros del modelo considerado.

En el caso del día del escrutinio, como t=0, las proporciones (𝐺𝐺(𝛽𝛽̂ )) se pueden calcular haciendo:

𝑒𝑒 𝛼𝛼𝑖𝑖
𝑃𝑃𝑖𝑖 = 𝑖𝑖 = 1, 2, 3, 4, 5
1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5

1
𝑃𝑃𝑖𝑖 = 𝑖𝑖 = 6
1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5
con lo cual resultan ser directamente una función de las ordenadas αi , detrás de cada probabilidad de intención de voto.

Derivando con respecto a cada αi se presentan básicamente dos situaciones, cuando αi está en el numerador de la
probabilidad

𝑑𝑑𝑃𝑃𝑖𝑖 𝑒𝑒 𝛼𝛼𝑖𝑖 𝑒𝑒 2𝛼𝛼𝑖𝑖


= − 𝑖𝑖 = 1, 2, 3, 4, 5
𝑑𝑑𝛼𝛼𝑖𝑖 1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5 (1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5 )2
𝑑𝑑𝑃𝑃𝑖𝑖
= 𝑃𝑃𝑖𝑖 − 𝑃𝑃𝑖𝑖 2 = 𝑃𝑃𝑖𝑖 𝑄𝑄𝑖𝑖 𝑖𝑖 = 1, 2, 3, 4, 5
𝑑𝑑𝛼𝛼𝑖𝑖

y cuando αí está en el numerador de otra probabilidad


𝑑𝑑𝑃𝑃𝑖𝑖 0 𝑒𝑒 𝛼𝛼𝑖𝑖 𝑒𝑒 𝛼𝛼í
= − 𝑖𝑖 = 1, 2, 3, 4, 5; í ≠ 𝑖𝑖
𝑑𝑑𝛼𝛼í 1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5 (1 + 𝑒𝑒 𝛼𝛼1 + 𝑒𝑒 𝛼𝛼2 + 𝑒𝑒 𝛼𝛼3 + 𝑒𝑒 𝛼𝛼4 + 𝑒𝑒 𝛼𝛼5 )2

𝑑𝑑𝑃𝑃𝑖𝑖
= − 𝑃𝑃𝑖𝑖 𝑃𝑃í 𝑖𝑖 = 1, 2, 3, 4, 5; í ≠ 𝑖𝑖
𝑑𝑑𝛼𝛼í

𝛿𝛿𝛿𝛿(𝛽𝛽̂ )
Entonces � ̂ para la primera proporción:
𝛿𝛿𝛽𝛽

𝛿𝛿𝑃𝑃1
� � ′ = (𝑃𝑃1 𝑄𝑄1 , − 𝑃𝑃1 𝑃𝑃2 , − 𝑃𝑃1 𝑃𝑃3 , − 𝑃𝑃1 𝑃𝑃4 , − 𝑃𝑃1 𝑃𝑃5 )
𝛿𝛿(𝛼𝛼1 , 𝛼𝛼2 , 𝛼𝛼3 , 𝛼𝛼4 , 𝛼𝛼5 )
del mismo modo se calculan las derivadas para cada una de las 5 proporciones (5) y se corresponden perfectamente con las
𝛿𝛿𝛿𝛿(𝛽𝛽̂ )
filas de la matriz V cuando t=0. El resto de los elementos de ( � ̂ ) se completa con valores 0:
𝛿𝛿𝛽𝛽

Así 𝑉𝑉� (𝑃𝑃�1 ) = (𝑃𝑃�1 𝑄𝑄�1 , − 𝑃𝑃�1 𝑃𝑃�2 , − 𝑃𝑃�1 𝑃𝑃�3 , − 𝑃𝑃�1 𝑃𝑃�4 , − 𝑃𝑃�1 𝑃𝑃�5 , 0, 0, . . . 0) 𝑉𝑉(𝛽𝛽̂ ) (𝑃𝑃�1 𝑄𝑄�1 , − 𝑃𝑃�1 𝑃𝑃�2 , − 𝑃𝑃�1 𝑃𝑃�3 , − 𝑃𝑃�1 𝑃𝑃�4 , − 𝑃𝑃�1 𝑃𝑃�5 , 0, . . .0)′

y repetir esto con cada probabilidad (5). Luego se pudieron hacer intervalos de confianza para cada probabilidad de
intención de voto y ver si logran contener a la proporción publicada.

11
⏞𝑖𝑖 ) < 𝑃𝑃𝑖𝑖 < 𝑃𝑃�𝑖𝑖 + 1,96 �𝑉𝑉�(𝑃𝑃
𝑃𝑃𝑃𝑃 �𝑃𝑃�𝑖𝑖 − 1,96 �𝑉𝑉� (𝑃𝑃 ⏞𝑖𝑖 )� = 0,95 para i= 1, 2, 3, 4, 5

Del mismo modo, se puede estimar la intención de voto para cada valor t de interés a lo largo de los meses previos a las
elecciones, hacer intervalos de confianza de las proporciones y ver si los guarismos de cada consultora caen dentro o fuera
de dichos intervalos. Para estimar los errores estándar de cada t hay que derivar:

2 +𝛽𝛽 𝑡𝑡 3 +𝛽𝛽 𝑡𝑡 4 +𝛽𝛽 𝑡𝑡 5


𝑒𝑒 𝛼𝛼𝑖𝑖 +𝛽𝛽1𝑖𝑖𝑡𝑡+𝛽𝛽2𝑖𝑖 𝑡𝑡 3𝑖𝑖 4𝑖𝑖 5𝑖𝑖
𝑃𝑃𝑖𝑖𝑡𝑡 = 2 +𝛽𝛽 𝑡𝑡 3 +𝛽𝛽 𝑡𝑡 4 +𝛽𝛽 𝑡𝑡 5 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑖𝑖 = 1,2,3,4,5
1 + ∑5𝑗𝑗=1 𝑒𝑒 𝛼𝛼𝑗𝑗 +𝛽𝛽1𝑗𝑗𝑡𝑡+𝛽𝛽2𝑗𝑗𝑡𝑡 3𝑗𝑗 4𝑗𝑗 5𝑗𝑗

con respecto a todos los demás parámetros de los polinomios de distintos órdenes con respecto a t.

Las derivadas con respecto a los términos constantes dan lo mismo que para t=0
𝑑𝑑𝑃𝑃𝑖𝑖𝑡𝑡
= 𝑃𝑃𝑖𝑖 − 𝑃𝑃𝑖𝑖 2 = 𝑃𝑃𝑖𝑖 𝑄𝑄𝑖𝑖 𝑖𝑖 = 1, 2, 3, 4, 5
𝑑𝑑𝛼𝛼𝑖𝑖

𝑑𝑑𝑃𝑃𝑖𝑖𝑡𝑡
= − 𝑃𝑃𝑖𝑖 𝑃𝑃í 𝑖𝑖 = 1, 2, 3, 4, 5; í ≠ 𝑖𝑖
𝑑𝑑𝛼𝛼í
para el resto de los términos.
𝑑𝑑𝑃𝑃𝑖𝑖𝑡𝑡
= 𝑡𝑡𝑗𝑗 (𝑃𝑃𝑖𝑖 − 𝑃𝑃𝑖𝑖 2 ) = 𝑡𝑡𝑗𝑗 𝑃𝑃𝑖𝑖 𝑄𝑄𝑖𝑖 𝑖𝑖 = 1, 2, 3, 4, 5
𝑑𝑑𝛽𝛽𝑗𝑗𝑖𝑖

𝑑𝑑𝑃𝑃𝑖𝑖𝑡𝑡
= −𝑡𝑡𝑗𝑗 𝑃𝑃𝑖𝑖 𝑃𝑃í 𝑖𝑖 = 1, 2, 3, 4, 5; í ≠ 𝑖𝑖
𝑑𝑑𝛽𝛽𝑗𝑗𝑖𝑖

con j = 1, 2, 3, 4 ó 5 según el partido de que se trate. Así por ejemplo para Vox se requieren las derivadas para j=1, 2, 3, 4 y
5 en cambio para Psoe se requiere solo la de j=1.
� 𝑡𝑡𝑐𝑐 de una encuestadora particular (c) cuando faltan t días para
También se puede aplicar la expresión (3) para estimar el 𝑑𝑑𝑑𝑑𝑑𝑑
el escrutinio electoral, cambiando las probabilidades desconocidas por las que surgen del modelo, y así ver si se comportan
aproximadamente constantes y similares al defc general de la consultora que surge del modelo, o detectar si hay anomalías.
ʹ
� 𝑡𝑡𝑐𝑐 = 𝑛𝑛 �𝒑𝒑
𝑑𝑑𝑑𝑑𝑑𝑑 �𝑐𝑐𝑡𝑡 − 𝑷𝑷 � 𝑡𝑡 )−1 + 1 𝟏𝟏𝟏𝟏ʹ � �𝒑𝒑
� 𝑡𝑡 � �𝛥𝛥(𝑷𝑷 � 𝑡𝑡 �
�𝑐𝑐𝑡𝑡 − 𝑷𝑷 (3')
5 𝑃𝑃 6𝑡𝑡

Resultados

La selección de los modelos se hizo con un nivel de significación, α, del 5%. Se partió con un modelo completo donde cada
uno de los logits generalizados seguía un polinomio de grado 5 y el ajuste gráfico a las proporciones de cada partido a lo
largo del tiempo pareció adecuado, pero en los test de Wald sobre sus parámetros se apreció que varios tenían valor p
> α.

En la Tabla que sigue se registra la búsqueda de un modelo parsimonioso que lograra explicar igualmente bien los datos,
pero con menos parámetros, luego de mirar los test t aproximados (Tipo III) que se pueden hacer a partir de la matriz de
varianzas y covarianzas del vector de parámetros, su buscó cual tenía el valor más pequeño. El parámetro de orden 5 para
Vox resultó altamente significativo (1,18x10-5) así que a este no se le modificó. Se decidió entonces, retirar el término de
orden 5 para la probabilidad de Ciudadanos y así se pasó del modelo I al II que obtuvo una función de verosimilitud (-log())
muy similar al anterior, según el correspondiente test, χ2 , por lo tanto pasamos a un modelo con 44 parámetros.

Repitiendo el proceso se fueron probando modelos con orden 4 para Podemos, orden 4 para Partido Popular, etc.
12
Al intentar pasar a Ciudadanos que presentó un test t con valor p = 0,1584 y por ello candidato a salir, se obtuvo en la
prueba un valor p = 0,044464, es decir < α, o sea significativo, es decir que el ajuste del modelo VII perjudicaba al ajuste del
modelo VI. Se probaron entonces otros modelos hasta que todos los términos de mayor grado en los últimos polinomios de
cada partido fueran significativos. El modelo final (el IX) para Psoe tiene en su logit general una función lineal, para Partido
Popular, Ciudadanos y Podemos una función de orden 4, y para Vox una función de orden 5, que ajustan la evolución de los
resultados electorales a lo largo del tiempo con un total de 38 parámetros, tan bien como el modelo original con 45.

Resumen Orden del polinomio


Número Modelos
Número de anidados
2 2
de paráme- Partido -LOG( compara- gl P(χ <χ obs
2
Modelo tros Psoe Popular Ciudadanos Podemos Vox Verosimilitud) dos c obs )
I 45 5 5 5 5 5 -1854,54395
II 44 5 5 4 5 5 -1854,32599 II vs I 0,43591 1 0,509103 n.s.
III 43 5 5 4 4 5 -1854,30619 III vs II 0,039613 1 0,842239 n.s.
IV 42 5 4 4 4 5 -1854,23489 IV vs III 0,142599 1 0,705711 n.s.
V 41 4 4 4 4 5 -1854,19406 V vs IV 0,081665 1 0,775053 n.s.
VI 40 3 4 4 4 5 -1854,02213 VI vs V 0,343862 1 0,557609 n.s.
VII 39 3 4 3 4 5 -1852,00269 VII vs VI 4,038873 1 0,044464 *
VIII 39 2 4 4 4 5 -1852,93542 VIII vs VI 2,17342 1 0,140414 ns
IX 38 1 4 4 4 5 -1852,30759 IX vs VIII 1,255656 1 0,262475 ns
*Por este resultado no corresponde bajar el orden del logit general de ciudadanos de orden 4.

Se destaca en rojo, en cuales modelos el orden de los diferentes logits generales quedó reafirmado, pues a partir de allí
solo se obtuvo para esos parámetros valores p altamente significativos en sus respectivas pruebas t, Tipo III. Con respecto
a las consultoras modeladas los respectivos efectos de diseño, Def con sus tamaños muestrales equivalentes, fueron:

Efectos de Diseño por Consultora


Número de Encuestas Efecto de diseño=
Consultora o fuente consideradas Parámetro ajustado exp(parámetro)
40dB 2 1,36326314843881 3,908928
CIS 2 3,44529406671416 31,352500
Celeste-Tel 11 1,63733447274355 5,141447
Demoscopia y Servicios 4 -0,00303043190347 0,996974
GAD3 12 1,32285471792448 3,754123
GESOP 3 0,91232696263937 2,490110
Imop Insights 10 -0,27113900841271 0,762510
Invymark 12 -0,13806129797738 ¿?0,871045
Metroscopia 5 1,02497121170165 2,787015
NC Report 11 0,95148653051990 2,589556
Sigma Dos 4 0,35100350915133 1,420492
Simple Lógica 8 1,26430806181320 3,540642
Sociométrica 9 0,64016270920599 1,896789
Sondaxe 3 0,91047453331874 2,485502
Varias: DYM (2 enc.), Hamalgama(1 enc.), 4 0,56908878707561 1,766657
Top Position(1 enc.)

Puede hacerse un ránking de las consultoras, según menor el efecto de diseño, mejor el desempeño en términos de
aprovechamiento de la información provista por cada encuestado, pero en este ranking no hay que considerar a Invymark
13
de la cual no se pudo obtener el verdadero tamaño muestral para sus encuestas y el valor obtenido es meramente una
conjetura. Lo mismo pasa con la única encuesta de Hamalgama y con ejemplos aislados de otras consultoras pero de las
cuales se tienen tamaños muestrales para el resto de sus encuestas.

La empresa mejor posicionada es:

1. Imop Insights con un def de 0,76; es decir que se muestra en promedio más preciso que un muestreo aleatorio
simple sin reemplazo (MAS) (def=1). Igualmente está muy bien posicionada Demoscopia y Servicios que tiene un
def de 0,997. En estas empresas cada encuesta aporta información equivalente a la que proporciona una MAS o
algo más.

El resto de las encuestadoras:

2. tienen un desempeño aceptable con un 1<def<2, Sigma Dos, Sociométrica, DYM, Top Position. Para este grupo
cada 2 encuestas aportan información de precisión similar a la que aportaría 1 encuesta en una MAS.
3. un 2<def<4 regular: 40db, GAD3, GESOP, Metroscopia, NC.Report, Simple Lógica y Sondaxe. Para este grupo cada 2
a 4 encuestas aportan información de precisión similar a una encuesta MAS.
4. un 4<def<10 malo: Celeste-Tel Para este grupo cada 4 a 10 encuestas aportan información de precisión similar a
una encuesta MAS.
5. un 10<def muy malo: Cis. En el caso particular de Cis se necesitan 31 encuestas para que se reúna información de
precisión similar a una encuesta MAS.

También aplicando el método delta se pueden hacer intervalos de confianza para los efectos de diseño de cada consultora

Ránking de las Consultoras (Fuentes) según su Efecto de Diseño e intervalos de confianza 95%
Efecto de
Efecto de Límite Límite Diseño
Diseño inferior superior estimado
estimado Encuestas del efecto del efecto con
3
Ranking Fuente o Consultora con EICE2 consideradas de diseño de diseño EICE1
1 Imop_Insights 0,76 10 0,07 1,46 ¿?
¿? Invymark ¿?0,87 12 0,08 1,67 ¿?
3 Demoscopia_y_Servicios 1 4 0,09 1,91 8,7 y 8,5
4 Sigma_Dos 1,42 4 0,13 2,72 43
5 DYM 1,77 2 0,16 3,38 6
6 Hamalgama 1,77 1 0,16 3,38 _
7 Top_Position 1,77 1 0,16 3,38 _
8 Sociométrica 1,9 9 0,17 3,63 10,1
9 GESOP 2,49 3 0,22 4,76 _
10 Sondaxe 2,49 3 0,22 4,75 3,2
11 NC Report 2,59 11 0,23 4,95 10,1
12 Metroscopia 2,79 5 0,25 5,33 25,1
13 Simple_Lógica 3,54 8 0,31 6,77 _
14 GAD3 3,75 12 0,33 7,18 64
15 40dB 3,91 2 0,34 7,47 5,6
16 Celeste-Tel 5,14 11 0,45 9,83 11,8

3
Valores estimados por el método EICE1 que supone que el escrutinio publicado es correcto sobre las encuestas de los últimos 8 días
previos al escrutinio. Compararlos con los valores obtenidos por el método EICE2 a lo largo de toda la campaña de encuestas y
desconfiando del escrutinio.
14
17 CIS 31,35 2 2,76 59,94 _

De todos modos, los valores de def para las consultoras, aparecen mucho más realistas, que los que se presentaron en la
introducción (y habían sido calculados para las encuestas de la última semana suponiendo que los porcentajes publicados
del escrutinio eran correctos (EICE1)), cuando se los compara a los efectos de diseño, que por experiencia del autor, se
pueden encontrar en las encuestas electorales reales cuando se lo mide directamente (con conocimiento de información
de campo), comparando las varianzas estimadas del diseño, con la varianza de una muestra aleatoria simple del mismo
tamaño. Es decir probablemente la mala impresión que tiene el público de la mala calidad en general de las encuestas es en
gran parte atribuible a un sesgo sistemático en los valores publicados del escrutinio electoral.

En el gráfico de la evolución a lo largo del tiempo, del porcentaje de intención de voto para cada partido, se puede ver
reflejado el grado de polinomio requerido para cada uno y como en todas las series menos en el PSOE, el resultado del
escrutinio se aleja bastante de lo predicho por el modelo para ese día.

Evolución de la intención de Voto durante los 7 meses previos a las elecciones del 28/4/2019
32,00%
%

PSOE 27,00%
Partido Popular
Ciudadanos 22,00%
Podemos
17,00%
VOX
Otros
12,00%
% Escr PSOE
% Escr P.Popular 7,00%
% Escr Ciudadanos
% Escr. Podemos 2,00%
% Escr. VOX
-250 -200 -150 -100 -50 -3,00% 0
días
% Resto

Cada una de estas funciones resume bien la evolución de la intención de voto medida por las diferentes encuestadoras a lo
largo del tiempo:

15
Evolución de la intención de Voto en los 8 meses previos a las elecciones del 28/4/2019.
Detalle del PSOE %
PSOE 32,00%

Partido Popular
27,00%
Ciudadanos
Podemos 22,00%
VOX
17,00%
Otros
% Escr PSOE 12,00%
% Escr P.Popular
7,00%
% Escr Ciudadanos
% Escr. Podemos 2,00%
% Escr. VOX
-250 -200 -150 -100 -50 -3,00% 0
% Resto días

Evolución de la intención de Voto en los 7 meses previos a las elecciones del 28/4/2019.
Detalle del Partido Popular %
32,00%

PSOE
27,00%
Partido Popular
Ciudadanos 22,00%
Podemos
17,00%
VOX
Otros 12,00%
% Escr PSOE
% Escr P.Popular 7,00%

% Escr Ciudadanos
2,00%
% Escr. Podemos
-250 -200 -150 -100 -50 0
% Escr. VOX días -3,00%
% Resto

16
Evolución de la intención de Voto en los 7 meses previos a las elecciones del 28/4/2019. %
Detalle de Ciudadanos
32,00%
PSOE
Partido Popular 27,00%

Ciudadanos
22,00%
Podemos
VOX
17,00%
Otros
% Escr PSOE 12,00%
% Escr P.Popular
% Escr Ciudadanos 7,00%

% Escr. Podemos
2,00%
% Escr. VOX
% Resto -250 -200 -150 -100 -50 0
días -3,00%

Evolución de la intención de Voto durante los 8 meses previos a las elecciones del 28/4/2019.
Detalle de Podemos %
PSOE 32,00%
Partido Popular
27,00%
Ciudadanos
Podemos
22,00%
VOX
Otros 17,00%
% Escr PSOE
% Escr P.Popular 12,00%

% Escr Ciudadanos
7,00%
% Escr. Podemos
% Escr. VOX 2,00%
% Resto
-250 -200 -150 -100 -50 -3,00% 0
días

17
Evolución de la intención de Voto durante los 8 meses previos a las elecciones del 28/4/2019.
Detalle de VOX %
PSOE 32,00%

Partido Popular
27,00%
Ciudadanos
Podemos 22,00%

VOX
17,00%
Otros
% Escr PSOE 12,00%
% Escr P.Popular
7,00%
% Escr Ciudadanos
% Escr. Podemos 2,00%
% Escr. VOX
-250 -200 -150 -100 -50 0
días -3,00%
% Resto

Evolución de la intención de Voto durante los 8 meses previos a las elecciones del 28/4/2019. %
Detalle del Resto
PSOE 32,00%

Partido Popular
27,00%
Ciudadanos
Podemos 22,00%

VOX
17,00%
Otros
% Escr PSOE 12,00%

% Escr P.Popular
7,00%
% Escr Ciudadanos
% Escr. Podemos 2,00%
% Escr. VOX
-250 -200 -150 -100 -50 -3,00% 0
días
% Resto

En seguida veremos que las conclusiones sobre un posible sesgo electoral, mirando si los porcentajes del escrutinio caen
dentro o fuera de los intervalos, y en qué dirección, coinciden bastante con los resultados de la introducción, pero ahora
los nuevos intervalos están mejor justificados pues no se está suponiendo, como al principio (cuando usamos EICE1) que el
escrutinio sea correcto, y son algo más estrechos por lo cual más sensibles para detectar si los porcentajes escrutados caen
dentro o fuera de los intervalos.

Para el tiempo t=0 el porcentaje de votos para cada partido, proyectado a partir del modelo que ajustó a la muestra de 100
encuestas electorales a lo largo del tiempo arroja los siguientes resultados:

Psoe Ciudadanos Podemos Vox Otros


Partido Partido

18
Popular

% 28,24% 19,84% 14,16% 13,67% 13,77% 10,32%


Ee 0,69% 0,67% 0,57% 0,57% 1,12% 0,55%
Li 26,90% 18,52% 13,04% 12,54% 11,58% 9,24%
Ls 29,58% 21,15% 15,29% 14,79% 15,95% 11,40%
Amplitud de los 2,69% 2,63% 2,25% 2,25% 4,37% 2,16%
intervalos

Cabría esperar que el escrutinio cayera dentro delos intervalos de confianza salvo rara excepción
Valores
escrutinio 28,68% 16,70% 15,86% 11,95% 10,26% 16,55%
El valor del
escrutinio con
respecto al Dentro Fuera(-) Fuera(+) Fuera(-) Fuera(-) Fuera(+)
intevalo cae:
% de diferencia 0,44% -3,14% 1,69% -1,72% -3,51% 6,23%
absoluto
% de diferencia 1,55% -15,81% 11,96% -12,55% -25,46% 60,32%
relativo
Vemos que aparte del Psoe que cae bien dentro del intervalo, el resto cae fuera ya por defecto (-) como por exceso (+).

Es decir que el Partido Popular, Podemos y Vox recibieron menor porcentaje de votos que lo que cabría esperar de las
encuestas, mientras Ciudadanos y los partidos menores e independentistas recibieron un porcentaje de votos en exceso. El
más castigado con respecto al porcentaje de votos estimado fue Vox (-25,46%), seguido del Partido Popular (-15,81%) y de
Podemos (-12,55%), mientras que los más favorecidos fueron el conjunto de partido menores e independentistas (60,32%)
y Ciudadanos (11,96%).

También se pueden superponer sobre el gráfico anterior, las bandas de confianza de los valores esperados de intención de
voto según el modelo y verificar que todos los porcentajes de los escrutinios están fuera de su banda a excepción del Psoe.

19
Bandas de confianzas de la Evolución de la intención de Voto durante los 7 meses previos a las
elecciones del 28/4/2019
PSOE 32,00%

Partido Popular
27,00%
Ciudadanos

Podemos 22,00%
VOX
17,00%
Otros
%

% Escr PSOE
12,00%
% Escr P.Popular

% Escr Ciudadanos 7,00%

% Escr. Podemos
2,00%
% Escr. VOX
días
% Resto -250 -200 -150 -100 -50 0
-3,00%

Efectos de diseño por consultora (Fuente)

Para apreciar hasta qué punto el efecto de diseño se mantiene aproximadamente constante en cada consultora, pueden
graficarse estos ordenados por efecto de diseño promedio. Mientras algunas consultoras tienen encuestas con efecto de
diseño muy estable, hay otras que tienen efectos fluctuantes que podrían obedecer a alguna de las siguientes razones:

• Pocas encuestas en el tiempo para medir con suficiente precisión el efecto de diseño.
• Cambios en el diseño muestral que le hicieron cambiar su efecto de diseño.
• Modificación de los resultados de algunas encuestas originales por influencia de otras publicadas
contemporáneamente o por razones ajenas al muestreo en sí, como el deseo de conformar a un cliente exigente
por razones publicitarias.

Entre las encuestas con mayor estabilidad en el efecto de diseño se encuentran NC Report y Metroscopia.

Sondaxe, Sigma Dos, Demoscopia y Servicios, y GESOP, se presentan bastante estables pero tienen pocas encuestas para
valorarlo adecuadamente.

Imop Insight, Sociométrica, Simple Lógica, GAD3, y Celeste Tel se presentan en general estables pero tienen alguna
encuesta de comportamiento inesperado o alguna tendencia lineal aparente que no se puede explicar con el modelo.

20
Imop Insights Demoscopía y Servicios
2 2,5
Efecto de Diseño

Efecto de Diseño
1,5 2
1,5
1
1
0,5 0,5
0 0
-150 -100 -50 0 -40 -30 -20 -10 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

Sigma Dos Dym, Top Position y Hamalgama


3 5
2,5 Efecto de Diseño 4
Efecto de Diseño

2 3
1,5
2
1
0,5 1
0 0
-150 -100 -50 0 -100 -80 -60 -40 -20 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

Sociométrica Sondaxe
5 5
Efecto de Diseño

Efecto de Diseño

4 4
3 3
2 2
1 1
0 0
-150 -100 -50 0 -80 -60 -40 -20 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

21
GESOP NC Report
6 6
5 5
Efecto de Diseño

Efecto de Diseño
4 4
3 3
2 2
1 1
0 0
-200 -150 -100 -50 0 -250 -200 -150 -100 -50 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

Metroscopía Simple Lógica


6 8
5
Efecto de Diseño

Efecto de Diseño

6
4
3 4
2
2
1
0 0
-200 -150 -100 -50 0 -250 -200 -150 -100 -50 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

GAD3 40dB
12 8
10
Efecto de Diseño

Efecto de Diseño

6
8
6 4
4
2
2
0 0
-200 -150 -100 -50 0 -40 -30 -20 -10 0
Días hasta el escrutinio electoral Días hasta el escrutinio electoral

22
Celeste-Tel CIS
20 80
Efecto de Diseño

Efecto de Diseño
15 60

10 40

5 20

0 0
-250 -200 -150 -100 -50 0 -200 -150 -100 -50 0
Días hasta el escrutinio Electoral Días hasta el escrutinio electoral

Conclusión

Comparando la información de las encuestas preelectorales entre sí, es posible encontrar un modelo parsimonioso que
describe cómo va evolucionando la intención de voto en las semanas previas al escrutinio electoral. El modelo ajusta
adecuadamente a la mayoría de las encuestas publicadas, pero también muestra que los efectos de diseño de ellas son
muy dispares.

Sobre este modelo son más influyentes los resultados de las encuestas con bajo efecto de diseño que aquellas con alto
efecto.

A partir de dicho modelo se puede predecir el resultado esperado del escrutinio y comprobar que existen discrepancias
notables entre lo que cabría esperar y lo que finalmente salió del escrutinio electoral, que muestra como 5 de las 6
proporciones de voto por los 5 primeros partidos y el conjunto del resto, están sujetas a un sesgo.

En la práctica esto significa que hay que optar entre dos hipótesis:

• que las encuestas electorales no son insesgadas y por lo tanto el modelo obtenido es inadecuado pues el sesgo que
tuvieran está entremezclado con la intención de voto real expresada, o bien,
• el escrutinio publicado tiene un sesgo imprevisto que habría que explicar.

A raíz de la inadecuación del modelo basado en el escrutinio (EICE1) que habían logrado usar con éxito Ramos y Verón
(2022a y b) en sendas contiendas electorales en Argentina (2003), las últimas evidencias de fraude y cambio de votos sobre
las elecciones americanas del 3/11/2020, las de Venezuela desde que la izquierda radical está en el poder, de la misma
España donde en la Plataforma Elecciones Transparentes y otras organizaciones vienen hallando evidencias de fraude,
parece más creíble que la hipótesis de que hay un sesgo del escrutinio electoral. El método EICE2, acá presentado, es capaz
de hallar evidencias de este sesgo.

Bibliografía

Abascal, Santiago (2019). https://www.abc.es/elecciones/elecciones-generales/abci-partido-sido-mas-perjudicado-sistema-


dhondt-elecciones-generales-2019-201905040150_noticia.html

Afroz, Farzana y Shabuz, Zillur Rahman (2020). Comparison between two multinomial overdispersion models through
simulation. Dhaka Univ. J. Sci. 68 (1): 45-48.

Cochran, W. G. (1977). Sampling Techniques, 3rd Edition. New York. John Wiley.

23
Kish, L. (1972). Muestreo de Encuestas. México. Trillas. Pág. 739.

Ramos, Guillermo E. y Verón, Mirta M. (2003). EVALUACIÓN INDIRECTA DE LA CALIDAD DE LAS ENCUESTAS DE OPINIÓN
ELECTORALES. Actas del XXXI Coloquio Argentino de Estadística. San Juan, September 2003, Provincia de San Juan,
Argentina.

Ramos, Guillermo E. y Verón, Mirta M. (2005). EVALUACIÓN INDIRECTA DE LA CALIDAD DE LAS ENCUESTAS DE OPINIÓN
ELECTORALES EN LAS ELECCIONES PARA JEFE DE GOBIERNO DE LA CIUDAD DE BUENOS AIRES ENTRE AGOSTO Y SETIEMBRE
2003. Conference: Primer Congreso Argentino de Investigaciones de Marketing y Opinión At: Buenos Aires, Abril 2005.

Ramos, Guillermo E. y Verón, Mirta M. (2022a). EVALUACIÓN INDIRECTA DE LA CALIDAD DE LAS ENCUESTAS DE OPINIÓN
ELECTORALES. Statistical Reports 43, 1-10.

Ramos, Guillermo E. y Verón, Mirta M. (2022b). EVALUACIÓN INDIRECTA DE LA CALIDAD DE LAS ENCUESTAS DE OPINIÓN
ELECTORALES EN LAS ELECCIONES PARA JEFE DE GOBIERNO DE LA CIUDAD DE BUENOS AIRES ENTRE AGOSTO Y SETIEMBRE
2003. Statistical Reports 44, 1-14.

SAS (2012). SAS/STAT 9.22 User's Guide.

Xu, Jun and Long, J. Scott (2005). "Using the Delta method to construct confidence intervals for predicted probabilities,
rates, and discrete changes". The paper provides technical details on the methods described in Jun Xu and J. Scott Long
“Confidence Intervals for Predicted Outcomes in Regression Models for Categorical Outcomes”. The Stata Journal 5 (4):
537-559.

24

View publication stats

También podría gustarte