Estadística pre- y post-electoral

Os recomiendo leer el siguiente artículo publicado por El País: ¿Por qué fallaron las encuestas?

He escogido este artículo porque comenta algo que os puede ocurrir en el futuro cuando vuestro medio de comunicación (de trabajo y de expresión) encargue una encuesta sobre resultados electorales. Se comentan las posibles causas del fallo de las encuestas pre-electorales previas a las elecciones autonómicas de Andalucía.

La principal deficiencia, desde el punto de vista de un estadístico, es que este artículo (y muchos a los que enlaza) no reporta el tamaño de la muestra de las encuestas a las que hace referencia.

La siguiente tabla, extraída del artículo arriba citado, es el resumen de la información que luego desglosa.

Sondeos Electorales en Andalucia, 2012.

A estas alturas del curso, podríamos responder correctamente la siguiente pregunta: ¿Cuál es la probabilidad de que nueve sondeos electorales fallen?

Antes de responder, tendríamos que hacer algunos supuestos: (i) los resultados de los sondeos son independientes; (ii) la probabilidad de acertar es la misma para todos; y finalmente, (iii) la probabilidad es igual al nivel de confianza utilizado en las encuestas, usualmente 0,975.

Con estos supuestos, podríamos pensar que tenemos una variable binomial con n = 9 y p = 0,975. Por tanto, la probabilidad de no tener ningún acierto es 0,0000000000000038147.

En fin, este resultado merecía el artículo de El País y varios más …

Anuncios

6 pensamientos en “Estadística pre- y post-electoral

  1. También hay que tener en cuenta el hecho de que periódicos como ‘EL PAÍS’ publicaran titulares en los que se mencionaba la “clara victoria del PP”, con recuentos preelectorales.
    Esta, probablemente, fue una de las causas para que los votantes del PP se “relajaran” y decidieran no votar. De hecho, según los datos, sólo votó un 61,67% de los andaluces, un descenso con respecto a 2008, cuyo porcentaje fue del 72,67%.

    • Una observación muy interesante y que nos lleva a una regla universal: “Desconfiad de los supuestos”.
      Entre los supuestos que utilicé para llegar al modelo binomial estaba (i) los resultados de los sondeos son independientes.
      ¿Podemos considerar que la publicación de los resultados de un sondeo no influye en el electorado? ¿Y en la estrategia electoral de los partidos? Supongo que, al menos, la respuesta a la segunda de estas preguntas es afirmativa.
      Otra vez, he hecho un supuesto pero a éste le tengo mucha confianza.

      • Tal vez se podría ver el porcentaje de votantes andaluces que hubo en las elecciones generales de 2011 (70,68%), que serían casi 6 millones del total de andaluces, de los cuales el 45,57 votó al PP (casi 2 millones) y el 36,57 al PSOE (millón y medio), y después comparar estos datos con los de las elecciones autonómicas:
        votó el 67,61% (poco más de 5 millones), de los cuales un 40% votó al PP
        (1.567.207) y un 39% al PSOE (1.523.465).
        Si lo comparamos, vemos que la diferencia entre el número de votos al PP y PSOE, en las generales, es de casi 500.000 votos más que en las autonómicas. Y que la diferencia entre el número de votantes (totales, contando los votos a otros partidos),entre las elecciones generales y las autonómicas, es de aprox. 700.000.
        Con lo cual, podríamos pensar que de esa diferencia de 500.000 votos pertenece a los 700.000 que no votaron, y el resto a votos que se desviaron a otros partidos.

  2. En este problema tenemos dos variables (por eso es binomial): fallar y acertar. Son resultados independientes, puesto que si se acierta, no se falla.
    Según los datos, la probabilidad de que se acierte es de 0,975. Mientras, la probabilidad de que se falle es de 0,025. (0,025 nos resulta de restar 0,975 a la unidad, es decir, de hallar el contrario)

    Ya que nos preguntamos por la probabilidad de que todos los sondeos fallen, utilizamos el modelo Bernoulli, según el cual la probabilidad (de obtener 9 fallos) se calcula multiplicando la combinación de 9 elementos sobre un conjunto de 9 elementos, por la probabilidad de que se acierte elevado a la novena, por la probabilidad de que se falle elevado a la cero.

    Como hemos estudiado, un número (sea el que sea) elevado a cero, da uno; y cualquier combinación de un número sobre el mismo número, da cero. Así que tenemos la siquiente situación: 1* (0,025^9) *1.
    0,025^9=3,814697266*10^-15.
    La probabilidad de que los 9 sondeos fallen es de 3,814697266*10^-15.

    • Voy a matizar tu comentario para corregir algunos pequeños defectos y así aprehendemos todos:
      (1) Donde dice “En este problema tenemos dos variables: fallar y acertar” debe decir “En este problema tenemos dos posibles resultados; fallar y acertar”.
      Es importante diferenciar entre una variable y los valores que puede tomar. Por eso, tiene sentido preguntarse cuál es la probabilidad de que X=x. X es la variable y x es un valor que puede tomar esa variable.
      (2) Donde dice “Son resultados independientes, puesto que si se acierta, no se falla.” debe decir “Son resultados incompatibles, puesto que si se acierta, no se falla.”
      Independiente e incompatible no son los mismos conceptos. Incompatible se refiere a que dos resultados no pueden darse simultáneamente mientras que Independiente se refiere a que observar un resultado no cambia la probabilidad de ocurrencia del otro resultado.
      (3) Finalmente, una errata, donde dice “y cualquier combinación de un número sobre el mismo número, da cero.” debe decir “…, da uno” como bien sustituyes en tus cálculos.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s