El berrinche estadístico (7): Las reglas del juego
En otras ocasiones me he mandado con cadenas de posts que orbitan alrededor de un tema. El post que estás leyendo en este momento es el segundo de una de estas cadenas. Se inicia en este enlace, el cual te recomiendo que leas antes de continuar. Pero si te da flojera, aquí te va el resumen: tomando la data de las encuestas y corrigiendo algún supuesto sesgo que podamos encontrar a favor o en contrar de tal o cual partido, jugaremos a predecir el resultado de la siguiente consulta electoral que se nos viene, la de la revocatoria de la alcaldesa.
Antes de proceder repasemos algunas de las reglas de las encuestas.
Primero, cada una de estas encuestas que se sacan es un reflejo de lo que la gente opina en ese momento. Los portavoces de las encuestadoras se han pasado décadas repitiendo esto. No obstante, no es extraño que uno se encuentre por ahí con algún comentarista que pretenda quitarle validez a toda la estructura montada porque no le atinaron al detalle. O porque no predijeron un cambio crucial en la opinión de la gente. O porque cambiaron en su predicción de un mes a otro. Yo no tengo una encuestadora y no trabajo en una -de hecho, nunca lo he hecho- y me estoy basando en la data disponible. Y a los que opinan que las encuestadoras nos están manipulando, les digo que supongo que es posible (aunque lo dudo), pero que en todo caso, nos estarían manipulando de manera predecible. Por eso considero que podemos corregir ese sesgo para obtener una predicción más creíble.
O no. Quién sabe. Yo aquí estoy jugando con los números.
Segundo, es importante que quede claro que se está jugando con una serie de data que se da asumiendo que las conductas se mantienen. Por ejemplo, la intención de voto por Lourdes Flores Nano para las elecciones municipales nunca variaron mucho. Pasaron de 33% a 32% entre mayo 2012 a setiembre 2012, incluso mientras la intención de voto por Susana Villarán se disparaba de 4% a 33% en el mismo periodo. Esto se da porque en el camino hubo lo que en estadística se llama "quiebre estructural": Pasó algo que hizo que la data se relacione distinto. No obstante, aún cuando la intención de voto por Susana se disparaba, la intención de voto por Lourdes y por otros candidatos se mantenía con ligeras modificaciones.
Como en la mayoría de proyecciones, estoy asumiendo que no habrá otro cambio crucial en los próximos meses, como lo fue la salida de la carrera electoral de Kouri. Pero uno nunca sabe cuándo podría pasar algo que haga que todo cambie. Por ejemplo, ¿quién habría podido predecir que Chomsky atracaría salir en una parodia de Gangnam Style? Ni Hari Seldon.
Tercero, está de más decirlo, pero estoy asumiendo que la fecha de la consulta es el 17 de marzo. Lo digo porque la ONPE está pidiendo a gritos que se posponga la fecha, con cada vez más razones sobre la mesa. Por el momento no tengo razones para asumir que les darán esa gracia. No obstante, tengo que aclarar que la cercanía a la consulta es una variable. Así que si mueven la fecha de la consulta, tendré que revisar para atrás las cifras que estaría estimando.
Cuarto, voy a ir levantando la data de a pocos, conforme la vaya consiguiendo. Próximamente un post con lo primero que ya he armado. Con eso ya podríamos ir corriendo apuestas.
(Dibujito de arriba: http://christopherdenise.blogspot.com)