miércoles, 2 de diciembre de 2015

87. Google Trends se anticipa de uno a tres meses a las encuestas medias.

Fue ver el gráfico de evolución de medias de encuestas electoral.com y preguntarme qué tal correlacionarían sus datos con los semanales de búsquedas de los cinco partidos en Google Trends. 



La respuesta (que se las trae) la resumo en este otro gráfico: 

Lo que hice fue correlacionar la serie de datos medios de encuestas publicados por electoral.com, de la semana del 6 de marzo al 27 de noviembre (sin las dos semanas centrales de agosto) con la serie de datos semanales de Google en ese mismo periodo y con las de periodos equivalentes pero adelantados hasta trece semanas y retrasados hasta dos. Como digo, la cosa se las trae.

La gráfica muetra la variación del factor de correlación R2, que señala un desfase de unas cinco semanas entre los resultados de las encuestas promediadas por electoral.com y los registros de Google Trends para Cs y Pod y de unas 11-13 semanas para PP, PSOE ¿e IU? 

En principio, el desfase se explica porque los datos de las encuestas -lógicamente- se toman semanas antes de su publicación, aunque lo que no se entiende muy bien es por qué PP y PSOE presentan un desfase de correlación tan retrasado de ¡tres meses! 

Incluso la serie de medias de resultados electorales de Podemos correlaciona bastante bien con las búsquedas en Google diez y once semanas antes. Es como si los datos de las encuestas reflejaran no ya el periodo en que se toman, sino el de los meses anteriores. Una posibilidad que se me ocurre es que las medias calculadas por electoral.com  sean de todas las encuestas publicadas en los dos meses anteriores, que darían datos de hasta tres meses atrás. Pero en ese caso queda por explicar porqué el desfase con Pod y Cs es de solo 5 semanas. He preguntado a electoral.com y espero respuesta. Veremos.

Sea como sea, lo que salta a la vista es:

1.- Google Trends nos da datos que se anticipan hasta 3 meses a la información que una media de encuestas pueda dar (que básicamente será una tendencia). No me cabe duda de que se acabará imponiendo como un método más de predicción electoral, si no es ya EL método. Empiezan a verse ejemplos (1, 2, 3).

2.- Incluso para interpretar encuestas PP y PSOE son una cosa y Podemos y Cs, otra. 

****
06/12/2015
No tengo la respuesta que esperaba de electoral.com, pero creo que la correlación a tres meses es espúrea. Las corr. espúreas son comunes en series temporales, y he comprobado que sucede algo similar con los Barómetros CIS. El pico de cinco semanas es el correcto, que se epxlica bien por el retraso entre toma de datos y publicación de resultados y el tiempo transcurrido entre las distintas encuestas promediadas. 

No hay comentarios:

Publicar un comentario