Por no esperar las nuevas elecciones de España, me he lanzado con los caucus de Iowa de mañana. La verdad, podía esperar a ver los resultados y tener al menos una referencia, pero quería comprobar hasta donde se puede fiar uno de Google Trends.
Voy por partes.
1.- Lo primero fue fácil. Me he ido a la lista de candidatos de wikipedia, y he ido comprobando uno por uno cuáles eran los que tenían más búsquedas con la fórmula candidato iowa. El resultado fue una sorpresa, sólo cinco daban búsquedas: Ted Cruz, Ben Carson, Jeb Bush, Marco Rubio y Donald Trump.
2.- El siguiente paso fue comprobar los resultados con el nombre y el apellido. El único que era buscado de modo indistinto con ambos era Jeb Bush. Esto me complicaba bastante, pues no sabía si tenía que sumar las búsquedas o quedarme solo con la más popular. Al final, como jeb iowa no da búsquedas en algunos casos, me quedé sólo con los resultados de bush.
3.- Supongo -ya veremos si es mucho suponer-, que iowa me restringe las búsquedas al estado. Funcionó más o menos con Andalucía en las autonómicas de 2015. Veremos si aquí también.
Para comprobar que los resultados de iowa eran independientes de los nacionales, hice dos conjuntos de búsquedas: el de candidato iowa, y otro con candidato polls. Hice búsquedas para 7, 30, 90 días y 12 meses.
Para comprobar que los resultados de iowa eran independientes de los nacionales, hice dos conjuntos de búsquedas: el de candidato iowa, y otro con candidato polls. Hice búsquedas para 7, 30, 90 días y 12 meses.
4.- El principal problema era que la popularidad de Trump me desbarataba los resultados. Con el 70 % o más de las búsquedas totales, los resultados de búsquedas relativas de los otros candidatos se aproximaban a cero y las correlaciones se iban a pique. Al final, con los datos de 12 meses, comparando las búsquedas de trump poll y trump iowa, opté por darle a Trump lo que ganaba la tendencia de sus valores mínimos de búsquedas, un 20%. Veremos si es o no una buena decisión.
5.- Fijado Trump, que era el gran problema, a los demás les asigné una estimación de voto proporcional a las búsquedas. Sin mayores complicaciones.
Como resultado final, la media de las últimas tres semanas:
Bueno, estos porcentajes son dándole 100% a los cinco candidatos. Así que mi apuesta viene a ser:
Y ahora, (mañana del sábado) los demócratas
Cruz-Carson-Bush-Rubio-Trump: 5-1-1-1-2
(Y los demás no llegan a 1)Y ahora, (mañana del sábado) los demócratas
Éstos son bastante más sencillos.
1.- Hay tres candidatos: Hillary Clinton, Martin O'Malley y Bernie Sanders. Pero O'Malley, aparte de que Google Trends no me deja poner el apóstrofe, no me da resultados. Probé con omalley y malley, pero nada. Así que la cosa se queda en un combate Clinton vs. Sanders.
2.- Y los nombres. sanders y bernie funcionan casi a la par tanto en búsquedas con polls como con iowa.
clinton y hillary funcionaban casi a la par con polls, pero sobre una base de 9:1 para clinton en las búsquedas con iowa. hay una ciudad Clinton en el estado de Iowa. O también puede ser que los iowanos se refiriesen a Hillary como Clinton antes de la campaña.
De cualquier modo, para evitar conflictos, comparo hillary con bernie y asunto resuelto.
3.- Pues así queda para un año:
Y así para la última semana:
Hillary va perdiendo en búsquedas en Iowa como en todo el país. Y va peor en Iowa que el conjunto de los EEUU. Ya veremos como se traduce eso en votos. Por el momento, ya que estamos en el país de la democracia voy a suponer que una búsqueda un voto.
Uso las medias de los últimos siete días, que son congruentes con las de las últimas semanas, sin dar demasiado importancia a la aparente remontada de las últimas horas.
4.- Conclusión: Bernie Sanders gana a Hillary Clinton 2:1.
03/02/2016. RESULTADOS
Bueno, ganó Ted Cruz y acerté dándole a Trump su tendencia en mínimos, aunque le raspé demasiado (sacó 4,3% puntos más). También acerté con el tercero y el cuarto, aunque cambiados, y me colé del todo con Jeb Bush (sacó un birrioso 2,8%) superado por Paul Rand (4,5%) Pero sobre todo fallé por un buen trecho con las proporciones 5:1 entre Cruz y Rubio, que quedaron más cerca del 1:1.
Y creo que, en buena parte, ésta es la causa:
Me falla la circunscripción de las búsquedas al estado. Iowa tiene unos 2,3 millones de habitantes , California tiene 39 millones, los EEUU 320 M. Incluso si los californianos buscan bush iowa con una frecuencia diez veces menor que los iowanos, harán casi el doble de búsquedas totales. Pero es que en los últimos siete días al menos, hicieron más búsquedas relativas, condicionando por completo los resultados.
Es lo que pasa también con Cruz, que tiene muchas búsquedas en Texas y Nueva York. Nueva York tiene 19,3 M de habitantes, Texas tiene 27,5 M y allí es gobernador Cruz. Incluso con un interés relativo menor que el Iowa -o ahora New Hampshire, que tiene solo 1,3 M- las búsquedas totales del resto del país encubrirán los resultados locales de estos pequeños estados. Y no tengo manera de evitarlo. Es como intentar hacer predicciones en España por provincias. Con Andalucía funcionó -un poco-, pero es que Andalucía tiene 8 M de los 48 M de habitantes de España, y las eleciones eran sólo andaluzas, no implicaban demasiado al resto del país.
Pero lo peor es que, por el momento, las búsquedas de hampshire candidato no son suficientes para generar datos, salvo para Trump en la serie anual (datos semanales) y Trump y Cruz a 90 días Así que, por el momento, no tengo manera de hacer predicciones parciales. Ni siquiera malas predicciones.
Un fastidio.
05/02/2016. UF!! VUELTA A EMPEZAR. GOOGLE SÍ DA DATOS LOCALES.
Supongo que así es como se sentirse un lagarto al dejar atrás su cola para escapar. Bien, pero...
En fín! Estaba medio perdido buscando un modo de aproximar unos datos locales de búsquedas a los resultados de Iowa con vistas a New Hampshire cuando, ¡resulta que Google Trends SÍ da datos locales! ¡Solo hay que pinchar en el mapa!:
La sensación de haber estado haciendo el idiota durante todo este tiempo me dejó como cuando intentas atravesar una puerta de cristal. ¿Cómo no la vi? ¿Es que soy una puta mosca? Eso parece...
En fin... lo superaré, pero duele.
Lo bueno es que ya tengo los datos y... ¡funcionan! Con datos semanales desde el 01/01/2015, sólo hice dos correciiones de partida:
1.-Resté a las búsquedas semanales de cada candidato la media de búsquedas en el primer semestre de 2015.
Es decir, hice con todos lo que hice con Trump en la primera intentona: cuento como votos el incremento de búsquedas desde junio de 2015, que es cuando comenzaron a apuntarse los candidatos (salvo Sanders, que lo hizo antes).
Esto es posible y razonable -creo- por que son candidatos del mismo partido y no hay para ellos voto cautivo o fiel, como puede pasar al enfrentar partidos distintos (hay mucha gente que votaría al otro candidato si fuera de su partido, y todavía más aún gente vota a su partido independientemente del candidato). Entiendo que en primarias cada cual elige según sus preferencias, sin más (amor verdadero).
2.- Suavicé las búsquedas de Trump a los valores mínimos de 5 semanas.
El resultado medio (descontados los votos de los otros candidatos) para las dos últimas semanas es éste :
¿Impresionante, no? El que más se desvía es Carson, pero si es cierto que la jugarreta de Cruz que denunció Trump tuvo sus efectos, podría explicarlo.
Y estas son las tendencias que han derivado en estos resultados. La pérdida de Trump ha sido en realidad relativa, a medida que despertaban los demás candidatos. Muy interesante.
¿Seguirá perdiendo votos Trump ahora que han comenzado las votaciones, o se estabilizará?
06/02/2016 Hillary y Bernie.
Esto no lo arreglo ni con datos locales. La diferencia (2:1) en favor de Bernie Sanders se mantiene en Iowa compare Clinton con Sanders, Bernie con Hillary o incluso Bernie Sanders con Hillary Clinton.
Pero Clinton y Sanders se repartieron los votos de Iowa casi a pachas, con una mínima diferencia de 0,3 puntos para Cliton (Hillary Clinton, 49,8: Bernie Sanders, 49,6).
Ni idea qué hacer.
No hay comentarios:
Publicar un comentario