miércoles, 13 de julio de 2016

135. Discurso global y Clima global, I. Temperaturas y Ngram

La cuestión es sencilla. La razón hot/cold en los registros Ngram (English) correlaciona de forma apreciable (R2 de 0,51) con las series de temperaturas globales de la U. de Berkeley para el periodo 1800 a 2008. R2 mejora hasta 0,59 cuando se utilizan las temperaturas medias a cinco años.


Sigo en twitter a un estadístico que ha escrito un libro de absurdas y sorprendentes correlaciones temporales, por supuesto, tan significantes como espurias, es decir, aparentes, superficiales, todas ellas in-significativas para la ciencia. Las series de @TylerVigen no suelen muy largas, generalmente de una o dos decenas de años, aunque en ocasiones saca series de cuarenta o cincuenta años, pero siempre plantean relaciones absurdas, descabelladas, como lanzamientos de satélites no militares con doctorados en sociología o la edición de libros de ficción con el número de perritos calientes consumidos per cápita en los EEUU. Son relaciones tan disparatadas que parecen chistes, aunque son reales y presentan excelentes coeficientes de correlación, son estadísticamente robustas.  

Lo que Tyler Vigen hace es apelar a nuestro sentido común, es decir, a nuestro conocimiento apriorístico, para despertar nuestro sentido crítico. Es en muchos sentidos un juego paradójico. Tyler es un estadístico que juega con los datos para recordarnos que la estadística -en realidad, las matemáticas en su conjunto- es una herramienta de análisis, nunca de juicio. El caso es que no hay nada mal hecho o falso en las correlaciones de Tyler, solo lo son las conclusiones que institivamente construimos con las variables. Al ver dos variables juntas en la gráfica y unidas por su común sube y baja temporal, las asociamos y hacemos de ellas una misma cosa, o las relacionamos a una otra cosa-causa. Lo que Tyler hace es ligar dos variables tan extrañas entre sí que su unión despierta en nosotros suficiente sorpresa como para frenar todo automatismo mental e invitarnos a la reflexión. En efecto, estamos ante un truco, pero no es la estadística lo que nos engaña, sino nuestro pensar discursivo. 

Mediante el discurso entendemos que los que se aparecen físicamente próximos, en un mismo tiempo y lugar, como el frio y el color blanco en la nieve, o aquello que muestra un mismo o contrario vaivén, que va seguido, como el Sol y la Luna, deben de estar unidos. De esta forma tendemos a hacer los juicios comunes y a establecer las relaciones mundanas, basadas en las meras coincidencias biográficas o incluso postumas, como la de Shakespeare con Cervantes, emparejados para siempre por el azar histórico de su muerte en 1616 y su común destino de genios literarios del inglés y el español, aunque jamás se conocieran ni supiesen el uno del otro, . 

La lógica discursiva, regida por razones de proximidad y coincidencia (en su más estricto sentido) no es una buena intérprete de la estadística al uso, pero tampoco al revés. Las reglas del lenguaje -que las hay- son normas del común, del hábito, de la costumbre, están construidas por una concatenación de repeticiones significativas y significantes, pero no son reglas estrictas, pues dependen del contexto. Y peor aún, en el discurso, la anomalía y la excepción pueden ser tan significativas y válidas como la regla más general. La razón de esta aparente sinrazón es que el lenguaje con el que nos apropiamos del mundo entero definiéndolo, caracterizándolo, está construido sobre el error, el error de extrapolar lo dicho con lo hecho, el nombrar con el ser, el significante con el significado. Es el error acumulado y normalizando por la costumbre el que engendra las nuevas reglas de un discurso que no es más que un devenir, una permanente reasignación de significados y significantes, una constante resiginificación. Desde la primera palabra hasta el discurso más elaborado, el lenguaje está preñado de relaciones espurias, confusiones, equívocos, extrapolaciones injustificadas, asunciones injustificables, interpolaciones gratuitas, excepciones, de falta de rigor. 

Y sin embargo, la estadística no nos libra del juicio del discurso. ¿Cómo reconocemos que las correlaciones de Tyler son espurias? Pues en la pobre credibilidad de la retórica que construimos a partir de la correlación.

En las propuestas de Tyler, ni siquiera el recurso simple del Deus ex machina de nuestro tiempo, que es la causación económica, funciona. Por ejemplo, pudieramos discurrir que la economía produjese doctorandos y satélites porque crece, o porque se terciariza, o porque demanda conocimiento especializado (sea el que sea) o justificarlo con cualquier otro entimema economicista al uso, pero incluso estos relatos estadístico-económicos resultan endebles, banales, forzados. Y aún sería peor si quisiérmos armar una explicación mediante una serie de concatenaciones causales que, a cortos pasos, nos llevara (por ejemplo) de la sociología como ciencia a la técnica sociológica y de ahí a la tecnología espacial, o por cualquier otro camino. Entonces la retórica sonaría rocambolesca, atrabilaria, aún más increíble. 

Para expresar una verdadera matemática del lenguaje necesitaría una estadística basada en la anomalía y no construida contra el error, una estadística que no localice la verdad en el valor medio sino en toda la distribución y que no condicione la significación al mero tamaño sino al valor relativo, una estadística que considere la relevancia expresiva y significativa del accidente sobre la norma, que admita lo singular como paradigma y ejemplo para el común, lo sobresaliente que hay en el dato único.  

Tras esto ando. 

No hay comentarios:

Publicar un comentario