domingo, 15 de marzo de 2020

175. Covid19 y la curva logística. Solución menos mala.


Intentaré ser breve.

Pese a lo que se insiste por ahí, la curva que define la epidemia NO es exponencial (nos mataría a todos en unos días) sino logística, que es la curva que define muchos procesos y ciclos de producción, puede que el más conocido, sí, el del petróleo. Para modelizar éste fue usada por el geofísico M. King Hubbert y como tal es el fundamento del famoso peak oil, tal mal interpretado

Al asunto. 

Lo 1º y más importante, es que hay multitud de posibles soluciones, dependiendo de estos dos parámetros (y el error que queramos asumir en el ajuste). 
  1. número final de infectados (precisamente lo que queremos saber), 
  2. o bien el día en que la curva alcanza su máximo, un dato que lógicamente está relacionado con el anterior y que ya nos gustaría también conocer. 
Básicamente, necesitaríamos fijar uno de estos dos datos, y lo mejor que podemos hacer es:

-> -> Calcular las soluciones más próximas, es decir, aquella que ajusta la curva con el menor número de infectados; es decir, las soluciones menos malas. 

Ajuste cercano. (Soluciones menos malas).

Lo dicho. Busco la solución para el menor número de infectados, es decir, la solución más cercana con un ajuste decente. Hay un rango de posibilidades aceptables (con los fenómenos naturales/complejos nunca hay que esperar un ajuste fetén) siguiendo la tendencia de infección que llevamos (por cierto, los datos de infectados de datadista). Pero nos sirve de orientación sobre lo que debemos esperar:


He puesto 3 curvas posibles. 
  1. La de 30.000 infectados ya va justísima; así que creo que superaremos esos 30.000 infectados totales en cualquier caso.
  2. Las de 50.000 (A y B) se ajustan de forma aceptable, bien promediando el extraño escalón inicial de la curva de datos (¿un pico/brote inicial? ¿malos datos?), bien ajustando fino a los últimos días de subida acelerada. 

-> -> 50.000 infectados como número redondo es un escenario posible con un ajuste bastante aceptable. Los muertos totales, considerando que se mantiene la tasa de mortalidad de 2,5% (bastante estable hasta el momento), serían 1.150.

Lo más interesante es que en cualquier caso el máximo de infectados (5.530) lo alcanzaremos los días 19-20 de marzo, es decir, de hoy (domingo 15) en cuatro-cinco días y justo a los 5-6 días del inicio (el sábado 14), que es el periodo mínimo de contagio por  asintomáticos, así que va a haber coincidencia y mucha discusión sobre qué causó el fin del brote.  

Para discriminar -< El efecto de la cuarentena a partir de esos 5-6 días debería reflejarse como un truncamiento de la curva (si creciente), o una asimetría (más rápido el descenso de contagios de lo que fue el ascenso) si decreciente. Veremos. 

-----

Añadido 16/03/2020


Hoy me he puesto a revisar los datos para intentar completar y afinar la parte inicial de la curva, clave para lograr el mejor ajuste. Hoy también tengo los datos oficiales de ayer, que fueron 7753 contagiados y no 8000, como adelantaban algunas noticias.

Así que rehago el ajuste de ayer completando los datos con estos de datadista, y completando con estos de 20minutos donde datadista no me ofrece datos. El 26/32 y 29/3 los interpolo. Hoy solo tengo resultados parciales, de mediodía (actualización 46 del ministerio de Sanidad) que informa de 1438 nuevos casos. Así que, dependiendo de lo que pase hoy, 

Si terminamos el día de hoy con +2700 nuevos casos:



Estamos en la curva de 30.000 casos totales.
El máximo de casos será el miércoles 18 con +3.360 nuevos casos. A partir de ahí, los nuevos casos descenderán. 

Si terminamos el día de hoy con +3100 nuevos casos:

Estamos en la curva de 50.000 casos totales.
El máximo de casos será entre el jueves 19 y viernes 20 con +5.530 nuevos casos cada día. A partir de ahí, los nuevos casos descenderán.


(Por supuesto, entre estas dos soluciones, cualquier intermedia es posible)

Y una cosa más: 

Dada la configuración de la curva logística, incluso si estos escenarios fueran muy optimistas y al final tuviéramos. por ejemplo... 100.000 contagiados, el máximo apenas se retrasaría un día o dos. Con 100.000 contagiados totales (al menos 2.500 muertos mínimo, seguramente más por la saturación de hospitales), el máximo de nuevos casos se alcanzarían los días 20 y 21 de marzo).


Añadido el 17/3/2020

Bueno, pues más que aclararse la cosa se enturbia.

Parece que están retrasando el valor de los datos y puede que hayan cambiado también su significado.  El resultado son cosas raras. Ahí lo tenéis: arriba nuevos infectados por día y ajuste logístico para 30.000 y 50.000 infectados; abajo, muertos y ajuste para un 2,5% de víctimas mortales (30.000->750 muertos; 50.000 ->1250 muertos).


varias cosas:

1.- Se suponía (o supuse) que los datos diarios del GitHub de datadista eran de la fecha, pero los +1438 (9191 total) de ayer día 16 (actualización 46 del Ministerio de Sanidad) eran datos a la 1 de la tarde, y los que el ministerio da hoy (a la 1 de la tarde (actualización 47)  corresponden a ayer día 16 a las 21 horas, ni siquiera el día completo.. Así que ya no sé... Este desajuste podría ser la razón (o una de ellas) por la que la tendencia quiebra. (trataré de asegurarme de cómo van realmente los datos).

2.- Compruebo con los muertos, y la cosa está peor aún. No es normal esas diferencias en muertos diarios. Hay un problema con los datos, y así no es posible ajustar la curva. De cualquier modo, ateniéndonos a la mortalidad de 2,5, el número de infectados reales debería estar más cerca de 50.000 (incluso superarlos) que de los 30.000.

3.- Para terminar, pasa una cosa muy curiosa con las curvas de infectados muertos: parecen isócronas, es decir, que por el momento no parece haber desfase entre ellas. Podría ser un efecto al estar ambas en la fase creciente. Se verá el desfase sin dudas en los picos.

Añadido B.

Pues todavía no he avanzado nada con los datos de España, pero me he puesto a hacer comparativas con China e Italia; aquí va:

Con 80.000 infectados (nuevos casos detectados; el pico medido es por test masivos), China habría tenido su pico de infectados el 14/15 de febrero.
En Italia, el registro de infectados lo ajusto a una curva mínima de 50.000 infectados, con su pico entre el 15/16 de marzo. Si es así, deberíamos ver que los nuevos casos disminuyen cada día.
Y para terminar (y todo junto en un cuadro para resumir), los infectados con los muertos:
3200 en China con su pico entre el 14/15 de febrero (+6 días después del pico de infecciones)
y
5000 muertos (estimados) en Italia con su pico el 18 de marzo (apenas +3 días después del pico de infectados!! -> ¿diagnósticos más tardíos; explicaría eso el mayor número relativo de muertes 10%?).

En rojo añado dos posibles escenarios de muertes en España: los 1250 que nos daría una mortalidad del 2,5% para 50.000 infectados o los 3000 de una población de con una mortalidad del 10%, como en Italia). El pico de muertes sería el 22/23 de febrero y (como en Italia)  3 días después del pico de nuevos casos, que sería entre el 19/20.

Quedan 6 y 3 días para uno y otro, una eternidad...

Añadido 18/03/2020

Ya solo añado los gráficos de Irán y las previsiones..



Añadido 19/03/2020

Con los datos de ayer 18, Italia parece que se dispara  (muy mala noticia). Mañana estará claro si ayer ha sido un mal día o el ajuste se quedó corto..

Y no tan mal pero también con dudas, Irán..

A medio día los datos de España.. cruzando dedos..

Pues ya. Es evidente el cambio de criterio en la contabilidad de nuevos casos entre el 15 y el 16, y que vamos, según el criterio inicial, hacia los 50.000 casos (de largo...)
Las muertes siguen mostrando muchísima variabilidad diaria. ¿Artefacto en la toma de datos o crisis sanitarias en los hospitales?

No hay comentarios:

Publicar un comentario