El reporte diario de defunciones por COVID-19: interpretaciones, riesgos y limitaciones

Una parte crucial en la evolución que ha tenido la epidemia en México es el número de personas que han fallecido a causa del virus. Solo para poner en contexto el impacto que está teniendo el COVID, en México tenemos cerca de 100 víctimas de homicidio doloso o de feminicidio cada día, mientras que mueren unas 400 personas diarias a causa del virus (y ese número va en aumento) y en días pasados se han reportado ya más de 500 muertes (y hasta más de mil) en un solo día. Pero esa palabra “reportado” es precisamente uno de los factores que más han causado controversia (y confusión) respecto a las cifras del COVID: que haya 500 muertes reportadas en un día, no significa que ese día (o el anterior) hayan fallecido esas 500 personas, sino que reflejan un retraso en el sistema de reportes de hasta dos meses entre que la persona fallece y es reportada su muerte. Y aunque hay muchas explicaciones, y se defendió que esas 500 o mil muertes corresponden a días anteriores, lo cierto es que las cifras son confusas y al menos, lo que se reporta desde el gobierno, es que no hemos tenido un día con tantas defunciones. 

Pero, ¿cómo sabemos si el número de fallecidos que se reportan el 31 de mayo, por ejemplo, no pasarán de los 200 que tenemos al día de hoy, a 400 y luego a 600 y tal vez un número aún más grande conforme pasa el tiempo y los reportes se van incorporando? Solo lo sabremos en unas cinco o seis semanas, y para ese entonces, el número exacto de defunciones del 31 de mayo será un dato un tanto irrelevante, pues estaremos ya con datos de junio y julio. ¿Han muerto hasta el día de hoy más de 500 personas en un solo día en México por COVID19? Desafortunadamente, la respuesta es sí.

Modelando el retraso de los datos

Una de las herramientas más poderosas que tenemos para entender un fenómeno como el COVID-19 y su transmisión por nuestro país, son las matemáticas. En un mundo ideal, donde los datos son perfectos, las matemáticas nos ayudan a modelar la difusión, la velocidad de contagio e incluso el impacto de ciertas políticas. Pero, en un mundo como el nuestro, donde los datos son siempre problemáticos y tienen huecos y retrasos, las matemáticas nos ayudan a modelar esos huecos y retrasos y entender cómo afectan el flujo de la información con la que contamos. En el caso de COVID, el modelo SIR (que tiene su nombre por las siglas Susceptible, Infectado y Recuperado) se ha utilizado con mucha frecuencia para entender la propagación del virus, el impacto del modelo Centinela que aplicamos en México o para medir el sesgo de las pruebas que se hacen en nuestros laboratorios. Con un modelo SIR es posible simular la propagación del virus, las personas que desafortunadamente perderán la vida, y aquí veremos el impacto del retraso en el registro del número de personas fallecidas.

Para modelar el retraso de los datos que tenemos sobre personas fallecidas, supongamos que el virus se propaga como un modelo SIR, y que un porcentaje pequeño de las personas que son infectadas, fallecen. Supongamos también que una defunción es reportada el día en el que sucede con cierta probabilidad, y en caso de no ser reportada ese día, es reportada al día siguiente con esa misma probabilidad, y así sucesivamente hasta que el deceso es eventualmente reportado. Si, por ejemplo, la probabilidad de que un deceso se reporte en un día es de 0.1, entonces la probabilidad de que no se reporte ese día es 0.9, y la probabilidad de que no se reporte durante dos días es 0.81 y la probabilidad de que no se reporte en la primera semana es 0.48. Ese modelo se conoce como una distribución geométrica (y, si en lugar de contar el número de defunciones de cada día, nos fijamos en el momento exacto en el que el fallecimiento es reportado, le llamaríamos una distribución exponencial aunque la dinámica es la misma).

Imaginemos entonces un escenario en el cual los decesos se reportan con una probabilidad muy alta el día en el que ocurren, o al día siguiente, o dos días después (un retraso muy bajo) y todo el espectro que puede haber entre ese escenario y uno en el cual los fallecimientos se reporten con una probabilidad muy baja el día en el que suceden (un retraso muy alto). Todas las muertes eventualmente se reportarán, pero lo que nos preocupa aquí es ¿cuándo? Y los resultados de simular esos fallecimientos pueden ser muy reveladores (Figura 1), pues nos muestran la enorme distancia que puede haber entre las personas que pierden la vida y los reportes diarios de decesos.

Figura 1 – Simulación de los contagios de coronavirus en una ciudad de un millón de habitantes, la epidemia crece 10% cada día y las personas se recuperan (90%) o fallecen (10%) 30 días después. La primera parte de la figura muestra durante los primeros 250 días de la epidemia, el número de personas susceptibles al virus, el número de personas contagiadas y el número de personas recuperadas o que fallecen. En la parte del centro se muestra el número acumulado de fallecimientos y sus reportes, ya sea en un escenario con retraso muy bajo (y por ello, el número acumulado de personas fallecidas es muy similar al número que se reporta) y hasta un escenario con mucho retraso (y la curva acumulada de personas fallecidas es muy lejana al número que se reporta). En la parte de abajo se muestra el número diario de personas que se reportan como fallecidas, según el retraso de esos reportes, y el número de personas que perdieron la vida ese día.

Si bien es cierto que es solo un modelo, las condiciones pueden cambiar y puede haber mucho “ruido” en las observaciones, notemos uno de los factores más terribles: el reporte diario de defunciones nunca llega a ser tan alto como las personas que en realidad fallecen, incluso en un escenario con muy poco retraso (es decir, en la parte de abajo de la Figura 1, el punto máximo de la curva oscura es más alto que el punto más alto de lo que se reporta, y es mucho más alto si el sistema tiene mucho retraso). El día más negro de la pandemia no será tan negro en los reportes.

¿Se puede comparar entre países?

Es normal querer comparar entre países y checar si una región tiene más fallecimientos que otra, o si la velocidad a la que crecen los decesos es más acelerada en uno u otro lugar. Desafortunadamente, el retraso que se observa entre que una persona fallece y es reportada también tiene un severo impacto y hace que entre países no sea posible comparar el número de personas fallecidas. Por ejemplo, una gráfica que se utiliza frecuentemente es el reporte del número acumulado de fallecimientos de cada día (usualmente a partir de que se alcanzó una cierta cantidad de decesos) y como los números crecen rápidamente, el eje vertical es usualmente en escala logarítmica. Usualmente se agregan algunas referencias, como el escenario que se observaría si los fallecimientos se duplican cada cierta cantidad de días (y aquí, como el eje vertical está en escala logarítmica, las referencias forman líneas rectas). Desafortunadamente, ese tipo de gráficas y esas comparaciones pueden ser solo el reflejo del retraso y no de las personas que en realidad fallecen en ese lugar (Figura 2). Es imposible comparar el número de casos entre países (pues en México aplicamos el modelo Centinela) y es imposible también comparar el número acumulado de fallecimientos o el número diario de fallecimientos si no se toma en cuenta que en algunos países los reportes tienen un retraso pequeño o insignificante, mientras que, en otros países, la curva es solo reflejo de un sistema muy lento de reportes. Comparar además qué tan rápido se duplican los fallecidos puede también ser un reflejo del retraso en el sistema.

Figura 2 – Número acumulado de fallecimientos desde que se reportan 100 fallecimientos según distintos niveles de retraso en los reportes de ese país. Las tres líneas negras representan el escenario en el que el número de personas fallecidas se duplica cada 5, 10 o 20 días. En un sistema con retraso muy alto, la curva parece “aplanarse” rápidamente, mientras que, en el sistema con retraso muy bajo, la curva parece ser muy acelerada y ese fenómeno es solo reflejo de la velocidad en la que se reportan los fallecimientos y no de una reducción en las muertes de ese lugar. Además, mientras el sistema sea más lento e ineficiente, la curva parece ser más plana y duplicar el número de fallecimientos en intervalos de tiempo más largos, pero el número de personas que pierden la vida (la curva oscura en la parte superior) es la misma en los cinco escenarios.

¿El reporte diario de defunciones por COVID nos informa algo?

Diariamente fallecen personas por COVID19 y se agregan a la larga lista de defunciones por reportar. Esa lista crecerá cada día más rápido que el anterior hasta que lleguemos al punto máximo de defunciones y, a partir de ahí, la lista se irá haciendo más corta conforme pasen los días y los fallecimientos se vayan reportando. Es por ello que podemos inferir que cuando observemos un punto de inflexión en el reporte diario de fallecimientos (es decir, el momento en el que la curva en lugar de crecer cada vez más rápido, sigue creciendo, pero de manera menos acelerada), es que estamos atravesando los días con el mayor número de muertes (Figura 3). Sin importar si tenemos mucho retraso o poco retraso, el punto de inflexión en el reporte diario nos ayudará a detectar los días más tristes y complicados de esta pandemia. 

La lista de personas que fallecieron y que, por el retraso en el sistema no se han reportado, aumenta conforme avanzan los días y seguirá aumentando hasta el momento en el que se reporte la misma cantidad de personas que las que fallecieron ese día (y entonces ese día, la lista ni crece ni decrece) y a ese punto se le llama “equilibrio” pues la lista, aunque puede ser larga, mantiene su tamaño entre los nombres que se agregan y los nombres que se reportan y borran. Ese día de “equilibrio” se alcanza cuando la lista es larga pero ya no crece tan rápido (es decir, después del día con el máximo número de fallecimientos, cuando el número de personas que pierden la vida diariamente se reduce) y ese día, la lista de personas por reportar tiene la mayor cantidad de personas, es decir, ese día también será el día que se reporten la mayor cantidad de fallecimientos. A partir de ese día de equilibrio, como se agregan menos nombres de los que se reportan, la lista se encoge lentamente y se reportan menos fallecimientos.

Figura 3 – Número diario de fallecidos y reporte diario de fallecimientos según distintos retrasos en los reportes. En la parte de arriba, mientras el número de fallecimientos sigue aumentando (la parte izquierda de la curva oscura, en la zona sombreada de la figura) las curvas con los reportes diarios crecen y de manera acelerada. Sin embargo, cuando llegamos a los días con el máximo número de fallecidos, las curvas de los reportes pasan por su punto de inflexión (las pequeñas marcas blancas, que representan la transición entre una curva azul que se acelera a una curva amarilla que, aunque puede seguir aumentando, se desacelera). La parte de abajo de la figura muestra, para un nivel de retraso bajo (aunque es el mismo fenómeno para cualquier nivel de retraso) que el número diario de personas fallecidas es mayor al reporte diario (la parte sombreada del diagrama) hasta que el número reportado alcanza su punto máximo (la pequeña marca blanca) y a partir de ese día, se reportan más fallecimientos de los que ocurrieron ese día.

Desafortunadamente hay dos implicaciones que resultan sumamente preocupantes de este modelo. La primera es que el número diario de personas que fallecen por el virus seguirá creciendo hasta que el reporte diario pase por su punto de inflexión. ¿Y en México hemos pasado ya por el punto de inflexión? No. Hoy morirán más personas por el virus de las que fallecieron ayer. La segunda implicación tiene que ver con el reporte diario. El día que se reportaron, por ejemplo, 500 fallecimientos en nuestro país, sabemos que la mayor parte de esas muertes corresponde a días anteriores, y aunque es posible estimar cuántas personas han fallecido hasta ese día, podemos estar seguros de que ese día fallecieron más de 500 personas pues la curva aún no atraviesa ni su punto de inflexión ni su máximo y, hasta ese momento, fallecen diariamente más personas de las que se reportan.

Estos resultados son de un modelo matemático en el cual tuvimos que asumir muchas características (incluyendo el modelo SIR y todo lo que implica) y una velocidad de retraso constante en el reporte de fallecimientos. Es posible que conforme nos enfrentemos a un número aún mayor de fallecimientos, que el sistema tenga aún más retrasos y fricciones (si nos tomaba dos semanas procesar cien fallecimientos, es muy posible que nos tome más de dos semanas procesar mil fallecimientos). Es posible también que se inviertan más recursos para acelerar el flujo de información y con ello, el sistema sea más eficiente y tenga menos retrasos. Por lo pronto y tomando los reportes de fallecimientos y su retraso en México se encuentran en algún escenario entre tener un retraso muy bajo y un retraso bajo (Figura 4). 

Figura 4 – Diferentes niveles de retraso en el número de personas fallecidas y los datos observados en México. El cálculo del retraso muy bajo considera una probabilidad de 0.2 de que el fallecimiento sea reportado en un día, el escenario bajo considera una probabilidad de 0.066 y para comparar los datos observados de México, de la Secretaría de Salud se consideran los reportes de personas fallecidas por fecha de defunción y la diferencia que hubo en ese reporte una semana después. 

La pandemia seguirá cobrando vidas en nuestro país y nosotros seguiremos intentando interpretar los datos que se reportan, intentando compararnos con otros países y detectar si esa curva (que parece estar más acelerada que nunca), alguien realmente la puede interpretar como “plana”. Por lo pronto, sabemos que cuando observemos el punto de inflexión en el reporte diario de fallecimientos, es señal de que estamos atravesando el punto más crítico de la epidemia; además, el número de personas que fallecen diariamente es mayor que el número que se reporta, y seguirá siendo así hasta que reporte alcance su punto máximo. Los datos sobre personas fallecidas no son buenos para comparar entre países y en sistemas más lentos e ineficientes, las curvas de los reportes se ven más planas y “bonitas”, aunque no cambie la realidad sobre la letalidad del virus. En México tenemos un retraso “bajo” de la información aunque ello pueda cambiar conforme el número de muertes aumente. Por lo pronto, y por las miles de familias que están siendo afectadas, deseo que las preparaciones que tuvimos para enfrentar la pandemia y las precauciones que tomamos y la planeación de la reapertura, sean las adecuadas para en realidad aplanar la curva y minimizar el impacto que tiene el virus en nuestro país. 

¡Aquí puedes dejar tus comentarios!

Category: COVID19InternacionalNacionalSalud

Tags:

Texto por: Rafael Prieto Curiel

Soy mexicano y matemático y actualmente soy investigador en la universidad de Oxford y soy investigador externo de la OCDE. Realicé un doctorado en Matemáticas, Crimen, Seguridad y Urbanismo en University College London. Trabajé en el C5 de la CDMX.