Aquest programa informàtic actua com un detectiu mèdic i matemàtic. El seu objectiu principal és respondre a una pregunta aparentment simple però molt complexa: Quan puja la contaminació (específicament el gas NO2 dels cotxes i indústries), hi ha més gent que es posa malalta?
Per entendre aquest codi, no cal saber programar. T'ho explicarem com si estiguéssim preparant una recepta de cuina molt sofisticada.
A la primera part del codi, l'ordinador instal·la i prepara les "llibreries". Imagina que vas a cuinar un pastís molt complex. No fas servir les teves mans nues, oi? Necessites eines: una batedora, un pes, un motlle. A la programació, les "llibreries" (com dplyr o ggplot2) són justament aquestes eines: paquets d'instruccions prefabricades que ajuden a l'ordinador a llegir dades, calcular matemàtiques i dibuixar gràfics sense haver d'inventar la roda cada vegada.
Mai posem els ingredients bruts a l'olla. Les dades del món real estan plenes d'errors i "paranys" que poden enganyar l'ordinador. Aquí fem diverses coses fonamentals en epidemiologia:
Si avui hi ha un pic màxim de contaminació, la gent no cau malalta a l'instant. L'efecte de respirar aire brut s'acumula. Potser l'asma et dona un atac demà o demà passat. El codi calcula el Lag 0-2, que vol dir que no només mira la contaminació d'avui, sinó la mitjana del que hem respirat avui, ahir i abans d'ahir. Això és molt més realista mèdicament.
Ara posem tots els ingredients a cuinar. Creem un model anomenat GAM (Generalized Additive Model). Per què fem servir això i no una matemàtica més senzilla?
A l'escola ens ensenyen a traçar línies rectes per relacionar coses. Però la naturalesa i el cos humà no funcionen en línies rectes. Per exemple, passar de 10ºC a 15ºC potser no fa emmalaltir ningú, però passar de 35ºC a 40ºC provoca cops de calor i morts. L'efecte de la temperatura forma una corba. El model GAM permet a l'ordinador dibuixar aquestes corbes naturals (línies flexibles) per entendre com la temperatura, la humitat i la contaminació afecten la salut de veritat.
Un bon metge també revisa si s'ha equivocat. Aquesta secció deforma un concepte anomenat "residus", que bàsicament és la diferència entre el que l'ordinador va predir que passaria i el que realment va passar. Aquí generem uns gràfics interns per veure si el model és fiable o si està completament perdut.
Després de tants càlculs, volem una resposta senzilla. Això ho fem calculant el Risc Relatiu (RR).
És la mesura més famosa en epidemiologia per saber si una cosa és perillosa. En el nostre codi, mesurem què passa cada vegada que la contaminació puja 10 punts (µg/m³).
Si el RR és 1.00, significa que el risc no canvia. L'aire brut no fa res.
Si el RR és 1.05, vol dir que per cada 10 punts extra de contaminació, el risc que la gent es posi malalta augmenta un 5%.
El codi també calcula l'"Interval de Confiança (IC)", que és el marge d'error del model (ex: estem 95% segurs que el risc augmenta entre un 3% i un 7%).
Finalment, els humans entenem millor els dibuixos que les llistes de números. Aquesta última part crea una gràfica elegant i fàcil de llegir.
La gràfica de Corba Dosi-Resposta ens ensenya justament a partir de quina "dosi" de contaminació (l'eix de sota, l'horitzontal) comença a disparar-se el nombre de malalts (l'eix vertical). Veurem una línia vermella que representa el "risc zero". Si la nostra línia de contaminació blava supera aquesta línia vermella i tira cap amunt, estarem veient, amb els nostres propis ulls, l'efecte tòxic de respirar l'aire contaminat de la ciutat.
En resum: Aquest codi agafa anys de registres de malalts, neteja les trampes del calendari (festius i pandèmies), considera que l'efecte de l'aire triga uns dies a notar-se al cos humà, utilitza matemàtiques avançades (no lineals) per trobar patrons ocults, i finalment ens diu exactament en quin percentatge augmenten les malalties quan puja la contaminació i ens ho dibuixa en una gràfica.