Desxifrant el Codi: Com afecta la contaminació a la nostra salut?

Aquest programa informàtic actua com un detectiu mèdic i matemàtic. El seu objectiu principal és respondre a una pregunta aparentment simple però molt complexa: Quan puja la contaminació (específicament el gas NO2 dels cotxes i indústries), hi ha més gent que es posa malalta?

Per entendre aquest codi, no cal saber programar. T'ho explicarem com si estiguéssim preparant una recepta de cuina molt sofisticada.

1. Preparació i Llibreries (Comprar les eines)

A la primera part del codi, l'ordinador instal·la i prepara les "llibreries". Imagina que vas a cuinar un pastís molt complex. No fas servir les teves mans nues, oi? Necessites eines: una batedora, un pes, un motlle. A la programació, les "llibreries" (com dplyr o ggplot2) són justament aquestes eines: paquets d'instruccions prefabricades que ajuden a l'ordinador a llegir dades, calcular matemàtiques i dibuixar gràfics sense haver d'inventar la roda cada vegada.

2. Neteja de Dades i Variables (Preparar els ingredients)

Mai posem els ingredients bruts a l'olla. Les dades del món real estan plenes d'errors i "paranys" que poden enganyar l'ordinador. Aquí fem diverses coses fonamentals en epidemiologia:

Què és el "Lag" (Mitjana mòbil)?

Si avui hi ha un pic màxim de contaminació, la gent no cau malalta a l'instant. L'efecte de respirar aire brut s'acumula. Potser l'asma et dona un atac demà o demà passat. El codi calcula el Lag 0-2, que vol dir que no només mira la contaminació d'avui, sinó la mitjana del que hem respirat avui, ahir i abans d'ahir. Això és molt més realista mèdicament.

3. El Model GAM (El cervell de l'operació)

Ara posem tots els ingredients a cuinar. Creem un model anomenat GAM (Generalized Additive Model). Per què fem servir això i no una matemàtica més senzilla?

A l'escola ens ensenyen a traçar línies rectes per relacionar coses. Però la naturalesa i el cos humà no funcionen en línies rectes. Per exemple, passar de 10ºC a 15ºC potser no fa emmalaltir ningú, però passar de 35ºC a 40ºC provoca cops de calor i morts. L'efecte de la temperatura forma una corba. El model GAM permet a l'ordinador dibuixar aquestes corbes naturals (línies flexibles) per entendre com la temperatura, la humitat i la contaminació afecten la salut de veritat.

4. Diagnòstic (Avaluar el metge)

Un bon metge també revisa si s'ha equivocat. Aquesta secció deforma un concepte anomenat "residus", que bàsicament és la diferència entre el que l'ordinador va predir que passaria i el que realment va passar. Aquí generem uns gràfics interns per veure si el model és fiable o si està completament perdut.

5. Extracció del Risc Relatiu (El veredicte numèric)

Després de tants càlculs, volem una resposta senzilla. Això ho fem calculant el Risc Relatiu (RR).

Què és el Risc Relatiu (RR)?

És la mesura més famosa en epidemiologia per saber si una cosa és perillosa. En el nostre codi, mesurem què passa cada vegada que la contaminació puja 10 punts (µg/m³).

Si el RR és 1.00, significa que el risc no canvia. L'aire brut no fa res.
Si el RR és 1.05, vol dir que per cada 10 punts extra de contaminació, el risc que la gent es posi malalta augmenta un 5%.

El codi també calcula l'"Interval de Confiança (IC)", que és el marge d'error del model (ex: estem 95% segurs que el risc augmenta entre un 3% i un 7%).

6. Gràfica Dosi-Resposta (Una imatge val més que mil paraules)

Finalment, els humans entenem millor els dibuixos que les llistes de números. Aquesta última part crea una gràfica elegant i fàcil de llegir.

La gràfica de Corba Dosi-Resposta ens ensenya justament a partir de quina "dosi" de contaminació (l'eix de sota, l'horitzontal) comença a disparar-se el nombre de malalts (l'eix vertical). Veurem una línia vermella que representa el "risc zero". Si la nostra línia de contaminació blava supera aquesta línia vermella i tira cap amunt, estarem veient, amb els nostres propis ulls, l'efecte tòxic de respirar l'aire contaminat de la ciutat.



En resum: Aquest codi agafa anys de registres de malalts, neteja les trampes del calendari (festius i pandèmies), considera que l'efecte de l'aire triga uns dies a notar-se al cos humà, utilitza matemàtiques avançades (no lineals) per trobar patrons ocults, i finalment ens diu exactament en quin percentatge augmenten les malalties quan puja la contaminació i ens ho dibuixa en una gràfica.