TarraCare-XXIII és la proposta de l’equip Pattern Recognizers al repte de l’Hospital Universitari Joan XXIII, amb l’objectiu de predir el risc de mortalitat a un any vista, les visites a urgències del mes següent per a pacients PCC i MACA, recomanar pacients no etiquetats per al subconjunt de PCC i generar històries clíniques automàtiques per a cada pacient.
Hospital Universitari Joan XXIII
Pattern Recognizers
- Rubén Catalán Rua: Email, GitHub
- Fabio Susin Perancho: Email, GitHub
- Ricard Garcia Isern: Email, GitHub
- Sergio Martínez Pérez: Email, GitHub
- Predicció del risc de mortalitat a un any
- Predicció de visites a urgències d’aguts el mes següent en població PCC o MACA
- Recomanació de pacients no etiquetats per al subconjunt de PCC
- Generació d’històries clíniques automàtiques per a cada pacient
Mitjançant models de Gradient Boosting per al primer i el segon repte, s’han obtingut predictors de probabilitat per a la mortalitat d’un pacient a un any, així com la probabilitat d’ingrés a urgències al cap d’un mes. El tercer repte es planteja com a no viable a causa del format de les dades proposades. A més, s’ha desenvolupat un sistema per a la generació d’històries clíniques automàtiques per a cada pacient.
TarraCare-XXIII aborda els diferents reptes amb models i enfocaments diversos.
La predicció del risc de mortalitat es planteja com una decisió binària en què la probabilitat de defunció al cap d’un any s’expressa com a soft probabilities. És a dir, es considera que una probabilitat més alta de mort no implica una certesa absoluta. Com a model, s’ha escollit CatBoost, basat en gradient boosting amb decision trees, que permet interpretar les decisions preses pel model en cada pas i obtenir resultats més transparents i verificables.
Per predir la probabilitat que un pacient ingressi a urgències el mes següent, el problema es divideix en dues parts. En primer lloc, s’estima el volum de pacients esperat per al mes següent a partir dels tres mesos anteriors, així com la distribució diària basada en la del mes precedent. Addicionalment, es calcula la probabilitat que un pacient vagi a urgències el mes següent utilitzant dades de tot l’any anterior mitjançant el Gradient Boosting Classifier de scikit-learn.
Finalment, el tercer repte proposa un recomanador basat en distàncies per identificar pacients actualment no etiquetats que podrien ser considerats PCC. Després d’una anàlisi exhaustiva, s’ha observat que les dues classes se solapen en gran part de l’espai de característiques, fet que en dificulta la separació mitjançant mètodes de distància. En conseqüència, es conclou que, amb el format actual de les dades, aquest repte no és viable dins del plantejament proposat, ja que cap classificador binari podria separar les classes de manera fiable.
A més, el projecte inclou la generació automàtica d’històries clíniques per a cada pacient, complementant així els resultats dels models predictius.
-
Llenguatges de programació
- Python
- JavaScript
-
Frameworks i llibreries
- React
- CUDA
- scikit-learn
- NumPy
- pandas
- Matplotlib
-
Eines i plataformes
- Vercel + Render (deployment de l’aplicació)
Projecte desenvolupat com a part de la Hackató Cloud Computing 2026, organitzada per la Universitat Rovira i Virgili i T-Systems.

