Un cadru de învățare automată dezvăluie de ce studiile privind cancerul nu reușesc să se traducă în setările din lumea reală

©

Autor:

Un cadru de învățare automată dezvăluie de ce studiile privind cancerul nu reușesc să se traducă în setările din lumea reală
Rezultatele obținute în studiile clinice randomizate (RCT-uri) în oncologie nu se regăsesc întotdeauna la fel și în practica de zi cu zi. Majoritatea RCT-urilor din domeniu se desfășoară pe loturi de pacienți atent selectați, adesea cu stare generală mai bună și comorbidități reduse, ceea ce nu reflectă întotdeauna realitatea clinică. Ca urmare, supraviețuirea în practica reală asociată unor terapii anti-cancer poate fi chiar și cu 6 luni mai mică decât cea raportată în RCT-uri.
Restricțiile stricte de eligibilitate, recrutarea preferențială a pacienților cu prognostic mai bun și sub-reprezentarea grupurilor de risc crescut (de ex. vârstnici, cu multe comorbidități, statut socioeconomic mai redus) pot fi factori majori care duc la o lipsă de generalizare (generalizability gap).

Pentru a corecta această discrepanță, cercetătorii au dezvoltat un cadru analitic, denumit TrialTranslator, care folosește date din practica reală (provenite din dosarele medicale electronice - EHR) și algoritmi de învățare automată pentru a simula și analiza modul în care rezultate ale unor RCT-uri de referință se aplică la grupuri mari de pacienți reali. Scopul este de a înțelege mai bine modul în care eficacitatea și beneficiile de supraviețuire variază în funcție de prognosticul fiecărui pacient, caracterizat printr-o multitudine de factori clinici și demografici.

Principalele etape ale studiului

Colectarea și structura datelor

Sursa de date: Baza de date Flatiron Health, care conține dosarele medicale electronice de la ~280 clinici de oncologie din SUA. Include informații demografice, de laborator, biomarkeri, tratamente, starea de performanță (ECOG), factori socioeconomici, etc.  

Studiul s-a concentrat pe patru tipuri de cancer metastatic/avansat cu prevalență mare:
După aplicarea criteriilor de includere, au rezultat peste 150.000 de pacienți (cuprinzând toate cele patru tipuri de cancer).

Modelarea prognosticului prin algoritmi de învățare automată

  • Obiectiv principal: Crearea unor modele care să prezică riscul de deces de la momentul diagnosticului de boală avansată/metastatică.
  • Au fost testate mai multe tehnici de învățare automată (de ex. gradient boosting survival model - GBM, random survival forest, pCox, etc.) plus un model standard Cox ca reper de comparație.
  • Pentru fiecare tip de cancer s-au folosit caracteristici clinice și de laborator (vârstă, ECOG, markeri tumorali, albumina, hemoglobina, istoricul bolilor asociate etc.).
  • Modelele GBM au ieșit pe primul loc la capitolul performanță (evaluată prin AUC la 1 sau 2 ani, în funcție de tipul de cancer).

Emularea studiilor clinice

Selecția studiilor clinice (RCT): Au fost incluse 11 RCT-uri de referință (fază 3), care au demonstrat un beneficiu de supraviețuire (sau progresie liberă de boală) și care au fost considerate standard de îngrijire la momentul analizei. De pildă, FLAURA (inhibitori EGFR în aNSCLC), KEYNOTE (checkpoint inhibitors), PALOMA (inhibitori CDK4/6) etc.

Emulare:  
  • Eligibilitatea pacienților reali a fost stabilită astfel încât să se potrivească (pe cât posibil) cu criteriile RCT (tip de cancer, linie de terapie, biomarkeri).
  • Phenotyping prognostic: Modelele ML au generat scoruri de risc pentru fiecare pacient (probabilitatea de deces până la un moment dat). S-au creat trei fenotipuri de risc (scăzut, mediu, ridicat), în funcție de tertilele scorului.
  • Analiza de supraviețuire ajustată: S-au folosit tehnici de tip IPTW (Inverse Probability of Treatment Weighting) pentru a ajusta diferențele dintre brațele tratament și control, imitând randomizarea.

Rezultate cheie

Calitatea emulării  

  • În 9 din 11 studii emulate, rezultatele (raportul de hazard, HR) au confirmat un beneficiu al tratamentului pentru pacienții reali, similar cu cel din RCT.
  • Totuși, față de valorile RCT, s-a constatat în medie o diminuare de ~35% a efectului (HR mai atenuat), iar supraviețuirea mediană în brațul tratament a fost cu 3 luni mai mică decât cea raportată în RCT-uri.

Diferențe notabile între fenotipurile de risc

  • Risc scăzut și mediu: Pacienții au avut rate de supraviețuire și beneficii de tratament mai apropiate de valorile din RCT-uri. În multe cazuri, supraviețuirea mediană s-a înscris în intervalul de încredere al studiilor originale.
  • Risc ridicat: Pacienții au înregistrat o supraviețuire semnificativ mai mică, iar beneficiul adus de tratament (diferența de supraviețuire între brațul tratament și brațul control) a fost sub pragul de 3 luni (un reper considerat „semnificativ din punct de vedere clinic” în oncologie).  

Restricțiile inițiale vs. prognosticul real  

  • Simplificarea/relaxarea criteriilor de eligibilitate n-a explicat integral discrepanțele de supraviețuire. Mai important s-a dovedit prognosticul fiecărui pacient—determinat de vârstă, comorbidități, status ECOG, factori de laborator etc.—în a prezice dacă beneficiul de tratament e apropiat de rezultatele RCT sau e mult sub acestea.

Aplicații practice  

  • Instrumentul TrialTranslator (accesibil online) permite introducerea datelor unui pacient și estimarea fenotipului de risc (low, medium, high), precum și estimarea aproximativă a supraviețuirii așa cum reiese din emulările studiilor clinice.

Concluzii și implicații

  • Studiile clinice randomizate rămân standardul de aur pentru aprobarea noilor tratamente, dar nu toți pacienții din practică ating supraviețuirile raportate de RCT.  
  • Acest cadru de emulare (machine learning + real-world data) arată că nivelul de risc al pacientului este un factor critic: pacienții cu risc înalt, chiar dacă îndeplinesc criteriile de eligibilitate, tind să aibă beneficii reduse în raport cu datele din RCT.  
  • Rezultatele sugerează că viitoarele trialuri ar trebui să includă mai mulți pacienți cu profiluri de risc complexe și să utilizeze abordări avansate pentru stratificarea prognostică. Astfel, se pot obține rezultate mai reprezentative pentru întreaga populație oncologică.  
  • Deși util, acest tip de analiză nu poate exclude total existența unor factori neobservați (confounding) și a încălcării unor supoziții. Totuși, combinarea unor baze de date cu dosare medicale electronice vaste, cu abordări ML robuste, poate ameliora substanțial aproximațiile actuale și sprijini deciziile clinice mai personalizate.

Data actualizare: 13-01-2025 | creare: 13-01-2025 | Vizite: 33
Bibliografie
Orcutt, X., Chen, K., Mamtani, R., et al. (2025). Evaluating generalizability of oncology trial results to real-world patients using machine learning-based trial emulations. Nature Medicine. doi: https://doi.org/10.1038/s41591-024-03352-5. https://www.nature.com/articles/s41591-024-03352-5.
©

Copyright ROmedic: Articolul se află sub protecția drepturilor de autor. Reproducerea, chiar și parțială, este interzisă!