
Laurids Østergaard Poulsen gennemgik på webinaret, hvordan bedre og mere avanceret kræftbehandling udfordrer de klassiske mål for effekt og gør det sværere at vurdere, hvad der virker.
Professor: Kræftmedicin er blevet så effektiv, at det er sværere at måle effekten
Samlet overlevelse er stadig det tungeste mål
Når onkologer måler effekt i kliniske forsøg, sker det ofte med overlevelseskurver, hvor man følger en gruppe patienter over tid. Ved starttidspunktet er alle i live. Derefter følger man dem måned for måned og registrerer, hvor mange der stadig lever. Kurven falder gradvist, efterhånden som patienter dør. Den type kurve kaldes en Kaplan-Meier-kurve og er et helt centralt redskab i kræftforskning.
Kurverne kan bruges på flere måder. Man kan for eksempel se, hvor mange der stadig lever efter ét år eller to år. Man kan også opgøre den mediane overlevelse. Median betyder det punkt, hvor halvdelen af patienterne er døde. Median er ikke det samme som gennemsnit. Den er mindre følsom over for ekstreme udsving og bruges derfor ofte i kliniske studier.
Problemet er, at median overlevelse er blevet et langsomt mål i en tid, hvor patienterne lever længe.
Laurids Østergaard Poulsen pegede på studier fra sit eget område, hvor patienter med tarmkræft får immunterapi. Her kan en stor andel af patienterne stadig være i live efter fem år. Det er godt nyt for patienterne, men det gør også, at forskerne og myndighederne må vente længe på at få et endeligt svar på, hvor stor gevinsten er målt i overlevelse.
"Selv efter 60 måneder, som er 5 år, så er vi ikke i nærheden af at være der, hvor halvdelen af patienterne er gået bort," forklarede han.
For patienter uden for studierne kan det få en meget konkret betydning. Hvis sundhedsvæsenet insisterer på at vente på modne overlevelsesdata, kan lovende behandlinger være flere år om at nå ud til patienter, der kunne have haft glæde af dem.
Tidlige endepunkter bruges for at få svar hurtigere
Netop fordi samlet overlevelse kan være så langsom at måle, bruger forskere og lægemiddelmyndigheder i stigende grad andre mål, som kan give et tidligere fingerpeg om, om en behandling virker. I fagsprog kaldes de surrogate endepunkter. Det er indirekte mål, som ikke i sig selv er det endelige mål for patienten, men som kan sige noget om, om behandlingen bevæger sig i den rigtige retning.
Et af de mest brugte er responsrate. Det er et mål for, hvor mange patienter, der får deres tumor til at skrumpe efter behandling. Typisk ser man på scanninger og måler, om den samlede tumorbyrde, altså den samlede mængde målbar kræft i kroppen, bliver mindre.
Responsrate er især nyttig tidligt i udviklingen af ny medicin. Hvis en behandling får kræftknuder til at skrumpe hos en stor del af patienterne, er det ofte et vigtigt signal om, at man har fat i noget, der biologisk set virker.
"Det er et rigtig godt tidligt estimat på, om man har fat i en effektiv behandling," forklarede Laurids Østergaard Poulsen.
Men som han understregede, er sammenhængen mellem tumorrespons og det, der virkelig betyder noget for patienten, langt fra altid ligetil. En tumor kan godt skrumpe uden, at patienten lever længere. Og en behandling kan godt se imponerende ud på scanningsbilleder, selv om den samlede gevinst for patienten er begrænset.
Det er noget af kernen i hele debatten om endepunkter: Måler man på noget, der ser godt ud i et forsøg, eller måler man på noget, der reelt ændrer patientens liv og sygdomsforløb?
Progressionsfri overlevelse er blevet et centralt, men omstridt mål
Et andet og meget udbredt endepunkt er progressionsfri overlevelse, som forkortes PFS. Det måler, hvor lang tid der går, før sygdommen vokser igen, spreder sig eller på anden måde forværres. Med andre ord: Hvor længe kan behandlingen holde kræften i ro.
PFS er attraktivt i studier, fordi det kan måles langt tidligere end samlet overlevelse. Man behøver ikke vente på, at patienterne dør. Man kan nøjes med at følge sygdommens udvikling på scanninger og i kliniske vurderinger. Det gør PFS til et hurtigere og mere praktisk mål, især når overlevelsen strækker sig over mange år.
"PFS er meget brugt og har givet meget debat med god grund," forklarede Laurids Østergaard Poulsen.
Debatten opstår, fordi PFS og samlet overlevelse ikke altid følges ad. En behandling kan godt udsætte sygdommens forværring med måneder eller måske længere, uden at det kan ses på, hvor længe patienterne lever i sidste ende.
"Der kan vi ofte vise, at en behandling signifikant, som vi kalder det statistisk, forlænger den progressionsfri overlevelse, men ikke den samlede overlevelse."
Fortalere for PFS peger på, at kræftpatienter i dag ofte får flere behandlinger efter hinanden. Hvis patienten først får forsøgsbehandlingen og senere andre effektive behandlinger, kan gevinsten ved den første behandling blive skjult, når man kun ser på samlet overlevelse. Overlevelsen bliver så påvirket af hele behandlingsforløbet og ikke kun af den medicin, man egentlig forsøger at teste.
Modstanderne svarer, at netop det er pointen: Hvis en behandling virkelig er vigtig nok til at ændre praksis, bør den også kunne ses på det endelige udfald. De mener, at det ikke er tilstrækkeligt at skubbe sygdommens udvikling lidt frem i tiden, hvis patienterne i sidste ende ikke lever længere.
Laurids Østergaard Poulsen beskrev den uenighed med et billede, som ofte bruges i debatten:
"Hvis du løber en marathon, så nytter det ikke, at du løber den første halvdel hurtigere, hvis du kommer i mål på samme tid."
Analogien er enkel, men rammer dilemmaet godt. Er det nok, at behandlingen vinder tid undervejs, hvis slutresultatet er det samme? Eller er tiden i sig selv værdifuld, fordi sygdommen holdes nede, symptomer udskydes, og patienten måske får flere gode måneder?
Biomarkører og livskvalitet
I nogle kræftsygdomme kan læger også støtte sig til biomarkører, altså målbare stoffer i blodet eller vævet, som siger noget om sygdomsaktiviteten. Ved æggestokkræft bruges for eksempel CA-125, et stof i blodet, som ofte stiger, når sygdommen er aktiv, og falder, når behandlingen virker.
Biomarkører kan være værdifulde, fordi de gør det muligt at følge sygdommen tæt og få et tidligt signal om, om behandlingen ser lovende ud. Men de har samme grundlæggende begrænsning som andre surrogate endepunkter: De er indirekte. Et fald i en blodprøve er ikke i sig selv det samme som, at patienten lever længere eller bedre.
Kræftbehandling handler ikke kun om måneder og år. Den handler også om, hvordan patienten har det undervejs. Kan patienten gå på arbejde? Kan hun hente sine børn? Kan han sove om natten, spise, gå en tur, leve et nogenlunde almindeligt hverdagsliv? Alt det falder ind under livskvalitet, og det fylder stadig mere i diskussionen om, hvordan effekten af ny medicin bør vurderes.
Livskvalitet måles ofte gennem spørgeskemaer, hvor patienterne selv rapporterer symptomer, funktionsevne og trivsel. I forskningen kaldes det patientrapporterede oplysninger eller PRO-data. Ambitionen er god: At få patientens egen stemme ind i evalueringen. Men i praksis kan det være svært at omsætte til noget, der er lige så entydigt som overlevelse.
"Og så er der også mange studier, der prøver at måle tid til forværing af livskvaliteten. Og derfor er de med i mange undersøgelser, men typisk noget langt nede i de sekundære endepunkter," forklarede Laurids Østergaard Poulsen.
Det betyder, at livskvalitet ofte bliver målt, men sjældent får samme vægt som de hårde endepunkter. Når resultaterne bagefter gøres op, bliver de ofte kogt ned til gennemsnit for store grupper. Her kan meget forsvinde.
"Vi indsamler jo masser af livskvalitetsskemaer, men det bliver jo tit sådan et kompromis af 1000 patienter, der sådan bliver kortet ned i en kurve, og så bliver udsvingene næsten normaliseret," fortalte Laurids Østergaard Poulsen.
For den enkelte patient kan udsvingene være hele pointen. En behandling, der ikke forlænger livet, kan alligevel have enorm værdi, hvis den gør, at patienten kan vende tilbage til hverdagen, undgå en operation eller klare sig med færre symptomer i en periode.
Det er også her, økonomi og etik smelter sammen. Hvor meget må det koste at forbedre patientens hverdag, hvis gevinsten ikke kan måles i forlænget liv? Og hvem afgør, hvad der er nok?
USA siger oftere ja tidligt, mens Europa venter længere
Forskellen i synet på endepunkter bliver særlig tydelig, når man ser på, hvordan nye lægemidler godkendes i USA og Europa. I USA har myndighederne i mange år været mere villige til at godkende medicin på baggrund af tidlige og mere usikre endepunkter, hvis behandlingen ser lovende ud. Tanken er, at patienter med alvorlig sygdom ikke skal stå i årevis og vente på modne overlevelsesdata, når der allerede er tegn på, at noget virker.
"USA har jo grundtanken om, at siden patienten selv betaler via sit forsikringsselskab, så skal man også have mulighed for at købe den bedst mulige behandling og have lov til selv at håbe på, at det her også virker," sagde Laurids Østergaard Poulsen.
Den model giver hurtigere adgang til ny medicin. Patienter kan få behandling tidligere, og nogle vil uden tvivl have gavn af det i perioden, før de endelige data foreligger. Men modellen har også en slagside. Hvis et lægemiddel først er kommet på markedet og er taget i brug, kan det være svært at få det afregistreret igen, selv hvis de senere data viser, at gevinsten var mindre end håbet.
I Europa er tilgangen mere tilbageholdende. Her er sundhedsvæsenet skattefinansieret, og derfor er perspektivet et andet. Når fællesskabet betaler for behandlingen, bliver kravet om sikker dokumentation også stærkere.
Det kan betyde langsommere adgang for patienterne. Til gengæld mindsker det risikoen for, at sundhedsvæsenet bruger meget store beløb på behandlinger, som senere viser sig ikke at have den ønskede effekt. Bag debatten om endepunkter ligger derfor også et politisk og samfundsøkonomisk spørgsmål: Hvor stor usikkerhed vil man acceptere for at få hurtigere adgang til ny medicin?
Randomiserede studier er stadig stærkeste metode, men de ligner ikke altid virkeligheden
Inden for medicinsk forskning regnes det randomiserede studie fortsat for guldstandarden. Randomisering betyder, at patienterne fordeles tilfældigt mellem de behandlinger, der skal sammenlignes. På den måde forsøger man at sikre, at grupperne ligner hinanden mest muligt, så forskellen i udfald kan tilskrives behandlingen og ikke noget andet.
Laurids Østergaard Poulsen lagde heller ikke skjul på, at han fortsat ser stor værdi i randomiserede forsøg. Men han pegede samtidig på en voksende udfordring: Patienterne i studierne er ofte så nøje udvalgt, at resultaterne ikke altid spejler den virkelighed, lægerne møder på afdelingerne.
"Et randomiseret studie er altid været den gyldne standard, og det er jeg også selv super tilhænger af, det skal der ikke være nogen tvivl om, men der er nogle gange, hvor det bliver udfordret," fortalte han.
For at et lægemiddelstudie skal have størst mulig chance for at vise en effekt, opstiller man ofte en lang række krav til, hvem der må deltage. Patienterne skal have en bestemt almentilstand, bestemte blodprøver, færre ledsagesygdomme og ofte et sygdomsforløb, som passer ind i protokollen. Resultatet kan blive, at studiepopulationen er væsentligt pænere og mere ensartet end patientgruppen i den virkelige verden.
Laurids Østergaard Poulsen nævnte et eksempel fra leverkræft, hvor en behandling så overbevisende ud i et randomiseret forsøg, men hvor billedet blev mere usikkert, da erfaringerne begyndte at komme fra almindelig klinisk praksis. Pointen var ikke, at det randomiserede studie var værdiløst, men at det ikke nødvendigvis fortalte hele sandheden om, hvordan behandlingen virker hos alle patienter.
"Det viser meget godt, at vores traditionelle tankegang omkring randomiserede studier som det eneste gode er udfordret af, at vi selekterer så hårdt, som vi gør," sagde han.
Real-world data lyder som en oplagt løsning, men har egne svagheder
Når randomiserede studier kan være for snævre, vender blikket sig ofte mod real-world data. Det er oplysninger fra den almindelige kliniske hverdag, hvor patienter behandles uden for forskningsprotokoller. Her kan man følge, hvordan medicinen virker hos patienter med høj alder, andre sygdomme og mere komplekse forløb, altså patienter som ligner dem, der faktisk møder op i ambulatoriet.
Danmark har gode forudsætninger for den slags forskning, fordi registre og journaldata gør det muligt at følge patienter over tid. Det er en af grundene til, at real-world data fylder stadig mere i diskussionen om godkendelse og opfølgning af ny medicin.
Men real-world data er ikke en genvej uden problemer. Når patienterne ikke fordeles tilfældigt, vil der næsten altid være forskelle mellem grupperne. Forskere kan forsøge at matche patienterne på køn, alder, sygdomsgrad, geografi og andre forhold, men de kan ikke nødvendigvis fange alt det, der betyder noget for udfaldet.
Det betyder, at real-world data ofte kommer tættere på virkeligheden, men længere væk fra den kontrol, som gør randomiserede studier så stærke. Derfor bliver spørgsmålet ikke, hvilken metode der er perfekt, men hvordan de forskellige typer data kan bruges sammen.
Personlig medicin gør patientgrupperne mindre og dokumentationen mere besværlig
En anden udvikling, der presser de traditionelle studiedesigns, er den personlige medicin. Kræftsygdomme bliver i stigende grad opdelt efter genetiske og molekylære kendetegn. Bag de brede diagnoser gemmer sig en lang række biologiske undergrupper, som reagerer forskelligt på behandling.
"Vi bliver heldigvis bedre og bedre til at finde ud af, at brystkræft er ikke bare brystkræft, tarmkræft er ikke bare tarmkræft, grupperne bliver mindre og mindre og mindre," fortalte Laurids Østergaard Poulsen.
Det er en faglig gevinst, fordi behandlingen kan målrettes mere præcist. Men det gør også dokumentationen langt vanskeligere. Når en behandling kun er relevant for en lille genetisk undergruppe, kan der være meget få patienter at undersøge. I nogle tilfælde er der kun et lille antal patienter i Danmark om året, som passer til den samme målrettede behandling.
Så opstår et helt praktisk problem: Hvordan gennemfører man store randomiserede studier, når patientgruppen er så lille, at det kan tage mange år at samle nok deltagere? Og hvad sammenligner man med, hvis den biologiske undergruppe er så snæver, at den klassiske standardbehandling ikke længere er et oplagt sammenligningsgrundlag?
Basket- og umbrella-studier er et forsøg på at følge med udviklingen
For at håndtere små og biologisk definerede patientgrupper er der udviklet nye studiedesigns. I basket-studier samler man patienter med forskellige kræfttyper, som deler en bestemt genetisk mutation. Pointen er, at det ikke nødvendigvis er organet, der er vigtigst, men den biologiske fejl, behandlingen retter sig mod.
I umbrella-studier gør man det modsatte. Her tager man udgangspunkt i én kræfttype, for eksempel lungekræft, og fordeler patienterne til forskellige behandlinger afhængigt af, hvilke genetiske markører tumoren har.
Begge modeller giver mening i en tid med personlig medicin, men de rejser også nye spørgsmål. Ofte mangler der en klassisk kontrolarm, altså en direkte sammenligningsgruppe, hvor patienterne får standardbehandling. Dermed bliver det vanskeligere at vurdere, om den nye behandling faktisk er bedre end det, man allerede gør.
"Vi kan se, hvordan det går – men hvad skal vi sammenligne med?"
Det er et af de helt store spørgsmål i moderne kræftforskning. Jo mere præcist medicinen målrettes, jo sværere kan det blive at dokumentere effekten med de værktøjer, sundhedsvæsenet er vant til at bruge.
Fase 4-studier kan blive vigtigere, hvis medicin skal tages tidligere i brug
Når usikkerheden er større ved godkendelsen, bliver opfølgningen bagefter tilsvarende vigtigere. Netop derfor pegede Laurids Østergaard Poulsen på fase 4-studier som et område, der bør styrkes. Fase 4-studier er undersøgelser, der foregår efter godkendelsen, når medicinen allerede er taget i brug i klinikken. Her kan man følge, om behandlingen også virker i den virkelige verden, om bivirkningerne er som forventet, og om gevinsten holder, når patientgruppen bliver bredere.
Tanken er i princippet enkel: Hvis man bliver bedre til at følge behandlinger tæt efter godkendelse, kan det måske blive lettere at acceptere en tidligere ibrugtagning på et mere usikkert grundlag. Men det kræver, at opfølgningen er reel og ikke bare en god intention.
Laurids Østergaard Poulsen pegede på, at klinikerne sådan set gerne vil bidrage, men at infrastrukturen halter. Data ligger spredt i systemer, og det er ofte uklart, hvem der skal betale for indsamlingen, analysen og den løbende opfølgning.
"Kan vi lave nogle bedre registre, så man på en eller anden måde med alle de her nye AI bedre kunne suge de data ud af behandlingsjournalerne? (...) Jeg tror i hvert fald fra klinikernes side, at man meget gerne ville indtaste det i systemer, eller hvad der nu skulle være nødvendigt. Men vi har brug for bedre platforme til at kunne gøre det op."
Debatten handler til sidst om, hvad man vil betale for – og hvad man vil acceptere
Når diskussionen om endepunkter bliver så intens, skyldes det, at den i virkeligheden handler om mere end statistik. Den handler om, hvad man som sundhedsvæsen vil lægge vægt på. Skal det afgørende være, at patienterne lever længere? Skal det være nok, at sygdommen holdes nede? Skal det tælle tungt, hvis patienterne får en bedre hverdag, undgår en operation eller kan vende tilbage til arbejde, selv om levetiden ikke ændres?
Der er ikke ét enkelt svar, og Laurids Østergaard Poulsen forsøgte heller ikke at udstede en færdig facitliste. Han beskrev snarere et felt, hvor valgene bliver sværere, jo bedre behandlingerne bliver.
"Der er fordele og ulemper ved alle de forsøgsdesign, vi har gennemgået, så der skal nok være plads til flere forskellige," sagde han.
Du kan se Laurids Østergaard Poulsen i optagelsen af "Ånden i ordinationsretten – del 1" fra 19. marts.


