Kunstmatige intelligentie kan op tal van manieren nuttig zijn binnen de oncologie. Van geautomatiseerde beeldherkenning in de diagnostiek tot het ondersteunen bij het kiezen van de beste behandeling voor de individuele patiënt. Prof. dr. André Dekker, hoogleraar Clinical Data Science aan Maastricht University, geeft uitleg.
Inmiddels al weer ruim tien jaar geleden deden André Dekker en zijn collega’s het volgende experiment. Zij vroegen radiotherapeuten, allen gespecialiseerd in het behandelen van patiënten met longkanker, bij meer dan 100 patiënten aan te geven hoe groot zij de kans achtten dat de patiënt over twee jaar nog in leven zou zijn. Tegelijk lieten zij een door Dekker en collega’s ontworpen algoritme voor iedere patiënt de overlevingskans berekenen. Twee jaar later werden de inschattingen vergeleken met de actuele overlevingscijfers. Wat bleek? De voorspelling van de radiotherapeuten was maar nauwelijks nauwkeuriger dan het opgooien van een muntje (in vaktaal: de AUC van hun voorspelling bedroeg 0,56). De voorspelling van het algoritme daarentegen kwam met een AUC van 0,71 significant beter in de buurt van de echte overlevingscijfers (ter informatie: een perfecte voorspelling leidt tot een AUC van 1,00).
Vijf variabelen
“Deze studie onderstreept dat het voor een mens haast ondoenlijk is om de uitkomst van een proces te voorspellen als die uitkomst afhankelijk is van tal van variabelen”, zegt Dekker. “Onderzoek heeft uitgewezen dat het menselijk brein in staat is met maximaal vijf verschillende variabelen om te gaan bij het maken van een keuze. Het mag duidelijk zijn dat de uitkomst van een behandeling bij een patiënt met kanker van veel meer dan vijf variabelen afhankelijk is. Sterker nog, met het groeien van onze kennis over kanker, neemt het aantal variabelen waarmee de arts rekening moet houden bij het voorspellen van de uitkomst van de behandeling alleen maar verder toe. Er is sprake van een steeds verder gaande subclassificatie van tumoren, de toename van behandelopties leidt tot een toename van verschillende voortrajecten voor de patiënt, elke behandeloptie heeft een eigen set aan bijwerkingen, en patiënten hebben een persoonlijke opvatting over hoe ver ze willen gaan in hun behandeling en wat ze wel of niet acceptabel vinden als uitkomst. Dat maakt het voor de behandelaar in de dagelijkse praktijk haast onmogelijk voor iedere individuele oncologische patiënt de behandeling te kiezen die voor die patiënt zal leiden tot een optimale uitkomst.”
Elektronische beslishulp
In de dagelijkse praktijk leunt de zorgverlener bij het kiezen van de optimale behandeling nu op richtlijnen, aanvullende recente(re) wetenschappelijke literatuur en de eigen klinische ervaring. “Niets ten nadele van alle zorgverleners, maar deze bronnen zijn ontoereikend om een optimale behandelkeuze te kunnen maken. Zo zijn de aanbevelingen in richtlijnen gebaseerd op studies bij een klein, niet altijd representatief deel van de patiëntenpopulatie, is het voor niemand mogelijk om alle literatuur bij te houden en is de klinische ervaring zelfs bij een ervaren arts beperkt in vergelijking met het totale aantal patiënten op de wereld met de betreffende aandoening. Waarbij, zoals ik al zei, de complexiteit van de beslissing over de in te zetten therapie ook nog voortdurend toeneemt.”
Het zal niet verbazen dat de oplossing die Dekker hierbij ziet, is dat de arts gebruikmaakt van een algoritme dat het advies over de beste therapie geeft. “Computers zijn, zoals we al zagen in de studie met de radiotherapeuten, veel beter dan mensen in staat de invloed van heel veel variabelen op de uitkomst mee te wegen bij het maken van een keuze. We moeten daarom algoritmen, elektronische beslishulpen dus, ontwikkelen die bij het maken van de keuze rekening houden met zowel de resultaten van de wetenschappelijke studies, de uitkomsten van de behandelingen in de dagelijkse praktijk, de bijwerkingen van de behandelingen, enzovoort. Enfin, zoveel mogelijk relevante factoren.”
De computer zegt ’nee’
Een voorbeeld waarbij de computer bepaalt hoe de behandeling er gaat uitzien is de indicatiestelling voor protonentherapie. Dekker: “Protonentherapie is een dure behandeling waarvoor in Nederland maar beperkt capaciteit is. We hebben daarom in Nederland afgesproken dat een patiënt alleen in aanmerking komt voor protonentherapie als bij behandeling met protonentherapie ten opzichte van fotonentherapie de effectiviteit van de behandeling gelijk blijft, maar de verwachte toxiciteit bij een individuele patiënt zal afnemen tot onder een bepaalde grens: minstens 5% minder kans op het krijgen van een graad 3-bijwerking of minstens 10% minder kans op het krijgen van een graad 2-bijwerking. Die berekening gebeurt met behulp van een computermodel dat voor beide behandelingen de toxiciteit berekent.
Hier gebruiken we dus kunstmatige intelligentie (artificial intelligence; AI) voor het stellen van de indicatie. De computer zegt ‘ja’ of ‘nee’ op de vraag of de patiënt in aanmerking komt voor protonentherapie. Dat klinkt misschien hard, maar zoals we zagen is de mens veel minder goed dan de computer in staat de uitkomst van de behandeling te voorspellen. Ethisch gezien is het dan eerlijker om de computer de beslissing te laten nemen. Nog afgezien van het feit dat je daarmee de zorgverlener minder blootstelt aan de assertiviteit van de patiënt of diens familie.”
Automatiseren en versnellen
Een ander (medisch) terrein waar AI uitstekend tot zijn recht komt, is de diagnostiek. “Computers zijn, mits goed getraind, zeer goed in het vervangen van repeterende, routinematige menselijke taken in de zorg. Bijvoorbeeld het beoordelen van een mammogram of een CT-scan op de aanwezigheid van afwijkende structuren en/of het intekenen van organen op een scan”, vertelt Dekker. “Het doel hierbij is met name menselijke taken te automatiseren en te versnellen, wat ten goede komt aan de efficiëntie van de gezondheidszorg. De zorgprofessionals kunnen zich in de tijd die daardoor vrijkomt richten op de zaken die wel beter door de mens kunnen worden uitgevoerd. Bijvoorbeeld een gesprek voeren met de patiënt.”
Een onderwerp dat hierbij vaak naar voren komt, is de vraag hoe betrouwbaar het algoritme is in het herkennen van de afwijkende structuren op bijvoorbeeld een mammogram. “De kwaliteit en toepasbaarheid van een algoritme zijn altijd sterk afhankelijk van de data waarmee het algoritme is opgesteld en gevalideerd. In de praktijk betekent dit dat je liefst zo groot mogelijke datasets gebruikt en ook datasets met zoveel mogelijk variatie, bijvoorbeeld door tal van data uit verschillende landen te combineren. Dat kan tegenwoordig relatief gemakkelijk met behulp van de in Nederland ontwikkelde techniek van de Personal Health Train” (zie Kader).
Context
Dat de toepasbaarheid van een algoritme sterk afhangt van de context waarin het algoritme is ontwikkeld, illustreert Dekker met twee voorbeelden. “Wij kregen in het begin van de COVID-19-pandemie uit Wuhan een algoritme dat COVID-19-patiënten kon identificeren aan de hand van een CT-scan van de longen. Handig, want de PCR-test was toen nog maar mondjesmaat verkrijgbaar. Het Chinese algoritme was ontwikkeld op basis van ruim 5.000 scans en werkte daar naar behoren. In Maastricht werkte het echter helemaal niet goed. Dat had mogelijk te maken met het feit dat er in China andere CT-scanners in gebruik waren, of dat de ziekte bij Chinezen toch een ander longbeeld geeft dan bij Europeanen.
Een ander voorbeeld is IBM Watson for Oncology, een algoritme om de arts te ondersteunen bij het kiezen van de beste behandeling voor de oncologische patiënt. Het algoritme kende alle medische literatuur en was getraind op basis van casussen uit het Memorial Sloan Kettering Cancer Center en het MD Anderson Cancer Center. Het gevolg daarvan was dat het algoritme de artsen van deze twee centra imiteerde wat betreft behandeladviezen. In de Europese setting waren deze adviezen echter vaak niet bruikbaar vanwege tal van verschillen in de opvattingen en behandelopties tussen beide continenten. Beide voorbeelden maakten duidelijk dat je goed moet weten waar, op basis van welke data en onder welke omstandigheden een algoritme is ontwikkeld en gevalideerd. Alleen in die omgeving zal het goed presteren.”
Het werkt anders
Daarbij moeten we ons ook realiseren dat een algoritme niet onfeilbaar is, waarschuwt Dekker. “Een studie waarin het beoordelen van mammogrammen door een algoritme werd vergeleken met de beoordeling door getrainde radiologen liet zien dat het algoritme het soms bij het verkeerde eind had. Maar net zo vaak hadden de radiologen het bij het verkeerde eind. Ook AI maakt fouten en vaak op een andere manier dan het menselijk brein. Maar dan moeten we niet meteen zeggen dat de AI niet te vertrouwen is. We moeten kunstmatige intelligentie niet één op één gelijkstellen aan menselijke intelligentie. AI werkt anders en leert anders dan een mens. Daar moeten we rekening mee houden bij het inzetten van AI. Elke vorm van intelligentie heeft zijn plus- en minpunten.”
Opleiding
Dekker is er van overtuigd dat AI de komende jaren snel verder zal oprukken binnen zowel de oncologie als binnen andere terreinen van de gezondheidszorg. “Vooral de toepassingen waarin AI menselijk handelen automatiseert, zoals het beoordelen van beelden, zullen de komende jaren snel worden ingevoerd. Oncologie is daar zeker een voorloper in, met name op de gebieden die werken met gestandaardiseerde data, zoals de radiologie, radiotherapie en pathologie. Daarnaast verwacht ik dat er de komende jaren ook meer algoritmen worden ontwikkeld en geïmplementeerd die helpen bij het nemen van therapiebeslissingen, zoals wel of geen protonentherapie, wel of niet dit dure medicijn, enzovoort.”
Een gevolg op de lange termijn van de komst van AI is dat we moeten gaan nadenken over loss of skills, merkt Dekker ten slotte op. “We zullen ons op een gegeven moment moeten afvragen hoe nuttig het nog is om bijvoorbeeld in de opleiding tot radioloog mammogrammen te beoordelen als de computer dat in de praktijk altijd doet. Is het erg als de radioloog dat straks niet meer kan? Bij de radiotherapie leren we tegenwoordig ook niet meer handmatig dosisberekeningen uit te voeren. We zullen ons moeten afvragen welke dingen een specialist in opleiding wel moet leren en welke kennis niet meer nodig is.”
Dit artikel is het eerste in een serie artikelen over kunstmatige intelligentie (AI) en oncologie. Het volgende artikel zal ingaan op de Veldnorm Medische Kwaliteit AI.
Dr. Marten Dooper, wetenschapsjournalist
Oncologie Up-to-date 2022 vol 13 nummer 1
Met de trein naar de data
Personal Health Train is een door het IKNL en MAASTRO ontwikkelde innovatieve manier om bij onderzoek gebruik te kunnen maken van diverse (privacygevoelige) databronnen zonder dat de data getransporteerd worden naar één plaats. Dr. Gijs Geleijnse, senior clinical data scientist en projectleider van het PHT-innovatieprogramma bij IKNL, legt het uit. “Om goed te kunnen leren van data heb je twee dingen nodig: veel data en veel variatie in de data. Traditioneel gebeurt dat door verschillende dataverzamelingen op één plaats, of in één computer zo je wilt, bij elkaar te brengen. Zowel strengere privacywetgeving als terughoudendheid of onwil van de eigenaren van de data maken deze aanpak in toenemende mate lastig.” Maar als de berg niet naar Mohammed komt, moet Mohammed maar naar de berg gaan. Oftewel: als de data niet naar de analyse komen, moet de analyse maar naar de data gaan. Met behulp van de Personal Health Train.
Geleijnse: “We hebben een technologie ontwikkeld waarmee de analyse die je wilt uitvoeren op elke dataverzameling lokaal wordt uitgevoerd. Alleen de uitkomsten van die deelanalyses komen bij de onderzoeker in een centrale computer terecht. Een voorbeeld: je wilt de gemiddelde leeftijd van de patiënten in de verschillende databases weten. Dan laat je die per database berekenen en met de uitkomsten daarvan plus het aantal patiënten per database kun je de gemiddelde leeftijd voor alle patiënten berekenen. Zonder dat je ook maar één patiëntendossier hebt ingezien. Dit kan ook voor allerlei andere parameters en berekeningen. Uiteraard wordt de Personal Health Train niet alleen ingezet voor zulke eenvoudige berekeningen. We hebben inmiddels laten zien dat ook complexe artificial intelligence-algoritmen uit te voeren zijn via deze technologie.”
De Personal Health Train maakt het niet alleen mogelijk op een privacyvriendelijke manier gebruik te maken van data, deze infrastructuur verbetert ook de mogelijkheid onderzoek te doen naar zeldzame aandoeningen, benadrukt Geleijnse. “Hiermee is het mogelijk om toch over gegevens van een grote groep patiënten met deze zeldzame aandoening te beschikken. Het IKNL ziet de Personal Health Train daarnaast als een techniek om de kankerregistraties van diverse landen met elkaar te verbinden en aan allerlei analyses te onderwerpen. Zo wordt internationale data beter ontsloten en is het voor onderzoekers gemakkelijker om onderzoek te doen met internationale kankerregistratiedata.”