Steeds vaker wordt kunstmatige intelligentie toegepast in diverse domeinen van de gezondheidszorg. Door de beschikbaarheid van grote hoeveelheden data in combinatie met verbeterde deep-learningsystemen wordt er met name progressie geboekt op het gebied van de medische beeldverwerking. Dr. ir. Geert Litjens, biomedisch ingenieur bij de afdeling Pathologie in het Radboudumc te Nijmegen, vertelt over de resultaten en het potentieel van kunstmatige intelligentie voor de oncologische diagnostiek, in het bijzonder de bepaling van de Gleason-score bij prostaatkanker.
Het aantal succesvolle toepassingen van kunstmatige intelligentie (AI) in de gezondheidszorg neemt in een razendsnel tempo toe. AI wordt met name toegepast in de diagnostiek bij medische disciplines waarbij beeldverwerking een rol speelt, zoals radiologie en pathologie. “AI speelt al jaren een rol bij bijvoorbeeld mammografie, maar ook binnen de pathologie wordt het steeds belangrijker voor de diagnostiek en het voorspellen van de prognose bij kanker. Daarnaast biedt AI ook veel mogelijkheden voor het analyseren van teksten, bijvoorbeeld het scannen van medische rapporten op relevante informatie”, vertelt Geert Litjens.
Binnen de medische beeldvorming is AI met name gericht op het automatisch herkennen van beelden en patronen. Hiervoor wordt gebruikgemaakt van deep learning, een techniek waarbij algoritmes worden gebruikt om de computer te trainen in het herkennen van patronen en verbanden door diepe neurale netwerken aan grote hoeveelheden data bloot te stellen. Uit onderzoek blijkt dat deze deep-learningalgoritmes minstens net zo goed in staat zijn om tumoren te detecteren en graderen als ervaren pathologen.1
Litjens: ”Sinds de ontwikkeling van diepe neurale netwerken in 2012 is de toepassing van AI voor de medische beeldvorming in een stroomversnelling geraakt. Door diepe neurale netwerken is de computer zelf in staat om verbanden te leggen tussen relevante kenmerken in het beeldmateriaal en de uitkomsten. Door zowel innovatie van de algoritmes als de grote hoeveelheid beschikbare data zijn de AI-systemen voor automatische beeldherkenning aanzienlijk verbeterd. De inzet van AI kan het werk van pathologen minder tijdrovend maken en de diagnostiek verbeteren.”
Gleason-score
De groep van Litjens ontwikkelde tegelijkertijd met Google en het Karolinska-instituut in Zweden een deep-learningsysteem voor het bepalen van de Gleason-score bij prostaatkanker. Hoewel de Gleason-score de accuraatste prognostische marker voor prostaatkanker is, is de bepaling sterk afhankelijk van de expertise van de patholoog. Litjens: “De aanleiding voor ons onderzoek was de gedachte dat de gradering van prostaatkanker consistenter zou kunnen worden door de inzet van AI. Om deze hypothese te testen, hebben we de Gleason-score van bijna 6.000 biopten gebruikt om het systeem te trainen in het herkennen van patronen.2 Dit hebben we gevalideerd met een externe dataset waar de beoordeling van ervaren pathologen diende als referentiestandaard. Uit de resultaten bleek dat het deep-learningsysteem de biopten net zo goed kon graderen als ervaren pathologen en zelfs beter dan minder ervaren pathologen.”
Om te testen of de inzet van AI daadwerkelijk de diagnostiek bij prostaatkanker ondersteunt, deed de groep van Litjens een vervolgonderzoek waarin veertien pathologen 160 biopten beoordeelden met en zonder gebruik van het AI-systeem. Uit de resultaten bleek dat de gradering van prostaatkanker nauwkeuriger kon worden bepaald wanneer de pathologen gebruikmaakten van het AI-systeem.3 Bovendien bleek het gebruik van AI de variatie in beoordeling tussen pathologen sterk te verminderen.
Om het AI-systeem verder te verbeteren, stelden de onderzoeksgroepen van Litjens en het Karolinska-instituut hun algoritmes en data beschikbaar op het competitieplatform Kaggle, waar anderen werden uitgedaagd om een beter algoritme te ontwikkelen. Litjens: “De competitie valideerde dat er wereldwijd en in het algemeen algoritmes ontwikkeld kunnen worden die de Gleason-score nauwkeurig kunnen vaststellen. Het winnende algoritme deed het iets beter dan dat van ons. Wij denken echter dat ons algoritme een grotere kans heeft om in de praktijk gebruikt te worden, omdat de stappen van dit algoritme inzichtelijker zijn voor pathologen. Het winnende algoritme gaf ons wel inzicht in hoe we om kunnen gaan met onzekerheid in de referentiestandaard en dit kunnen we gebruiken voor de verdere ontwikkeling van ons eigen algoritme.”
Kansen en beperkingen
Hoewel het gebruik van het algoritme de diagnostiek van prostaatkanker beter en consistenter zou kunnen maken, wordt het nog niet in de praktijk gebruikt. Litjens: “Het grootste potentieel van het algoritme is dat de expertise in de diagnostiek van prostaatkanker breed toegankelijk kan worden gemaakt en minder variabel is tussen pathologen. Op dit moment weten we echter nog niet zeker hoe het systeem omgaat met zeldzame varianten van prostaatkanker. In ongeveer 95% van de prostaattumoren gaat het om een adenocarcinoom, maar de overige 5% bestaat uit verschillende subtypen. Omdat deze zeldzame varianten zelfs nauwelijks voorkomen in een grote onderzoekspopulatie, hebben we op dit moment te weinig data om algemene uitspraken te kunnen doen over de nauwkeurigheid van het systeem voor de detectie van zeldzame gevallen.
Idealiter moet het AI-systeem ook de zeldzame vormen van prostaatkanker niet over het hoofd zien. Mijn verwachting is dat het systeem in de toekomst aan kan geven dat er afwijkingen zijn gevonden in biopten van zeldzame tumoren. Op deze manier weet de patholoog welke biopten hij zelf nog moet bekijken en kan hij de tumor verder typeren. Daarnaast zijn we niet alleen aan het kijken hoe we AI kunnen inzetten om de Gleason-score te bepalen, maar ook om nieuwe kenmerken en patronen in de biopten te ontdekken die de prognose kunnen voorspellen.”
Implementatie
Hoewel er al veel succesvolle AI-systemen zijn ontwikkeld, gaat de implementatie in de praktijk moeizaam. Volgens Litjens is dit vooral een financiële kwestie. “Om AI breed toepasbaar te maken, zijn er commerciële bedrijven nodig die de AI-systemen kunnen certificeren, een enorm kostbaar proces, en de laatste stap naar de markt kunnen maken. Een goede ontwikkeling is dat er sinds een aantal jaren commerciële bedrijven rondom AI in opkomst zijn.
Een andere reden voor de langzame implementatie is dat artsen gewend zijn om op een bepaalde manier te werken. Het heeft tijd nodig om AI op een manier te integreren waarop pathologen hun werkwijze zo min mogelijk aan hoeven te passen. In vergelijking met een aantal jaren geleden zie je wel dat de toegevoegde waarde van AI steeds meer wordt erkend in de pathologie en dat laboratoria aan het digitaliseren zijn. Deze digitalisatie komt enerzijds door de voordelen van het digitaal delen van data, maar ook door het potentieel van AI om de zorg te verbeteren.”
Referenties
1. Van der Laak J, et al. Nat Med 2021;27:775-84.
2. Bulten W, et al. Lancet Oncol 2020;21:233-41.
3. Bulten W, et al. Mod Pathol 2021;34:660-71.
Carmen Paus, MSc, medical writer
Oncologie Up-to-date 2021 vol 12 nummer 4