Screening op genetische varianten om te kunnen voorspellen of kankercellijnen gevoelig zijn voor (antikanker)middelen levert tegenwoordig een grote rijkdom aan verschillende typen moleculaire data. Om associaties te identificeren tussen die moleculaire veranderingen en de respons op geneesmiddelen, wordt een bepaalde wiskundige methode toegepast, die echter steevast leidt tot een model waarin nauwelijks ruimte is voor andere data dan de vaak lastig te interpreteren genexpressies. Computationeel bioloog prof. dr. Lodewyk Wessels (groepsleider Computational Cancer Biology, Antoni van Leeuwenhoek, Amsterdam) heeft nu samen met zijn promovendus Nanna Aben TANDEM ontwikkeld: een tweestapsanalyse waarmee eerst DNA-veranderingen worden bekeken en vervolgens genexpressies en proteomics.
Het in vitro screenen van de effectiviteit van antikankermiddelen op verschillende kankercellijnen levert een schat aan informatie over de mogelijke mechanismen van deze middelen. Deze cellijnen zijn gekarakteriseerd qua DNA-mutaties, chromosomale duplicaties en deleties (copy number alterations; CNA), DNA-methyleringenen genexpressies. Met behulp van predictiemodellen kunnen op basis van statistiek allerlei verbanden worden blootgelegd tussen de moleculaire data en de mate van cytotoxiciteit van geneesmiddelen.
Lodewyk Wessels vertelt dat in samenwerking met de groep van dr. Mathew Garnett van het Britse Wellcome Sanger Insitute in 926 uit diverse tumortypen geïsoleerde, goed gekarakteriseerde cellijnen de respons is bepaald op 265 antikankermiddelen. “Door de concentraties stapsgewijs te verhogen en het percentage levende cellen te kwantificeren bepaalde men voor elke cellijn en middel de IC50, de concentratie waarbij de helft van de cellen dood is. De vraag was nu hoe goed moleculaire data kunnen voorspellen of de IC50 laag wordt (gevoelig) of hoog (resistent).”
TANDEM
Het combineren van verschillende typen data gebeurt doorgaans met een statistische methode die bekend staat als Elastic Net Regression (ENR). Deze klassieke methode kan omgaan met alle typen moleculaire data. Het probleem is dat daar altijd weer modellen uitrollen die hoofdzakelijk zijn gebaseerd op de genexpressiedata (mRNA-bepalingen) – de andere bovengenoemde datatypen blijken daaraan ondergeschikt. Wessels: “Een BRAF-mutatie in melanoomcellen activeert via een cascade aan signaaloverdrachten de transcriptie van vele genen, dus het mag niet verbazen dat die genexpressies de respons op het op BRAF-mutanten aangrijpende vemurafenib voorspellen. Het punt is alleen dat een veelheid aan genexpressies, vaak ook nog van onbekende genen, buitengewoon lastig te interpreteren is. Het is zelden eenduidig.
Om nu toch meer informatie te krijgen uit die andere moleculaire data stelt Wessels een tweestapsbenadering voor: eerst de datatypen gebruiken die aan die genexpressie ten grondslag liggen (stroomopwaartsdata als mutaties, methylering en CNA) en pas in tweede instantie de genexpressiedata erbij betrekken. “Een mutatie heeft immers effect op de transcriptie van alle stroomafwaarts gelegen genen. Ons nieuwe rekenprogramma, TANDEM gedoopt, betrekt eerst DNA-mutaties, -methyleringen, CNA en kankertypering in de analyse, om op basis daarvan de beste verklaring te zoeken voor de geneesmiddeleffecten. Waar dan de verklaringen tekortschieten, worden vervolgens als tweede stap de genexpressiedata in stelling gebracht.
Genexpressie wordt dus in de analyse veel minder dominant, al levert het nog steeds een zeer relevante bijdrage. Het blijkt dat TANDEM wat betreft voorspellende kracht niet onderdoet voor de klassieke benadering, maar wel veel beter de cellulaire signaleringsroutes identificeert, vaak routes die men al goed begrijpt. We hebben kunnen vaststellen dat TANDEM twee tot drie keer informatiever is waar het gaat om geneesmiddel-responsmechanismen.”1 Wessels noemt een voorbeeld: “In geval van middelen gericht tegen het eiwit MAPK komt bij de ENR-methode de BRAF-mutatie naar voren en daarnaast de expressie van talloze vage genen. TANDEM wijst eveneens op een BRAF-mutatie, maar ook op mutaties in KRAS en NRAS en op een grotere gevoeligheid van bepaalde tumortypen. Op die manier haal je dus méér relevante informatie uit de data.”
Proteomics
En wat is de plek van eventuele data over eiwitexpressie en -modificatie (proteomics- of fosfoproteomicsdata)? “Proteomics identificeert biomarkers die zich onderscheiden van genexpressie. Uit ons model blijkt dat proteomics ten opzichte van genexpressie een onafhankelijke voorspeller is van de respons op een middel. Dus als we alleen genexpressiedata gebruiken om die respons te voorspellen, krijgen we niet het volledige plaatje.”
Hoe past proteomics dan in de TANDEM-structuur? Moet men, na als eerste stap de mutaties, methylering, CNA en kankertype te hebben geanalyseerd, geneesmiddelresponsen die daarmee niet voorspeld kunnen worden eerst aanpakken met proteomicsdata en wat dan nog aan onduidelijkheden overblijft met genexpressiedata? Of moet men de volgorde van die laatste twee datasets juist omdraaien? “In het ENR-model worden stroomopwaartsdata zoals we zagen nooit als voorspellers geselecteerd, maar als je er, in het TANDEM-model, proteomicsdata aan toevoegt, dan blijken deze laatste wel degelijk een belangrijke rol te spelen in het verklaren van de geneesmiddelrespons. In het TANDEM-model komt daar dan de voorspellende kracht van stroomopwaartsdata bij. Als we proteomics gebruiken vóór genexpressie, dan identificeren we in het laatste stadium biomarkers die uniek zijn voor genexpressie, want die kunnen we niet verklaren uit proteomics- of stroomopwaartsdata. Als we bijvoorbeeld kijken naar DNA-beschadigende middelen, dan is expressie van SLFN11 een goed voorbeeld van een biomarker die geheel niet vervat zit in stroomopwaartsdata en ook niet in proteomicsdata. Worden proteomics en genexpressie in het TANDEM-model omgedraaid, dan vinden we juist biomarkers die uniek zijn voor proteomics, zoals bijvoorbeeld het geval is met ABC-transporters, cellulaire membraaneiwitten die verantwoordelijk zijn voor het weer naar buiten pompen van de geneesmiddelen.”
Referentie
1. Aben, N, et al. Bioinformatics 2016;32:i413-20.
Dr. Jan Hein van Dierendonck, wetenschapsjournalist
Oncologie Up-to-date 2018 vol 9 nummer 2