You are here: Home > About Us > People > Nico Verbeeck

Nico Verbeeck

Nico Verbeeck

Research

Datamining van massaspectrale beeldvormingsdata in een biomedische context

Korte inhoud: 

Massaspectrale beeldvorming of Imaging Mass Spectrometry (IMS) is een krachtige moleculaire beeldvormingstechnologie die het mogelijk maakt om de spatiale verdeling van biomoleculen in een weefselsnede te analyseren. Met deze technologie kunnen duizenden moleculen gevolgd worden doorheen het weefsel in één enkel experiment, en kan de biomoleculaire inhoud van verschillende zones in het weefsel vergeleken worden zowel op het niveau van lage-massa metabolieten en lipiden als op dat van hoge-massa biomacromoleculen zoals proteïnen. IMS vereist geen voorafgaande hypothese over een mogelijk doelwit-molecule aangezien er op geen enkel moment nood is om de moleculen te merken, wat dit tot een immens waardevolle techniek maakt voor exploratief onderzoek. Een IMS analyse leidt echter tot zeer grote hoeveelheden complexe en hoog-dimensionele data voor de analyse van een enkele weefselsnede, met bestandgroottes van gigabytes en recentelijk zelf terabytes aan data. Dit maakt dat handmatig bestuderen van deze data zogoed als onuitvoerbaar wordt, zeker in de context van een exploratieve studie. Daarom is er een grote nood aan rekenkundige methoden om de kostbare biomoleculaire informatie, die vervat zit in deze gigantische hoeveelheid data, te ontginnen. 

Omwille van de complexiteit van IMS data zijn er verscheidene rekenkundige problemen die moeten opgelost worden, en in dit werk zullen we ons richten op drie hiervan in het bijzonder: kenmerk-selectie en dimensionaliteitsreductie, differentiële analyse van IMS data afkomstig van verschillende experimenten en data fusie van IMS data met bijkomende databronnen.

In ons werk over kenmerk selectie en dimensionaliteitsreductie wordt de toepassing van de Discrete Wavelet Transformatie (DWT) bestudeerd als een alternatief voor “peak picking” voor dimensionaliteits- en datagrootte-reductie. Door de DWT te gebruiken kunnen we alle nuttige informatie in het massaspectrum behouden, en toch een sterke vermindering van de oorspronkelijke data-grootte verkrijgen. Dit doen we door alleen die delen van de data te verwijderen die ruis bevatten en daardoor onnodige opslagruimte innemen en die bovendien door hun toegevoegde dimensionaliteit de rekenkundige analyse belemmeren. De juiste selectie van welke delen van de data nu veroorzaakt worden door ruis en welke door reëel biologisch signaal is hierbij cruciaal. Daarom wordt een essentiëel element van IMS data gebracht, namelijk spatiale informatie, betrokken in het selectieproces. Twee manieren om deze spatiale informatie te incorporeren, worden onderzocht: namelijk het gebruik van globale en locale spatiale informatie.  Beide methoden leveren een verbeterde feature selectie in vergelijking met traditionele methoden die deze informatie niet in rekening nemen. De nieuw-ontworpen methoden zijn in staat om beter delen van de data te behouden die echt biologisch signaal bevatten, en kunnen een betere data compressie en dimensionaliteitsreductie leveren door meer delen van de data te verwijderen.

In het tweede deel van dit werk richten we ons op de rekenkundige vergelijking van IMS data afkomstig van meerdere weefselsnedes. Het uitvoeren van zulke vergelijking is verre van triviaal omwille van de grote heterogeniteit en de grootte van de IMS datasets. We introduceren daarom een methode genaamd Group Independent Component Analysis (GICA) om deze analyse succesvol uit te voeren. Deze methode maakt een gedetailleerde vergelijking van een groot aantal IMS datasets mogelijk zonder dat “peak picken” noodzakelijk wordt, en maakt het mogelijk om karakteristieke biomoleculaire patronen te extraheren uit de volledige IMS van één enkele weefselsnede. Door deze extractie op het niveau van één enkele weefselsnede te doen, zorgt GICA voor een versterking van weefsel-specifieke kenmerken die mogelijk verloren zouden gaan in een analyse waar alle weefsels tegelijkertijd in rekening worden gebracht. De correcte werking van het algoritme wordt aangetoond door middel van een artificiële dataset, die gegevens van vijftien weefsels bevat, verdeeld over drie verschillende klasses. Hierbij zien we dat het algoritme bijna perfect de patronen kan extraheren die de drie klasses van elkaar onderscheiden, en dit in de correcte locaties in het weefsel. Vervolgens passen we deze techniek toe op twee gemeten IMS datasets, namelijk een casus van Amyotrofe Laterale Sclerose (ALS) in muis-ruggengraat en een casus van retinale degeneratie in muis-retina. Toepassing van het GICA algoritme op deze datasets maakte het mogelijk om meerdere biomoleculaire patronen te extraheren die de verschillende weefselklasses van elkaar konden onderscheiden, en die tot uitdrukking kwamen in de biologisch-relevante regio's van het weefsel voor de bestudeerde ziektes. 

Het derde en laatste topic dat we verkennen is de datafusie van IMS data met bijkomende databronnen. Door IMS data te combineren met externe databronnen wordt het mogelijk om rijkere datasets te creëren en een dieper inzicht te verkrijgen in de IMS data. In dit werk tonen we dit aan door IMS data direct te koppelen met een anatomische atlas, namelijk de Allen Mouse Brain Atlas (AMBA). Dit maakt een directe, computationele toegang mogelijk tot een belangrijke informatie bron waar een menselijke interpretatie van IMS data vaak van nature op zal berusten, namelijk anatomische informatie. We leggen de voorgestelde link door de IMS data spatiaal met de atlas te registreren met behulp van niet-rigiede beeldregistratietechnieken, en gebruiken de gelegde link vervolgens om spatiale correlaties tussen de ionbeelden afkomstig uit IMS en de anatomische structuren afkomstig uit de atlas te onderzoeken, om op die manier fundamentele inzichten te verwerven. Vervolgens gaan we verder dan het gebruik van eenvoudige correlatie, en gebruiken we de informatie in de altas om de ionbeelden van de IMS data automatisch anatomisch te interpreteren. We lossen deze uitdaging op door deze interpretatie te beschrijven als een convex optimisatieprobleem dat de spatiale ion verdelingen vertaalt naar combinaties van de gekende anatomische structuren. We tonen aan dat een link leggen tussen een IMS experiment en een anatomische atlas kan dienen als een belangrijke katalysator voor zowel menselijke en gecomputeriseerde verkenning van IMS experimenten.

Promotor: Prof. dr. ir. B. De Moor

Co-promotor: Prof. dr. E. Waelkens

 

Finished projects

    Awards

    Publications

    301 Moved Permanently

    301 Moved Permanently

    Contact information