Acht maanden druk met werk en onderzoek, zal niet veel anders doen

— door Evert Mouw

Per 1 oktober 2011 ga ik parttime werken en een wetenschappelijke eindstage lopen. Wat ga ik daar precies doen? Hieronder hopelijk een begrijpelijke uitleg voor wie het weten wil.

Ik ga me bezighouden met enkele van mijn grote passies. Dat zijn computers, netwerken, Linux, privacy, en medische toepassingen. Mijn afstudeerscriptie bij politicologie ging ook al over health privacy. Nu ga ik kijken hoe we die health privacy kunnen waarborgen tijdens medisch wetenschappelijk onderzoek. Bovendien zal ik daarbij van alles leren over clusters en grids.

Wat voor ziekte heb je? Met een DNA analyse kan steeds vaker een diagnose gesteld worden. Die DNA gegevens krijgen was altijd erg bewerkelijk, maar de kosten in tijd en geld om voor DNA sequencing worden steeds lager. DNA bevat enorm veel ruwe data. Al die data verwerken is voor een computer niet gemakkelijk. Daarom wordt de data vaak in stukjes gehakt en worden een heleboel computers tegelijk gebruikt. Elke computer krijgt dan een klein stukje van de rekentaak (embarrassingly parallel). Dat in stukjes hakken van de rekentaak is simpel omdat DNA in feite bestaat een lange reeks codes.

Hetzelfde verhaal gaat ook op voor high-resolution CT scanners en moderne MRI scanners. Het beeldmateriaal wordt steeds scherper. Het doen van een goede analyse gaat niet meer met een enkele computer. Dat duurt veel te lang. Als je het 3D beeld in stukjes snijdt, en iedere computer ene plakje geeft, dan gaat het een stuk sneller. Maar ik welke richting snij je? Misschien wil je wel in meerdere richtingen snijden en de procedure zo een paar keer herhalen. Maar dat kost dus weer meer rekentijd.

De hoeveelheid rekenkracht die nodig is kan behoorlijk groot zijn. Veel academische ziekenhuizen hebben al eigen clusters. Zo’n cluster kan bestaan uit tientallen tot honderden computers die allemaal tegelijk op een rekenopdracht gezet kunnen worden. Toch is zelfs dat soms niet genoeg.

motor
Ik heb weer een motor; handig voor naar het AMC

Sterrenkundigen, natuurkundigen en andere wetenschappers lopen tegen dezelfde problemen aan. Dat komt niet alleen omdat er steeds meer data is, maar ook omdat moderne statistische methoden zoals bootstrapping en clustering veel rekentijd vragen. Daarom is er in Europa een netwerk van computerclusters die met elkaar verbonden zijn: het Europese grid. Duizenden computers (nodes) kunnen voor een rekentaak ingezet worden. Wat zou het handig zijn als we die capaciteit zouden kunnen gebruiken voor medische toepassingen!

Helaas, dat gaat niet zomaar. Er is zoiets als het medisch geheim. En medische data is vaak goed herleidbaar naar een persoon. Dus zonder extra maatregelen kun je als ziekenhuis geen gebruik maken van externe computercapaciteit. Die extra maatregelen kunnen gebaseerd zijn op vertrouwen. Je kunt bijvoorbeeld een contract sluiten met een externe partij, waardoor die partij juridisch verplicht is tot geheimhouding van de data. Je kunt ook technische maatregelen nemen, maar dat is lastig omdat de externe computers ook in extern beheer zijn. Als je de data versleuteld dan kun je er geen analyses meer mee doen. Hoewel, is dat zo? Er is een encryptiemethode (homomorf) in de testfase die dat misschien wel toestaat.

Per 1 oktober 2011 ga ik de laatste fase van mijn studie medical informatics in. Ik ga voor mijn wetenschappelijke stage onderzoeken of het mogelijk is op een veilige manier gebruik te maken van het grid. Eerst zal ik kijken wat de wettelijke en morele eisen zijn op het gebied van informatiebeveiliging en privacy. Vervolgens kijk ik naar organisatorische en technische mogelijkheden om de veiligheid te vergroten. Het einddoel is het veiliger gebruik kunnen maken van externe rekencapaciteit voor biomedisch onderzoek. De ambitie is hoog, en het risico op falen dus ook. Maar dit heeft nu eenmaal mijn interesse, en ik wil in ieder geval een stevige poging wagen.

Ook zal ik 20 uur per week erbij werken om e.e.a. te kunnen financieren. Mijn werkplek zit op dezelfde plek als mijn wetenschappelijke stage. Ik zal de server die gebruikt wordt om op het grid te komen gaan beheren. Ook zal ik gebruikers van het grid, vooral biomedische onderzoekers, bioinformatici en statistici, ondersteunen. Verder zal ik als een halve zwerver leven. Ik zal overal en nergens slapen, misschien soms op een camping, maar meestal bij mijn ouders waar ik nog een fijne kamer heb. Met een motor is het zelfs erg leuk en avontuurlijk om half nomadisch te leven. Ik heb een oude Honda Pan European aangeschaft: de ideale reismotor. Met kamperen en motorrijden heb ik veel ervaring; ik heb er dan ook veel zin in. En als ik er een keer geen zin in heb, dan is mijn kamer op een uur rijden gaans.

Wel wordt het hard werken. Ik zal slechts zelden tijd hebben voor sociale- en verenigingsactiviteiten, politieke discussies, bloggen, enzovoorts. Dus hoor je een paar maanden niets van mij: wanhoop niet, ik ben even druk bezig met mijn grote interesses. Mijn mail lees ik wel regelmatig.

     

Facebook Comments

één reactie

  1. avatar
    Ward
    2011-10-03

    Hoi Evert,

    Mocht je een keer willen douchen en slapen in een warm bed, wij hebben in Zeist een logeerkamer beschikbaar

    Succes met de stage! Ben erg benieuwd naar het uiteindelijke resultaat. Vooralsnog denk ik dat homomorf niet werk. Want als “iets” bij data kan om het te analyseren, dan kan daar vermoedelijk ook “iets anders” bij wat het onveilig maakt.

    Groetjes
    Ward

    P.S. jouw site herkende mij maar ik kon geen reactie plaatsen ivm “Geen captcha code ingevoerd” maar die optie had ik als ingelogde ook niet.

Reacties Gesloten