Hoe data science GSK helpt bij de digitalisatie van de laboratoria

De race naar nieuwe geneesmiddelen en vaccins zet de farmasector al jaren onder druk. In de huidige coronacrisis neemt die druk meer dan exponentieel toe. Ook bij farmareus GlaxoSmithKline (GSK). Kan technologie hen helpen om de ontwikkeling van nieuwe vaccins te versnellen? Kan technologie hen helpen bij het automatiseren en verbeteren van processen in de labo’s? Ordina toonde aan van wel: de data scientists automatiseerden als bewijs één van de labotesten aan de hand van Machine Learning – met een indrukwekkende tijdwinst en verbeterde accuraatheid als resultaat!

GSK, het vijfde grootste farmabedrijf ter wereld, focust zich in België op de ontwikkeling van vaccins: de GSK-site in Waver is zelfs de grootste vaccinproductiesite ter wereld. De ontwikkeling van zo’n vaccin is een ontzettend tijdrovend proces, dat tot 15 jaar in beslag kan nemen. Daarom wil GSK onder meer in Waver inzetten op automatisatie. De farmareus klopte bij Ordina aan vanwege de uitstekende reputatie in de sector lifesciences.

Labotests met flowcytomer automatiseren

“GSK riep onze hulp in voor het automatiseren van een labotest met de flowcytometer – een toestel dat de grootte, vorm en fysische en chemische eigenchappen van cellen meet en analyseert”, legt Kimberly Hermans van ons data-science-team uit.

Flowcytometrie is een vaakgebruikte techniek bij het testen van geneesmiddelen en vaccins. Kort samengevat werkt het zo: een vloeistofmonster met cellen wordt in een cytometer geplaatst en door een bundel laserlicht geleid, waarna  detectoren de kenmerken van de cellen identificeren en de deeltjes tellen en kwantificeren. Na die test selecteren onderzoekers de nuttigste cellen. “Die selectie – gating genoemd – gebeurt in vier stappen, allemaal manueel”, aldus Kimberly. “Dat proces hebben wij volledig geautomatiseerd aan de hand van datamodellen en technieken als clustering en anomaliedetectie.”

Sneller, accurater en met meer inzichten

Het resultaat? Waar een onderzoeker vroeger 30 tot 40 minuten tijd nodig had per test, is de test nu in 5 minuten afgerond, zonder tussenkomst van een wetenschapper. De resultaten zijn bovendien accurater dan met de manuele selectie. Daarnaast is een pak extra documentatie beschikbaar: in elke stap van het gatingproces worden automatisch statistieken gegenereerd (bv. over het aantal uitgesloten cellen, gedetecteerde clusters, enz.) die ook nog eens gevisualiseerd worden. “Dankzij die datavisualisaties krijgen de onderzoekers inzichten in de beslissingen die het algoritme neemt. Dat helpt hen om de gatingprocedures verder te verbeteren en te verfijnen”, legt Kimberly uit.

Het resultaat: waar een researcher vroeger 30 tot 40 minuten nodig had per test, is de test nu in 5 minuten afgerond, zonder tussenkomst van de onderzoeker.

Verder optimaliseren en verfijnen

De proof of concept die Ordina voorlegde, werd enthousiast onthaald. In de toekomst zullen ordina en GSK de gatingalgoritmes verder verbeteren om een nog nauwkeurigere selectie van cellen en deeltjes mogelijk te maken. Het algoritme wordt ook verder verfijnd zodat het parallel voor meerdere kernen kan worden gebruikt. Dat zal voor nog meer tijdwinst zorgen. Ordina zorgt er ook voor dat alle data veilig worden opgeslagen in databases, zodat ze vlot toegankelijk zijn voor wie ermee aan de slag wil. Naast de gatingalgoritmes, zijn er nog veel andere testen die geautomatiseerd kunnen worden door middel van Data Science, Data visualisatie en Robotics.

Van compliance tot innovatie

Ordina is in de farmawereld vooral bekend voor zijn expertise in compliance en validatie. Maar meer en meer komen daar ook andere projecten bij. Wij kennen de sector immers door en door. Door die ervaring en expertise te combineren met onze kennis van IT en nieuwe technologie zoals data science kunnen we heel mooie resultaten boeken”, besluit Kimberly.  “Datawetenschap biedt alvast een enorm potentieel voor de farmasector en de gezondheidssector tout court. Door data te bundelen, er patronen in te zoeken en er voorspellende modellen op los te laten, kunnen we processen en behandelingen verregaand optimaliseren en supporteren – met voordelen voor de sector en uiteraard ook voor de patiënten.”

Door data te bundelen, er patronen in te zoeken en er voorspellende modellen op los te laten, kunnen we processen en behandelingen verregaand optimaliseren en supporteren