Comment la science des donnees aide-t-elle GSK dans la numerisation de ses laboratoires

La course aux nouveaux médicaments et vaccins met le secteur pharmaceutique sous pression depuis des années. Cette pression augmente de manière plus qu’exponentielle dans l’actuelle crise du coronavirus. Même le géant pharmaceutique GlaxoSmithKline (GSK) n’y échappe pas. La technologie peut-elle les aider à accélérer le développement de nouveaux vaccins ? La technologie peut-elle les aider à automatiser et améliorer les processus dans les laboratoires ? Ordina a démontré que oui : les data scientists ont pour preuve automatisé un des tests de laboratoire à l’aide du Machine Learning – avec pour résultat un impressionnant gain de temps et une précision accrue !

GSK, la cinquième plus grande entreprise pharmaceutique au monde, se concentre en Belgique sur le développement de vaccins : le site GSK de Wavre est même le plus grand site de production de vaccins au monde. Le développement d’un vaccin est un processus extrêmement chronophage pouvant prendre jusqu’à 15 ans. C’est pourquoi GSK souhaite miser sur l’automatisation, à Wavre notamment. Le géant pharmaceutique s’est adressé à Ordina au vu de son excellente réputation dans le secteur des sciences de la vie.

Automatisation des tests de laboratoire avec un cytomètre en flux

« GSK a demandé notre aide pour l’automatisation d’un test de laboratoire mené avec un cytomètre en flux – un appareil qui mesure et analyse la taille, la forme et les propriétés physiques et chimiques des cellules », explique Kimberly Hermans, de notre équipe data-science.

La cytométrie en flux est une technique largement utilisée dans les tests de médicaments et de vaccins. Son fonctionnement en deux mots : un échantillon de fluide contenant des cellules est placé dans un cytomètre et passé à travers un faisceau laser, après quoi des détecteurs identifient les caractéristiques des cellules, comptent et quantifient les particules. Après ce test, les chercheurs sélectionnent les cellules les plus utiles. « Cette sélection – appelée gating – se fait en quatre étapes, toutes manuelles », nous dit Kimberly. « Nous avons entièrement automatisé ce processus à l’aide de modèles de données et de techniques telles que le clustering et la détection des anomalies. »

Plus rapide, plus précis et plus compréhensible

Le résultat ? Là où un chercheur avait besoin de 30 à 40 minutes par test, l’automatisation le boucle en 5 minutes, sans intervention d’un scientifique. Les résultats sont en outre plus précis qu’avec la sélection manuelle. Une grande quantité de documentation supplémentaire est par ailleurs disponible : à chaque étape du processus de gating, des statistiques sont automatiquement générées (ex : sur le nombre de cellules exclues, les clusters détectés, etc.), lesquelles sont également visualisées. « Grâce à ces visualisations de données, les chercheurs comprennent les décisions prises par l’algorithme, ce qui les aide à améliorer et affiner encore les procédures de gating », explique Kimberly.

Le résultat: là où un chercheur avait besoin de 30 à 40 minutes par test, l’automatisation le boucle en 5 minutes, sans intervention du chercheur.

Optimalisation et perfectionnement continus

La proof of concept (preuve de concept) avancée par Ordina a été accueillie avec enthousiasme. Ordina et GSK vont encore améliorer les algorithmes de gating à l’avenir, afin de permettre une sélection encore plus précise des cellules et des particules. L’algorithme sera par ailleurs encore affiné de manière à pouvoir l’utiliser en parallèle sur plusieurs noyaux, pour plus de gain de temps encore. Ordina veille également à ce que toutes les données soient enregistrées dans des bases de données sécurisées,  pour qu’elles soient rapidement accessibles à ceux qui veulent les utiliser. Parallèlement aux algorithmes de gating, de nombreux autres tests peuvent également être automatisés à l’aide de la science des données, de la visualisation des données et de la robotique.

De la conformité à l’innovation

« Ordina est surtout réputée dans le monde pharmaceutique pour son expertise en conformité et en validation. Mais nous recevons de plus en plus d’autres projets. Il est vrai que nous connaissons parfaitement le secteur. En alliant cette expérience et cette expertise à nos connaissances en IT et en nouvelles technologies telles que la science des données, nous sommes capables d’obtenir de très beaux résultats », conclut Kimberly.  « La science des données offre déjà un énorme potentiel au secteur pharmaceutique et au secteur de la santé tout court. En compilant des données, en y cherchant des schémas et en y faisant passer des modèles prédictifs, nous pouvons considérablement optimaliser et soutenir des processus et des traitements – ce qui présente des avantages pour le secteur et évidemment pour les patients. »

En compilant des données, en y cherchant des schémas et en y faisant passer des modèles prédictifs, nous pouvons considérablement optimaliser et soutenir des processus et des traitements.