Contexte et problématique
Trouver de nouveaux médicament brevetables est de plus en plus difficile, et la réalisation manuelle de ce type de recherche commence à montrer ses limites. L’utilisation de l’IA pour suggérer des axes de recherches pourrait donc grandement accélérer la création de nouveaux médicaments.
Objectifs
À partir des nombreuses publications médicales et essais cliniques, déceler des correlations entre médicaments afin de créer des nouvelles combinaisons de molécules plus efficaces.
Egalement profiter de ce projet pour mettre à disposition de l’entreprise une API de recherche de publications efficace, centralisée, et non limitée en terme de nombre de requêtes.
Notre intervention
2 Data Scientist, 1 Data Engineer
- Extraction, nettoyage de données puis indexation et « serving » de ces données à l’aide de l’indexeur Azure
- Création d’une base de donnée graphe à partir de relations entre molécules et publications (disponibles grâce à l’indexeur Azure)
- Création d’une application visuelle qui affiche des sous-parties de cette base de donnée graphe
Résultats
Des APIs disponibles pour accéder efficacement à toutes les publications médicales et essais cliniques !
Une application de data visualisation pour aider les équipes techniques à rechercher les publications et molécules intéressantes, ainsi qu’à visualiser les liens entre elles.
Environnement technique
Azure – Api Rest – CosmosDb – Gremlin – Python – Networkx – Plotly – Dash