Contexte et problématique
Le pôle R&D en biostats d’un laboratoire pharmaceutique de renommée mondiale, constate l’inefficacité des méthodes existantes de classification de cancer. Le métier a besoin également de pouvoir interpréter les résultats obtenus.
Objectifs
Prouver la plus value du deep learning dans la classification d’images médicales même sur de petits échantillons (<2000 images). Fournir un modèle interprétable : le métier doit être capable de comprendre le choix du modèle. Classifier ces images selon 4 catégories de cancer : Poumon, Sein, Prostate et Côlon.
Notre intervention
1 Data Scientist et 1 Data Engineer en mode SCRUM
- Création et nettoyage du jeu de données
- Préparation de la donnée (normalisation, data augmentation à la volée, etc…)
- Modélisation à l’aide d’un Réseau de Neurones Convolutif (CNN) et plus précisément un modèle ResNet avec du transfer learning et du progressive resizing
- Interopérabilité du modèle (matrice de confusion, accuracy, precision, recall, heatmap, etc…)
Résultats
Environnement technique
Python, Jupyter Lab, Pytorch, FastAI, Plotly
Azure
Api Rest
Networkx
Dash
Scrum