Contexte et problématique
Client : les équipes en charge de superviser l’activité du support IT.
Besoin : Avoir une vision globale et précise de tous les périmètres pour mieux allouer les ressources, réduire les tickets et être pro-actifs sur des thématiques émergentes/croissantes.
Contrainte : Des données (tickets) non-annotées et pas uniformisées entre les équipes (templates, chat, emails, …)
Objectifs
- Identification des sujets des demandes (tickets) avec 3 niveaux de précision (ex : Outlook – Certificat – Expiration)
- Identification des tendances pour chaque sujet (émergent, constant, plus d’actualité)
- Analyse non-supervisée cohérente avec le retour des responsables de chaque périmètre (difficile à chiffrer car non-supervisé)
Notre intervention
1 Data Architect pour la V1
- Définition / cadrage du projet
- Nettoyage et uniformisation des données
- Analyse des tickets à base de méthodes de Machine Learning non-supervisées :
Clustering des tickets (LDA, DBSCAN, K-Means, …)
Topic Modeling / caractérisation des clusters
Détection de tendances sur les sujets identifiés - Automatisation de l’analyse et du rapport final présentant les résultats
Résultats
V1 réalisé pour 2 périmètres, discussions en cours pour la mise en production et le lancement d’une V2.
- Pour la V1:
Livrable : rapport automatisé
Sujets identifiés & degré de précision : OK pour les 2 périmètres
Tendances des sujets : OK pour les 2 périmètres
Environnement technique
Python
Clustering : Scikit-Learn, Gensim
Topic Modeling : Gensim, Wordcloud,
Visualisations / Restitution: Plotly, Jupyter
Jenkins, Git