Data Science

La puissance du Machine Learning au service du métier

Le Machine Learning (ML), l'Intelligence Artificielle (IA ou AI), la Data Science, autant de mots-clés qui sont entrés dans le quotidien de chacun et qui sont sur toutes les lèvres.

Comment s'y retrouver? 

L'Intelligence Artificielle est de manière brièvement résumée la capacité des machines à reproduire les capacités d'un cerveau humain, tel que la lecture, la reconnaissance vocale et l'analyse des sentiments. Les concepts existaient déjà dans les années 1950. 

Par Machine Learning, on entend la capacité des algorithmes à apprendre à partir des données. Certains de ces algorithmes existent en mathématiques et en statistiques depuis bien longtemps, mais c'est par la combinaison avec l'explosion du volume des données, des performances, et de leur utilisation au fil de l'eau en production, que la terminologie prend son sens.

Et la Data Science ? Chez Synotis, nous pensons que c'est la clef pour allier le meilleur de l'IA et du ML dans le monde de l'entreprise. La Data Science, c'est mettre les meilleurs algorithmes de Machine Learning  au profit de problématiques métiers. Ils ont la capacité de déterminer des patterns qu'un humain ou que des approches traditionnelles ne peuvent trouver.

On tend à considérer le Machine Learning comme un moyen de réaliser de la Data Science au sein d'une entreprise et de générer de la valeur.

Métaphoriquement, si votre besoin est de pouvoir vous déplacer, le Machine Learning est un type de moteur que votre voiture pourra utiliser. Mais un autre type de moteur pourra fonctionner. Ou peut-être pouvez-vous marcher ou utiliser un vélo?

Vision de la Data Science, inspirée du diagramme de Drew Conway. Des visions plus complexes existent, par exemple ici.

Préparation des données

La qualité des données à disposition pour l'apprentissage est cruciale. D'autre part, un travail de Data Preparation propre à une approche ML est souvent un élément clé. Cela va de pair avec une très bonne compréhension de la problématique métier.

Mise en place des algorithmes

Les librairies permettent d'implémenter de façon de plus en plus rapide les modèles.

La méthodologie ainsi que les connaissances théoriques sont déterminantes pour le choix des algorithmes, l'optimisation des hyper-paramètres et l'interprétation des résultats. 

De bonnes métriques

La détermination de(s) meilleure(s) métrique(s) pour le cas d'usage est nécessaire. Il n'y a pas de métrique absolue. Cela dépendra d'une part du type de problématique (régression, classification), mais surtout de l'impact sur le métier en cas de métrique mixte. Par exemple, quel est le coût d'un faux positif ?

Interprétation des résultats

Au delà des scores des métriques, comment peut-on expliquer les résultats et comment peut-on présenter les résultats au métier et générer de la valeur?

Comment peut-on interpréter les variables déterminantes, existe-il des leviers d'action ? 

Monitoring et actions

Un défi propre aux algorithmes de type ML est qu'ils peuvent continuer d'apprendre après la mise en production.  En particulier, la qualité pourrait se dégrader en cas d'arrivée de données de mauvaises qualité. Il est important de pouvoir monitorer ceci et prendre des actions en cas de dégradation trop marquée.

Vers du MLOps

Le MLOps porte plusieurs enjeux, notamment post-production, qui le distinguent d'approche CI/CD classiques. On citera par exemple la nécessité de versionner ses jeux de données. 

 

Et également, comment industrialiser et passer à l'échelle ? 

 

Une vision data d'un projet ML

Ces dernières années, les librairies se sont grandement démocratisées, permettant à tout développeur d'appliquer des modèles complexes en quelques lignes.

La méthodologie de travail, le recul sur les outils et la qualité des développements sont alors déterminants. 

La donnée est au centre de tout. Mais comment s'articulent les différentes étapes d'un projet incluant du Machine Learning? 

Et quels sont les défis propres à des projets de type Machine Learning ? 

Comment s'assure-t-on qu'il n'y a pas de perte de qualité post-production? 

Une vision métier d'un projet ML

Persuadés que le métier doit être au cœur d'un projet, pour ne pas aller vers des dérives techniques (algorithme trop complexe, problématique non cruciale, projet non pertinent).  

La Data Science sans métier c'est quoi ?

  • C'est des algorithmes très puissants mais qui ne répondent pas à une problématique, donc sans génération de valeur.
  • C'est un moteur performant, mais sans véhicule
  • C'est un projet qui plaira aux Data Scientists, mais qui ne sera qu'un projet parmi d'autres à échouer

Définition de la problématique métier

Pour tout projet, on doit partir d'un besoin métier, d'un constat. Après une phase d'élicitation des besoins, on détermine les bases nécessaires du projet. On regarde l'existant, et on se pose la question de savoir pourquoi une approche contenant du Machine Learning sera pertinente.

Support à la data préparation

Les algorithmes doivent pouvoir apprendre de manière autonome et ne pas réitérer des biais humain, c'est une certitude. 

Néanmoins, les connaissances métiers sont cruciales lors de la préparation pour fournir les meilleures features possibles. 

 

Appui lors des développements

Portés par les concepts de la méthodologie Agile, nous sommes convaincus que le métier doit être consulté lors des phases de développement. 

Forts des retours et de l'expertise, la qualité des développements ne peut être que meilleure.

Interprétation des résultats

Les développements ont permis de fournir les résultats selon des métriques.

Quel sens cela a-t-il pour mon métier? Peut-on mesurer l'impact d'un faux positif, d'un faux négatif ? 

Est-ce que les algorithmes fournissent au métier des leviers d'action?

Ressenti post-production

Les algorithmes continuent d'apprendre et doivent être monitorés en production .
Mais qu'en est-il du ressenti de la part des utilisateurs  ? Constatent-ils une dégradation dans la qualité des résultats, qui ne seraient peut-être pas capturées par les métriques de monitoring?

Amélioration ?

Les résultats sont perceptibles, et l'objectif est rempli. 

Le métier, fort de son implication dans le projet et de son expertise du quotidien, peut être force de proposition sur des adaptations à réaliser. Un nouveau cycle de développement est mis en place.

François : Consultant Data

François A.

Expert Data Science
Avancer conjointement et par étapes, tout en ayant la vision globale.

Le mot de l’expert en Data Science

Convaincu qu'une réelle plus-value est possible de par la capacité des algorithmes d'apprendre à partir des données et de trouver des patterns que les approches plus classiques ne pourront pas trouver. 

Convaincu également que pour une réalisation compatible avec les enjeux d'une organisation, il est essentiel d'avancer de manière raisonnée et en collaboration avec le métier. Ceci pour une mise en place pertinente, au-delà des tendances actuelles entourant l'intelligence artificielle et ses dérivés.

Vous aussi vous souhaitez travailler avec nous ?

Contactez-nous

Le processus Synotis : comment ça marche?

Remplissez le formulaire ci-dessus

Rencontrons-nous lors d’un rendez-vous

Notre expert recueille votre besoin

Nous construisons une proposition adaptée

Commençons l’aventure ensemble !

Ceci pourrait vous intéresser

Nos prestations

Catalogue de données
Catalogue de données

Initiez facilement votre Gouvernance et dressez un panorama de votre écosystème data.

Data Architecture

Garantir la qualité, l'intégrité et la sécurité des données, pour optimiser leur valeur actuelle et future.

Data Exchange
Data exchange

Faciliter la circulation de vos données en toute sécurité en plaçant la data au cœur de vos échanges.​

Data Gouvernance

À l'heure du Big Data, la gouvernance des données s’inscrit dans la stratégie d’entreprise.

La Data Visualisation , un véritable outil de compréhension et d’aide à la décision
Data Virtualisation

Des données non répliquées pour des prises de décision agiles et des coûts réduits.

Data Visualisation

Des représentations visuelles de vos données pour en faciliter la compréhension et se concentrer sur l’essentiel.

Référentiel de données pour un partage et une gestion fiable
Référentiel de données

Une donnée « certifiée exacte » à travers tout le système d’informations et toutes les applications.

La refonte de processus
Refonte de processus

Repenser le rôle de la donnée pour placer sa qualité au cœur de la création de valeur.

Elicitation des besoins
Business Analyse (BA)

Faire émerger l’ensemble de vos besoins pour identifier la meilleure solution possible.

La chefferie de projet est une alliance de contrôles et coordination pour une gestion maîtrisée
Chefferie de projet

Externaliser cette aventure humaine pour sécuriser la mise en œuvre de vos projets.

Feuille de route informatique
Feuille de Route

Définir le cap à suivre, les objectifs et les échéances de mise en œuvre de vos projets stratégiques.

Placer l’automatisation des processus au service des métiers
Robotic Process Automation (RPA)

La RPA est une technologie visant à reproduire et d’optimiser l'intervention humaine.

Test & Qualité projet informatique
Qualité et Test

Se doter d’un tableau de bord de suivi et d’automatisation des tests et placer gestion de la qualité au coeur du projet