Data Science
La puissance du Machine Learning au service du métier
Le Machine Learning (ML), l'Intelligence Artificielle (IA ou AI), la Data Science, autant de mots-clés qui sont entrés dans le quotidien de chacun et qui sont sur toutes les lèvres.
Comment s'y retrouver?
L'Intelligence Artificielle est de manière brièvement résumée la capacité des machines à reproduire les capacités d'un cerveau humain, tel que la lecture, la reconnaissance vocale et l'analyse des sentiments. Les concepts existaient déjà dans les années 1950.
Par Machine Learning, on entend la capacité des algorithmes à apprendre à partir des données. Certains de ces algorithmes existent en mathématiques et en statistiques depuis bien longtemps, mais c'est par la combinaison avec l'explosion du volume des données, des performances, et de leur utilisation au fil de l'eau en production, que la terminologie prend son sens.
Et la Data Science ? Chez Synotis, nous pensons que c'est la clef pour allier le meilleur de l'IA et du ML dans le monde de l'entreprise. La Data Science, c'est mettre les meilleurs algorithmes de Machine Learning au profit de problématiques métiers. Ils ont la capacité de déterminer des patterns qu'un humain ou que des approches traditionnelles ne peuvent trouver.
On tend à considérer le Machine Learning comme un moyen de réaliser de la Data Science au sein d'une entreprise et de générer de la valeur.
Métaphoriquement, si votre besoin est de pouvoir vous déplacer, le Machine Learning est un type de moteur que votre voiture pourra utiliser. Mais un autre type de moteur pourra fonctionner. Ou peut-être pouvez-vous marcher ou utiliser un vélo?

Préparation des données
La qualité des données à disposition pour l'apprentissage est cruciale. D'autre part, un travail de Data Preparation propre à une approche ML est souvent un élément clé. Cela va de pair avec une très bonne compréhension de la problématique métier.
Mise en place des algorithmes
Les librairies permettent d'implémenter de façon de plus en plus rapide les modèles.
La méthodologie ainsi que les connaissances théoriques sont déterminantes pour le choix des algorithmes, l'optimisation des hyper-paramètres et l'interprétation des résultats.
De bonnes métriques
La détermination de(s) meilleure(s) métrique(s) pour le cas d'usage est nécessaire. Il n'y a pas de métrique absolue. Cela dépendra d'une part du type de problématique (régression, classification), mais surtout de l'impact sur le métier en cas de métrique mixte. Par exemple, quel est le coût d'un faux positif ?
Interprétation des résultats
Au delà des scores des métriques, comment peut-on expliquer les résultats et comment peut-on présenter les résultats au métier et générer de la valeur?
Comment peut-on interpréter les variables déterminantes, existe-il des leviers d'action ?
Monitoring et actions
Un défi propre aux algorithmes de type ML est qu'ils peuvent continuer d'apprendre après la mise en production. En particulier, la qualité pourrait se dégrader en cas d'arrivée de données de mauvaises qualité. Il est important de pouvoir monitorer ceci et prendre des actions en cas de dégradation trop marquée.
Vers du MLOps
Le MLOps porte plusieurs enjeux, notamment post-production, qui le distinguent d'approche CI/CD classiques. On citera par exemple la nécessité de versionner ses jeux de données.
Et également, comment industrialiser et passer à l'échelle ?
Une vision data d'un projet ML
Ces dernières années, les librairies se sont grandement démocratisées, permettant à tout développeur d'appliquer des modèles complexes en quelques lignes.
La méthodologie de travail, le recul sur les outils et la qualité des développements sont alors déterminants.
La donnée est au centre de tout. Mais comment s'articulent les différentes étapes d'un projet incluant du Machine Learning?
Et quels sont les défis propres à des projets de type Machine Learning ?
Comment s'assure-t-on qu'il n'y a pas de perte de qualité post-production?
Une vision métier d'un projet ML
Persuadés que le métier doit être au cœur d'un projet, pour ne pas aller vers des dérives techniques (algorithme trop complexe, problématique non cruciale, projet non pertinent).
La Data Science sans métier c'est quoi ?
- C'est des algorithmes très puissants mais qui ne répondent pas à une problématique, donc sans génération de valeur.
- C'est un moteur performant, mais sans véhicule
- C'est un projet qui plaira aux Data Scientists, mais qui ne sera qu'un projet parmi d'autres à échouer
Définition de la problématique métier
Pour tout projet, on doit partir d'un besoin métier, d'un constat. Après une phase d'élicitation des besoins, on détermine les bases nécessaires du projet. On regarde l'existant, et on se pose la question de savoir pourquoi une approche contenant du Machine Learning sera pertinente.
Support à la data préparation
Les algorithmes doivent pouvoir apprendre de manière autonome et ne pas réitérer des biais humain, c'est une certitude.
Néanmoins, les connaissances métiers sont cruciales lors de la préparation pour fournir les meilleures features possibles.
Appui lors des développements
Portés par les concepts de la méthodologie Agile, nous sommes convaincus que le métier doit être consulté lors des phases de développement.
Forts des retours et de l'expertise, la qualité des développements ne peut être que meilleure.
Interprétation des résultats
Les développements ont permis de fournir les résultats selon des métriques.
Quel sens cela a-t-il pour mon métier? Peut-on mesurer l'impact d'un faux positif, d'un faux négatif ?
Est-ce que les algorithmes fournissent au métier des leviers d'action?
Ressenti post-production
Les algorithmes continuent d'apprendre et doivent être monitorés en production .
Mais qu'en est-il du ressenti de la part des utilisateurs ? Constatent-ils une dégradation dans la qualité des résultats, qui ne seraient peut-être pas capturées par les métriques de monitoring?
Amélioration ?
Les résultats sont perceptibles, et l'objectif est rempli.
Le métier, fort de son implication dans le projet et de son expertise du quotidien, peut être force de proposition sur des adaptations à réaliser. Un nouveau cycle de développement est mis en place.

François A.
Expert Data Science
Le mot de l’expert en Data Science
Convaincu qu'une réelle plus-value est possible de par la capacité des algorithmes d'apprendre à partir des données et de trouver des patterns que les approches plus classiques ne pourront pas trouver.
Convaincu également que pour une réalisation compatible avec les enjeux d'une organisation, il est essentiel d'avancer de manière raisonnée et en collaboration avec le métier. Ceci pour une mise en place pertinente, au-delà des tendances actuelles entourant l'intelligence artificielle et ses dérivés.
Le processus Synotis : comment ça marche?
Remplissez le formulaire ci-dessus
Rencontrons-nous lors d’un rendez-vous
Notre expert recueille votre besoin
Nous construisons une proposition adaptée
Commençons l’aventure ensemble !
Ceci pourrait vous intéresser
Nos prestations

Catalogue de données
Initiez facilement votre Gouvernance et dressez un panorama de votre écosystème data.

Data Architecture
Garantir la qualité, l'intégrité et la sécurité des données, pour optimiser leur valeur actuelle et future.

Data exchange
Faciliter la circulation de vos données en toute sécurité en plaçant la data au cœur de vos échanges.

Data Gouvernance
À l'heure du Big Data, la gouvernance des données s’inscrit dans la stratégie d’entreprise.

Data Virtualisation
Des données non répliquées pour des prises de décision agiles et des coûts réduits.

Data Visualisation
Des représentations visuelles de vos données pour en faciliter la compréhension et se concentrer sur l’essentiel.

Référentiel de données
Une donnée « certifiée exacte » à travers tout le système d’informations et toutes les applications.

Refonte de processus
Repenser le rôle de la donnée pour placer sa qualité au cœur de la création de valeur.

Business Analyse (BA)
Faire émerger l’ensemble de vos besoins pour identifier la meilleure solution possible.

Chefferie de projet
Externaliser cette aventure humaine pour sécuriser la mise en œuvre de vos projets.

Feuille de Route
Définir le cap à suivre, les objectifs et les échéances de mise en œuvre de vos projets stratégiques.

Robotic Process Automation (RPA)
La RPA est une technologie visant à reproduire et d’optimiser l'intervention humaine.

Qualité et Test
Se doter d’un tableau de bord de suivi et d’automatisation des tests et placer gestion de la qualité au coeur du projet