Blog-Poster-dataworld

Entreprise Data World Boston 2019

Cette année, direction l’Amérique du Nord pour la 22ème conférence annuelle Enterprise Data World (EDW). L’occasion de faire le point sur nos connaissances, de partager nos expériences, et d’échanger avec de grands spécialistes mondiaux.

L’Entreprise Data World Boston 2019

Comme souvent en Amérique du Nord au mois de mars, le temps était frisquet. D’impressionnants tas de neige encombraient encore les trottoirs. Une ambiance survoltée se dégageaient des groupes de participants qui se dirigeaient droit vers la parade du Saint Patrick’s day. Mais les courageux de la Data eux se sont réfugiés avec plaisir au centre de conférences du Sheraton Hotel sur Dalton street.

Data Governance et Data strategy

De nombreux ateliers étaient proposés, dont celui de Robert S. Seiner. Il a développé très clairement le concept de « Non invasive Data Governance » que nous appliquons déjà dans nos interventions. Il nous a donné l’occasion de développer nos méthodologies et leurs applications.
Donna Burbank nous a fait partager ses retours d’expériences sur la nécessité pour les organisations de créer une stratégie et une architecture de données complètes et cohérentes. Il s’agit d’une tâche ardue et complexe pour les entreprises. Il est donc important de savoir par où commencer.

Comment prioriser les efforts avec la myriade de technologies et d’intervenants impliqués ? Donna a beaucoup insisté sur une enquête du Gartner qui concorde avec sa propre expérience. Il y apparaît que durant les dix années passées, un nombre largement majoritaire de projets de gouvernance de données ont aboutis à des échecs. Et ce quelques soient les budgets engagés. Non pas en raison du sujet lui-même, mais principalement parce que les entreprises voulaient aller trop vite, trop loin, et souvent accompagnées par des étrangers du monde de la Data.

Nous sommes totalement raccords. Notre vision de la gouvernance de données découle directement de notre expérience du Data Management. Elle défend pleinement l’idée du step-by-step : Découvrir, démontrer et déployer sont nos devises, et tout cela en mode itératif.

Architecture Data et technologies

Les ateliers se succèdent, plus intéressants les uns que les autres, dont celui animé par April Reeve. Nous avons partagé les différents positionnements des composantes du Data Management dans le cadre d’une gouvernance de données efficace. Cela nous a conforté dans notre stratégie de positionnement du concept de Data Hub. Il apporte des solutions à un vaste ensemble de problématiques souvent rencontrées chez nos clients. Il répond parfaitement aux échecs de Data Lake souvent trop vite devenus des Data Swamp.

D’autres présentations portaient sur les technologies. Certaines, déjà anciennes sont remises au centre des débats parce que souvent de mieux en mieux adaptées aux architectures data modernes. On peut citer en vrac la modélisation orientée Fait, les bases de données Graph, la virtualisation des données, le catalogage des métadonnées incluant le « lineage », le positionnement du machine learning …

Nos souvenirs de voyage

De la semaine passée à Boston (hormis les engelures ;)), nous revenons principalement avec ces deux mots clés : Accompagnement et Modernisation.

Accompagnement : car les projets de gouvernance de données qui ont été de véritables succès selon les expériences partagées sont les projets que les métiers ont pu mener en bénéficiant d’un accompagnement. Ne gaspillez pas l’enthousiasme des métiers, il est trop rare. Mais s’ils ne sont pas encore tous engagés dans cette démarche, pas de panique. La plupart savent combien les problèmes de maîtrise des données peuvent leur coûter. Quelques-uns sont déjà convaincus qu’ils doivent entamer des actions (mais quoi et comment ?). Nous sommes là pour vous aider à actionner les bons leviers et transformer les envies en réalité.

Modernisation : car la gouvernance des données silotées est au mieux complexe, au pire impossible. Les architectures Data ont besoin de se moderniser pour faciliter leur gouvernance. Particulièrement si celle-ci se centralise et s’organise autour des nouveaux rôles de Data stewardship et de CDO (Chief Data Officer), comme la tendance le laisse penser.

Abonnez-vous ou consultez régulièrement notre site pour développer nos concepts d’une gouvernance de données non invasive et itérative.
En attendant, n’hésitez pas à nous contacter. Notre métier est de vous écouter, puis de vous accompagner dans la mise en œuvre d’une gouvernance de données réussie.

Blog-Poster-talend-engage

Talend Engage 2019

Du 7 au 10 janvier 2019 se tenait à Colorado Spring (USA/CO) le kick off annuel de Talend , connu sous le nom d‘ « Engage », a rassemblé plus de 700 personnes, commerciaux, pre-sales, customer success manager, customer success architect, marketing, mais également les partenaires stratégiques de l’éditeur et certains de ses clients ;

En tant que partenaire gold de Talend, Synotis était présent comme chaque année à cet  événement. Une présence indispensable qui nous permet de prendre connaissance de la stratégie de Talend, tant au niveau marché que produit, mais également de prendre contact et d’échanger avec les équipes en charge des produits , etc. .

Après un Talend Engage 2018 marqué par la thématique « Star Wars », c’est le film « Top Gun » qui a été choisi cette année comme fil rouge de l’événement avec une baseline orienté cloud : « CLOUD COMBAT TRAINING – Earn your wings ».

Dans cet article je vais donc essayer de couvrir les principales annonces et enseignement de ce Talend  Engage 2019 .

En premier lieu, ce qui m’a frappé c’est le changement de dimension de Talend. Exit le statut de « visionnaire » du Magic Quadrant de Gartner pour les solutions d’intégration de données, Talend est aujourd’hui considéré comme un « Leader » et un acteur mature de la data. Ressenti confirmé auprès des commerciaux () : aujourd’hui Talend est vu comme un acteur pérenne et comptant dans le monde de la data notamment auprès des grands groupes du CAC 40.

Ce sentiment est renforcé par le fait que l’écosystème de Talend ne cesse de s’élargir d’année en année. Après l’arrivée de Talend Data Preparation et de Talend Data Stewardship (TDS), les rachats successifs en 2017 et en 2018 de Restlet et de Stitch enrichissent encore un peu plus la gamme de produits proposés par Talend. Ce n’est pas moins de 13 Product Managers qui se sont présentés devant nous pour jouer au jeu des questions/réponses sur la roadmap 2019. Là encore, changement de dimension : 3 ans auparavant seulement 5 Product Managers étaient présents.

Synotis à Talend Engage 2019

Les PMs on stage – un moment d’interaction mené par Cyaran Dimes, VP Products de Talend.

Cloud, Cloud, Cloud…

Le discours est, sans surprise, encore cette année orienté sur le Cloud. 2 ans en arrière, Talend annonçait le lancement de sa plateforme Talend Cloud. Même s’il était indispensable de suivre ce chemin, j’avoue avoir été sceptique à l’époque. Le Cloud, c’est un métier à part entière. Gérer les disponibilités des plateformes, livrer des releases impactant tous les tenants Cloud, etc… nécessite un vrai savoir-faire qui est totalement différent du savoir-faire historique de l’éditeur. Même si cette transition n’a pas été un long fleuve tranquille. Le fait est qu’à l’heure d’aujourd’hui le pari semble en passe d’être réussi : Talend Cloud est en pleine expansion et séduit de plus en plus de clients. Les retours d’expériences sur scène des clients  UNIPER et TI Media (entre autres) ont mis en avant les avantages du cloud (flexibilité, scalabilité, innovation continue…). Des retours d’expérience un peu trop parfait à mon goût. J’aurais souhaité avoir plus d’informations sur les écueils rencontrés lors du passage d’un mode on-premise traditionnel vers le cloud.

Une cohérence de l’écosystème CLOUD

Laurent Bride a présenté sa vision de Talend Cloud : « More integration, integrity, intelligence ». Et sur cette vision 4 étapes majeures en lien avec les outils en place

  • Collecter : grâce à Stitch Data Loader,
  • Gouverner :
    • Data Catalog (ex Talend Metadata Manager),
    • Data Quality,
    • Data Stewardship.
  • Transformer :
    • Data Streams
    • Data Integration via Studio,
    • Data Preparation.
  • Partager :
  • API Services
    • API Tester

L’arrivé du Frictionless

Au détour d’une slide, apparaît le terme de « Frictionless », soit un nouveau processus de consommation du logiciel : facile à utiliser et facile à acheter, sans la contrainte d’un processus de vente ou d’un contrat à long terme. Intéressant. Le mode de licence traditionnel de Talend est le mode « souscription ». Le client souscrit à une licence pour une durée de 1 à 5 ans. Licence renouvelable à échéance.

Le Frictionless est la vision développée par certains acteurs du Cloud tel AWS ou Azure, et également hérité de l’acquisition de Stitch

Pas question néanmoins aujourd’hui de placer totalement la plateforme Cloud sous ce nouveau mode de consommation. Certains services seront mis à disposition au fur et à mesure. De premières annonces sont attendus pour le 2ème trimestre

Une petite nouveauté pour l’équipe Sales de Talend (et ses partenaires) qui vont devoir adapter leur discours auprès des clients.

Et le On-Premise dans tout ça….

Et bien ce kick off était clairement placé sous le signe du cloud…

Côté on-premise, Data Catalog était à l’honneur. Certaines annonces côté CLOUD permettent aussi d’entrevoir l’arrivée de nouvelles features dans le Studio

La place de l’ETL dans cet écosystème

Avec le rachat de Stitch, le développement de Data Streams et du traditionnel Studio, ce n’est pas moins de 3 produits différents qui permettent de faire de l’ETL.

La question évidente est donc de savoir quand et comment positionner Stitch, Pipeline Designer ou le Studio.

Deux contextes principaux :

  • Si vous n’êtes pas adepte du Cloud, alors la réponse est basique. Seul le Studio On Premise vous permettra de créer vos flux de données.
  • Si vous êtes dans une stratégie Cloud, alors la réponse peut être trouvée en fonction du niveau de complexité du flux développé :

Talent Engage ETL

 

Il s’agit évidemment d’une vulgarisation en fonction d’un critère basique.

D’autres critères peuvent entrer en jeu : connecteur disponible ou non, format de la données, etc… N’hésitez pas à nous contacter pour discuter de vos problématiques. Nous sommes en mesure de vous accompagner sur cette prise de décision.

Des partenariats techniques majeurs

Enfin, Talend met de plus en plus en place des partenariats technologiques forts.

  • Microsoft pour la partie Machine Learning sur Azure. Plusieurs annonces renforçant le partenariat Talend et Microsoft émailleront tout au long de l’année 2019
  • Databricks a pour vocation de réunir Data Engineer et Data Scientist tout au long du cycle de vie du Machine Learning, de la préparation des données à l’expérimentation et au déploiement d’applications ML. Plateforme basée sur Spark. La relation est au beau fixe entre Databricks et Talend avec une forte collaboration entre le Product Manager Big Data de Talend et le Product Manager de Databricks.
  • Snowflake: Depuis maintenant 2 ans, Talend promeut Snowflake (DW dans le cloud) et met à disposition tant sur le on premise que sur le cloud les connecteurs pour charger ou interroger Snowflake.

En synthèse, un super un événement avec notre partenaire Talend.
Nous y avons appris de nombreuses choses concernant la stratégie et l’évolution des produits de l’éditeur.

Si vous voulez en savoir plus, contactez Xavier, le rédacteur

Blog-Poster-petit-dej-indexima

Petit-Déjeuner | Performances Big Data & Analytique

Faster, bigger, cheaper, better ? Les nouveaux défis du Big Data.

L’importance de l’utilisation des données n’étant plus à prouver, les entreprises se trouvent désormais face à un défi de taille : traiter plus de données, plus rapidement et à moindre coût.

Comment sont gérés actuellement les projets d’accès aux données et comment faire pour améliorer cette gestion au quotidien?

Pour répondre à ces questions, ce petit déjeuner reviendra sur:

  • les bonnes pratiques métiers avec le retour d’expérience de Gilai(1) et Mappy (2)
  • les solutions technologiques pour tirer parti du Big Data avec un accès instantané à la donnée, grâce à Indexima

(1) Gilai est l’association qui regroupe l’informatique des Offices de l’assurance-invalidité (AI) de vingt cantons suisses et du Liechtenstein.

(2) Mappy est le spécialiste du calcul d’itinéraire et des services de cartographie. Mappy est reconnu comme le leader français de la recherche locale par la carte sur Internet, mobiles et tablettes.

 

Blog-Poster-gdpr1

GDPR : On y est !

Ça y est ! On y est ! Le 25 Mai est passé. Officiellement et légalement, les entreprises devraient être conforme avec le règlement.
Dans la réalité, il y a une très grande disparité dans le niveau de conformité entre les entreprises.
Les comportements et ressentis par rapport à ce règlement sont divers et variés. Ceci explique cette différence de niveau de conformité.
Néanmoins, on voit aussi les différents sites web et applications mobiles mettre à jour leurs politiques de protection des données mais pas toujours de manière adaptée.

L’accueil de la GDPR et le niveau de mise en conformité

Etre consultant a un côté positif vis-à-vis de la GDPR : naviguer entre différents clients, cela nous permet de rencontrer des profils différents, avec des ressentis variés, et par conséquent, un accueil, une approche et une mise en conformité différente.

Si on fait le tour des « catégories », on peut identifier les suivantes :

  • Les « réfractaires » : La GDPR est perçu comme une énième contrainte, qui va engendrer des coûts et du temps à dédier. La conformité sera faite de manière minimale ; on est conforme mais on ne va pas en faire plus.
  • Les « sereins » : Des actions ont été menées et ils considèrent qu’ils sont conformes, sans forcément refaire d’audit ou de suivi.
  • Les « sans inquiétudes » : Ce sentiment se rapporte aux amendes. Ils se demande comment l’UE peut intervenir sur les entreprises basées hors UE (Suisse, USA, Chine, etc.). Ne se sentant pas sous pression, la mise en conformité n’est pas la priorité. Par contre, la plupart la garde dans un coin de leur tête.
  • Les « bons élèves » : Le sujet est pris au sérieux, les actions ont été menées et un suivi est réalisé.
  • Les « avant gardistes » : Il faut le noter, certaines entreprises n’ont pas attendu cette réglementation pour se soucier de la protection des données personnelles et sont déjà en conformité, ou presque, et cette culture est déjà adoptée par les personnes.

Des centaines de mails et des pop-ups.

Ces dernières semaines, et même après le 25, une avalanche de mails envoyés pour nous signifier des changements de politiques de protection des données, est arrivée dans les boîtes mails des utilisateurs ; avalanche particulièrement désagréable, tant par la quantité que par le fond « vite » de certains mails.
Pour certains sites web ou applications mobiles, ces modifications se sont traduites par des mises à jour obligatoires de paramètres.
Et là, il y a un problème ! Dans certains cas, si on refuse de souscrire à une newsletter ou de réduire les données que l’on souhaite diffuser, on ne peut tout simplement pas utiliser le site ou l’application, ou alors on nous demande la suppression de notre compte
Il faut faire un réel travail pour que l’intérêt de ce règlement soit compris et que les modifications soient en adéquation avec ce qui est attendu.

Une philosophie, une culture

C’est là que l’on réalise vraiment une des difficultés intrinsèques de ce règlement. Il faut que toute la chaîne, du DPO au développeur, en passant par le juridique, le métier, les designers, etc. aient bien intégré toutes les facettes de ce règlement, et que les bonnes pratiques deviennent un réflexe.

Vous souhaitez en discuter ? Venez nous rencontrer et en discuter lors de notre afterwork dédié à la GDPR organisé par Synotis et Talend

Découvrez nos autres articles : GDPR : Oh la belle opportunité et GDPR, ou quand l’humain reprend le pouvoir !

Blog-Poster-gdpr2

GDPR, ou quand l’humain reprend le pouvoir !

La GDPR, règlement européen sur la protection des données, a pour objectif principal de redonner le pouvoir aux personnes de mieux maîtriser leurs données personnelles et les sécuriser.

Il y a 2 facettes inhérentes à cette réglementation : les personnes qui fournissent leurs données, mais également les personnes qui traitent les données.

Des données ! Mais pas que !

Derrière les 0 et les 1 se cachent des personnes, dotées de droits et de libertés. Il semblerait que ceci ait été oublié dans la course frénétique à l’innovation, à toujours plus de services sur Internet. Rajoutons à ceci les réseaux sociaux, les sites de e-commerce et nous avons un cocktail complet dans lequel se mélangent des intérêts commerciaux et des données personnelles.

La GDPR essaye de corriger ces années de dérives en rappelant que ces données appartiennent à la personne et que les entreprises doivent les protéger. En effet elles ne pourront plus disposer, traiter, acheter ou vendre ces données sans le consentement explicite de la personne concernée.

Au travers des droits énoncés dans la GDPR (accès, information, oubli, etc.), les personnes ont les moyens de reprendre en main leurs données personnelles et de décider ce qu’elles souhaitent en faire.

C’est un changement de philosophie et de façon de penser, mais avec un peu de temps, d’auto-projection et de bon sens, on réalisera que ceci aurait dû toujours être le cas.

L’humain au cœur de la mise en conformité

Il est évident que tous les processus, les mesures mises en place ainsi que les systèmes informatiques déployés ont une importance capitale dans la mise en conformité.

Mais pour s’assurer de la bonne application et de l’appropriation du sujet au sein de l’entreprise, il convient de sensibiliser les personnes. Car ce sont ces personnes (les employés) qui, lors de traitements manuels, vont être en relation avec les données.

Nous connaissons tous des situations où, par confort, par facilité, ou parce qu’il n’y a pas de solutions existantes/pertinentes, ces données se retrouvent directement sur les postes utilisateurs (fichiers Excel, bases de données, …). Or, ces éléments peuvent contenir des données personnelles !

C’est ce genre de comportement qu’il faut identifier et éviter. Il faut donc impliquer, former et sensibiliser les collaborateurs. Plusieurs méthodes existent. Celle de les aider à se projeter et de les faire se questionner sur ce qu’ils souhaitent pour leurs propres données semble la meilleure.

La mise en conformité repose sur cette étape clé : que les employés soient convaincus de son importance et se sentent concernés !

Découvrez nos autres articles : GDPR : Oh la belle opportunité et GDPR : On y est

Blog-Poster-gdpr3

GDPR : Oh, la belle opportunité !

Alors oui, en effet, quand on prend la GDPR telle quelle, on n’y voit pas une opportunité mais une quantité de contraintes, d’obligations, de dépenses.
Mais posons-nous un moment et regardons au-delà ?

Tes données tu maîtriseras, ton business tu amélioreras

En prenant le temps d’analyser les obligations inhérentes à la GDPR, on se rend compte que pour être conforme, il faut maîtriser les données utilisées (minimisation, exactitude, durée de conservation). Il va donc falloir identifier ces données, savoir où elles sont stockées, mettre en place des traitements pour les nettoyer et les corriger.
En somme, mettre en place un système de « Data Management », où les termes tels que Master Data Management, Data Quality, Data Catalog, prennent tout leur sens.
Il faut voir l’occasion de modifier son SI, d’améliorer le traitement des données et leurs qualités. Avec comme objectif final de réduire ses coûts et améliorer son business.

Maîtriser et optimiser ses processus

Outre la partie informatique, il y a la partie traitement des données, définis par des processus.
Souvent, ces processus ne sont pas documentés, ou ne sont pas mis à jour. Il est nécessaire de revoir les processus associés afin de préciser les finalités d’un traitement. C’est l’occasion de revoir pourquoi ils ont été définis ainsi, quelles données sont nécessaires, et potentiellement les axes d’optimisation.
Toujours avec comme finalité de s’améliorer, de réduire ses coûts et de faire progresser son business.
Durant cette étape, il est nécessaire d’impliquer les équipes (cf. mon précédent billet)

La confiance, cette valeur sous-estimée

Etre conforme ne va pas révolutionner l’image que les gens ont d’une entreprise. Néanmoins, elle va considérablement l’améliorer. Nous savons tous à quel point il est difficile de fidéliser les clients. Il est surtout facile de les perdre en cas de problèmes ; La notoriété peut disparaître en un éclair. Avec l’avènement des réseaux sociaux, le bouche à oreille négatif (le fameux « bad buzz ») circule d’autant plus vite, alors que le positif reste toujours discret.
Respecter la GDPR pourra faire pencher la balance en votre faveur si une personne soucieuse de la protection des données vous sait impliqué dans cette démarche, et idéalement conforme. Il faudra donc mettre en place une communication efficace sur le sujet pour valoriser toute cette démarche de conformité..

Découvrez nos autres articles : GDPR : On y est et GDPR, ou quand l’humain reprend le pouvoir !