Data lake

Pour être Data Driven, il faut considérer l’ensemble des données.

L’eco-système d’une entreprise évoluant en permanence, celle-ci doit considérer ses propres données mais également les données externes : partenaires, clients, IoT, Open Data, Others Data.

Un Data Lake est un référentiel de données permettant de stocker une très large quantité de données brutes dans le format natif pour une durée indéterminée. Cette méthode de stockage permet de faciliter la cohabitation entre les différents schémas et formes structurelles de données.

Les données ainsi collectées pourront avoir plusieurs finalités :

  • Data Intelligence
  • Data Gouvernance
  • Machine Learning/Intelligence Artificielle

De nouvelles architectures ont vu le jour il y a plusieurs années afin de répondre à ce nouveau paradigme autour de la Data.
Ces architectures modernes doivent être distribuées, scalables, résilientes, à faibles latence et multi-plateformes (On Premise, Cloud et Hybrid).

Métiers

Conseil en stratégie Data

  • Définition de l’architecture Data
  • Définition de la stratégie de collecte des données

Développement

  • Mise en oeuvre du Data Lake
  • Développement des flux d’alimentation du Data Lake

Expertise

  • Talend Big Data (On premise et On Cloud)
  • Technologies Kafka