banniere de fond article

Le data mesh, ou maillage de donnĂ©es, consiste Ă  transformer des architectures centralisĂ©es et monolithiques de donnĂ©es, telles que les data warehouse ou les data lake, en une architecture plus distribuĂ©e, qui permet de dĂ©mocratiser la donnĂ©e en la rendant accessible Ă  tous. Dans le dĂ©tail, outre une plateforme technique Ă  repenser, c’est aussi et surtout une (r)Ă©volution culturelle, dans l’approche mĂȘme de la gestion et de l’exposition de la donnĂ©e, qui doit s’opĂ©rer.

Les limites des architectures centralisées pour exploiter la donnée

La donnĂ©e est au cƓur du business et de la croissance des entreprises. C’est d’ailleurs la raison pour laquelle ces derniĂšres ont, depuis de nombreuses annĂ©es dĂ©jĂ , dĂ©ployĂ© des infrastructures spĂ©cifiques pour collecter, traiter et transformer les donnĂ©es opĂ©rationnelles ou transactionnelles (issues des applications) en donnĂ©es analytiques, en les enrichissant parfois de donnĂ©es externes.

La mise en Ɠuvre de ces infrastructures – qu’il s’agisse d’entrepĂŽts de donnĂ©es (data warehouse) ou de lacs de donnĂ©es (data lake) – montre cependant certaines limites, parmi lesquelles :

  • Cloisonnement entre les donnĂ©es opĂ©rationnelles et les donnĂ©es analytiques, tant au plan technologique (entre systĂšme d’information opĂ©rationnel et plateforme analytique) que des Ă©quipes en charge de chaque systĂšme.
  • Manque d’agilitĂ© pour obtenir de nouvelles donnĂ©es et mĂ©triques : les modĂšles de donnĂ©es Ă©voluent constamment et de maniĂšre rapide et chaque nouvelle demande des mĂ©tiers nĂ©cessite de rĂ©aliser de nouvelles requĂȘtes pour produire de nouvelles mĂ©triques. Les plateformes centralisĂ©es ne favorisent pas une prise en compte et une adaptation rapide aux changements.
  • Connaissance mĂ©tier insuffisante au sein des Ă©quipes responsables des donnĂ©es, qui ne disposent pas de l’expertise pour traiter les donnĂ©es et les problĂ©matiques mĂ©tiers Ă  rĂ©soudre. Ce qui engendre de nombreux allers-retours entre l’équipe en charge des donnĂ©es et les Ă©quipes mĂ©tiers.
  • Multiplications des sources de donnĂ©es et qualitĂ© de la donnĂ©e : nouvelles applications, ouverture du SI sur l’extĂ©rieur grĂące aux API, big data, machine learning, essor des objets connectĂ©s sont autant de facteurs qui conduisent Ă  une dĂ©multiplication des donnĂ©es Ă  rĂ©colter et Ă  traiter. Ce qui peut conduire Ă  une moindre qualitĂ© de la donnĂ©e, pourtant essentielle pour prendre les bonnes dĂ©cisions.
  • Augmentation du nombre de consommateurs de donnĂ©es : avec l’avĂšnement du big data et de l’IA, notamment, de plus en plus d’utilisateurs mĂ©tiers sont en demande de nouvelles mĂ©triques, d’agrĂ©gation et de croisement de quantitĂ© de donnĂ©es de plus en plus importante.

Les piliers du data mesh : domaines de données, produits et gouvernance fédérée

Le data mesh a pour objectif de pallier ces limites, en décentralisant la donnée et son exposition, afin de la mettre plus facilement à la disposition des métiers.

Les piliers conceptuels du data mesh sont au nombre de trois :

  • Le domaine de donnĂ©es : chaque unitĂ© organisationnelle d’une entreprise (par exemple, les ventes, le service client, la finance, les RH, etc.), qualifiĂ©e de « domaine », est responsable de la gestion et de l’exposition de ses propres donnĂ©es auprĂšs du reste de l’organisation. Cette approche permet d’accĂ©lĂ©rer la mise Ă  disposition des donnĂ©es et d’en amĂ©liorer la qualitĂ© globale. Le maillage de donnĂ©es portĂ© par le data mesh est fondĂ© sur la dĂ©centralisation et la distribution des responsabilitĂ©s aux personnes les plus proches des donnĂ©es afin de favoriser le changement et l’Ă©volutivitĂ© continue. Les domaines de donnĂ©es font, en outre, coexister les donnĂ©es opĂ©rationnelles et les donnĂ©es analytiques.
  • Les donnĂ©es sont considĂ©rĂ©es en tant que produit : les donnĂ©es doivent ĂȘtre facilement dĂ©couvrables, comprĂ©hensibles et utilisables par les autres domaines. De la mĂȘme maniĂšre que les applications sont de plus en plus dĂ©veloppĂ©es dans une logique de microservices, oĂč chaque Ă©lĂ©ment a ses propres responsabilitĂ©s, le data mesh peut ĂȘtre considĂ©rĂ© comme l’équivalent pour les plateformes de donnĂ©es : chaque domaine met Ă  disposition ses donnĂ©es, qui peuvent ĂȘtre exploitĂ©es par l’ensemble des utilisateurs d’une organisation. Cette approche induit de nouveaux rĂŽles dans les entreprises : le « product owner » est responsable de la qualitĂ© des donnĂ©es, de la rĂ©duction de leur dĂ©lai de mise Ă  disposition pour pouvoir ĂȘtre consommĂ©es et de la satisfaction des consommateurs de la donnĂ©e. Les « dĂ©veloppeurs de produits de donnĂ©es » ont de leur cĂŽtĂ© pour responsabilitĂ© la crĂ©ation et la maintenance du service d’exposition des donnĂ©es auprĂšs des autres unitĂ©s.
  • Gouvernance des donnĂ©es fĂ©dĂ©rĂ©e au niveau de l’organisation : dans le modĂšle data mesh, les Ă©changes de donnĂ©es sont normalisĂ©es en amont afin de faciliter l’interopĂ©rabilitĂ©, lier rapidement et facilement les donnĂ©es de diffĂ©rents domaines, et dĂ©velopper plus rapidement de nouvelles applications utiles pour les mĂ©tiers. Les rĂšgles de sĂ©curitĂ© et la conformitĂ© rĂ©glementaire (par exemple, le respect du RGPD) sont Ă©galement facilitĂ©es, car l’Ă©quipe en charge de la gouvernance des donnĂ©es est constituĂ©e de spĂ©cialistes de chaque domaine, qui dispose de l’expertise requise pour contrĂŽler les donnĂ©es qui sont mises Ă  disposition des autres domaines.

Data mesh : une plateforme de données en libre-service

La construction d’une plateforme de donnĂ©es en libre-service est l’aboutissement technologique du data mesh et de ses trois piliers conceptuels prĂ©cĂ©demment dĂ©taillĂ©s. C’est sur cette plateforme que les domaines peuvent exposer leurs donnĂ©es ou consommer les donnĂ©es des autres domaines.

Cette plateforme permet en outre d’automatiser un certain nombre de prĂ©requis propres aux donnĂ©es partagĂ©es : intĂ©gration et transformation des donnĂ©es, application des politiques de sĂ©curitĂ© et de conformitĂ© de l’organisation, traçabilitĂ© ou encore gestion des identitĂ©s.

Ce changement de paradigme implique de mettre en Ɠuvre une infrastructure complexe pour accĂ©der aux donnĂ©es de maniĂšre fiable et sĂ©curisĂ©e. Il nĂ©cessite l’intervention de profils spĂ©cialisĂ©s et expĂ©rimentĂ©s pour s’assurer qu’elle soit bien provisionnĂ©e et administrĂ©e, et qu’elle bĂ©nĂ©ficie d’un haut niveau de reproductibilitĂ© pour s’adapter Ă  tous les domaines. Pour rĂ©ussir ce type de projet, la conduite du changement est capitale car le data mesh amĂšne l’ensemble des parties prenantes Ă  penser la donnĂ©e comme un produit exploitable par l’ensemble des mĂ©tiers de l’entreprise.

Cette nouvelle approche de la gestion et de la mise Ă  disposition de la donnĂ©e, qui apporte simplicitĂ© et flexibilitĂ© aux mĂ©tiers, et simplifie l’accĂšs aux donnĂ©es, n’est cependant pas recommandĂ©e dans toutes les organisations. Compte-tenu de l’investissement Ă  rĂ©aliser, elle s’adresse majoritairement aux entreprises « data-driven », qui intĂšgrent la donnĂ©e Ă  tous les niveaux et l’exploitent systĂ©matiquement pour faciliter la prise de dĂ©cision.

Vous souhaitez valoriser vos donnĂ©es ? Vous avez besoin de conseils pour savoir quelle architecture mettre en Ɠuvre ? Contactez-nous !

Vous souhaitez en savoir plus ? Contactez-nous !



* Ces champs sont obligatoires.

Photo de profil Lounes Achab

Lounes ACHAB

Responsable offre sectoriel

SUR LE MÊME THÈME

Photo illustration numérique responsable

NumĂ©rique responsable : les vrais leviers d’action de la chaĂźne de valeur IT

NumĂ©rique responsable : les vrais leviers d’action de la chaĂźne de valeur IT

banniere de fond article

Le Cloud computing – Quelques dĂ©finitions

Le Cloud computing - Quelques définitions

Dreamforce 2018 : Innovations & actualités

Dreamforce 2018 : Innovations & actualités