Le data mesh, ou maillage de donnĂ©es, consiste Ă transformer des architectures centralisĂ©es et monolithiques de donnĂ©es, telles que les data warehouse ou les data lake, en une architecture plus distribuĂ©e, qui permet de dĂ©mocratiser la donnĂ©e en la rendant accessible Ă tous. Dans le dĂ©tail, outre une plateforme technique Ă repenser, câest aussi et surtout une (r)Ă©volution culturelle, dans lâapproche mĂȘme de la gestion et de lâexposition de la donnĂ©e, qui doit sâopĂ©rer.

Les limites des architectures centralisées pour exploiter la donnée
La donnĂ©e est au cĆur du business et de la croissance des entreprises. Câest dâailleurs la raison pour laquelle ces derniĂšres ont, depuis de nombreuses annĂ©es dĂ©jĂ , dĂ©ployĂ© des infrastructures spĂ©cifiques pour collecter, traiter et transformer les donnĂ©es opĂ©rationnelles ou transactionnelles (issues des applications) en donnĂ©es analytiques, en les enrichissant parfois de donnĂ©es externes.
La mise en Ćuvre de ces infrastructures â quâil sâagisse dâentrepĂŽts de donnĂ©es (data warehouse) ou de lacs de donnĂ©es (data lake) â montre cependant certaines limites, parmi lesquelles :
- Cloisonnement entre les donnĂ©es opĂ©rationnelles et les donnĂ©es analytiques, tant au plan technologique (entre systĂšme dâinformation opĂ©rationnel et plateforme analytique) que des Ă©quipes en charge de chaque systĂšme.
- Manque dâagilitĂ© pour obtenir de nouvelles donnĂ©es et mĂ©triques : les modĂšles de donnĂ©es Ă©voluent constamment et de maniĂšre rapide et chaque nouvelle demande des mĂ©tiers nĂ©cessite de rĂ©aliser de nouvelles requĂȘtes pour produire de nouvelles mĂ©triques. Les plateformes centralisĂ©es ne favorisent pas une prise en compte et une adaptation rapide aux changements.
- Connaissance mĂ©tier insuffisante au sein des Ă©quipes responsables des donnĂ©es, qui ne disposent pas de lâexpertise pour traiter les donnĂ©es et les problĂ©matiques mĂ©tiers Ă rĂ©soudre. Ce qui engendre de nombreux allers-retours entre lâĂ©quipe en charge des donnĂ©es et les Ă©quipes mĂ©tiers.
- Multiplications des sources de donnĂ©es et qualitĂ© de la donnĂ©e : nouvelles applications, ouverture du SI sur lâextĂ©rieur grĂące aux API, big data, machine learning, essor des objets connectĂ©s sont autant de facteurs qui conduisent Ă une dĂ©multiplication des donnĂ©es Ă rĂ©colter et Ă traiter. Ce qui peut conduire Ă une moindre qualitĂ© de la donnĂ©e, pourtant essentielle pour prendre les bonnes dĂ©cisions.
- Augmentation du nombre de consommateurs de donnĂ©es : avec lâavĂšnement du big data et de lâIA, notamment, de plus en plus dâutilisateurs mĂ©tiers sont en demande de nouvelles mĂ©triques, dâagrĂ©gation et de croisement de quantitĂ© de donnĂ©es de plus en plus importante.
Les piliers du data mesh : domaines de données, produits et gouvernance fédérée
Le data mesh a pour objectif de pallier ces limites, en décentralisant la donnée et son exposition, afin de la mettre plus facilement à la disposition des métiers.
Les piliers conceptuels du data mesh sont au nombre de trois :
- Le domaine de donnĂ©es : chaque unitĂ© organisationnelle dâune entreprise (par exemple, les ventes, le service client, la finance, les RH, etc.), qualifiĂ©e de « domaine », est responsable de la gestion et de lâexposition de ses propres donnĂ©es auprĂšs du reste de lâorganisation. Cette approche permet dâaccĂ©lĂ©rer la mise Ă disposition des donnĂ©es et dâen amĂ©liorer la qualitĂ© globale. Le maillage de donnĂ©es portĂ© par le data mesh est fondĂ© sur la dĂ©centralisation et la distribution des responsabilitĂ©s aux personnes les plus proches des donnĂ©es afin de favoriser le changement et l’Ă©volutivitĂ© continue. Les domaines de donnĂ©es font, en outre, coexister les donnĂ©es opĂ©rationnelles et les donnĂ©es analytiques.
- Les donnĂ©es sont considĂ©rĂ©es en tant que produit : les donnĂ©es doivent ĂȘtre facilement dĂ©couvrables, comprĂ©hensibles et utilisables par les autres domaines. De la mĂȘme maniĂšre que les applications sont de plus en plus dĂ©veloppĂ©es dans une logique de microservices, oĂč chaque Ă©lĂ©ment a ses propres responsabilitĂ©s, le data mesh peut ĂȘtre considĂ©rĂ© comme lâĂ©quivalent pour les plateformes de donnĂ©es : chaque domaine met Ă disposition ses donnĂ©es, qui peuvent ĂȘtre exploitĂ©es par lâensemble des utilisateurs dâune organisation. Cette approche induit de nouveaux rĂŽles dans les entreprises : le « product owner » est responsable de la qualitĂ© des donnĂ©es, de la rĂ©duction de leur dĂ©lai de mise Ă disposition pour pouvoir ĂȘtre consommĂ©es et de la satisfaction des consommateurs de la donnĂ©e. Les « dĂ©veloppeurs de produits de donnĂ©es » ont de leur cĂŽtĂ© pour responsabilitĂ© la crĂ©ation et la maintenance du service dâexposition des donnĂ©es auprĂšs des autres unitĂ©s.
- Gouvernance des donnĂ©es fĂ©dĂ©rĂ©e au niveau de lâorganisation : dans le modĂšle data mesh, les Ă©changes de donnĂ©es sont normalisĂ©es en amont afin de faciliter lâinteropĂ©rabilitĂ©, lier rapidement et facilement les donnĂ©es de diffĂ©rents domaines, et dĂ©velopper plus rapidement de nouvelles applications utiles pour les mĂ©tiers. Les rĂšgles de sĂ©curitĂ© et la conformitĂ© rĂ©glementaire (par exemple, le respect du RGPD) sont Ă©galement facilitĂ©es, car l’Ă©quipe en charge de la gouvernance des donnĂ©es est constituĂ©e de spĂ©cialistes de chaque domaine, qui dispose de lâexpertise requise pour contrĂŽler les donnĂ©es qui sont mises Ă disposition des autres domaines.
Data mesh : une plateforme de données en libre-service
La construction dâune plateforme de donnĂ©es en libre-service est lâaboutissement technologique du data mesh et de ses trois piliers conceptuels prĂ©cĂ©demment dĂ©taillĂ©s. Câest sur cette plateforme que les domaines peuvent exposer leurs donnĂ©es ou consommer les donnĂ©es des autres domaines.
Cette plateforme permet en outre dâautomatiser un certain nombre de prĂ©requis propres aux donnĂ©es partagĂ©es : intĂ©gration et transformation des donnĂ©es, application des politiques de sĂ©curitĂ© et de conformitĂ© de lâorganisation, traçabilitĂ© ou encore gestion des identitĂ©s.
Ce changement de paradigme implique de mettre en Ćuvre une infrastructure complexe pour accĂ©der aux donnĂ©es de maniĂšre fiable et sĂ©curisĂ©e. Il nĂ©cessite lâintervention de profils spĂ©cialisĂ©s et expĂ©rimentĂ©s pour sâassurer quâelle soit bien provisionnĂ©e et administrĂ©e, et quâelle bĂ©nĂ©ficie dâun haut niveau de reproductibilitĂ© pour sâadapter Ă tous les domaines. Pour rĂ©ussir ce type de projet, la conduite du changement est capitale car le data mesh amĂšne lâensemble des parties prenantes Ă penser la donnĂ©e comme un produit exploitable par lâensemble des mĂ©tiers de lâentreprise.
Cette nouvelle approche de la gestion et de la mise Ă disposition de la donnĂ©e, qui apporte simplicitĂ© et flexibilitĂ© aux mĂ©tiers, et simplifie lâaccĂšs aux donnĂ©es, nâest cependant pas recommandĂ©e dans toutes les organisations. Compte-tenu de lâinvestissement Ă rĂ©aliser, elle sâadresse majoritairement aux entreprises « data-driven », qui intĂšgrent la donnĂ©e Ă tous les niveaux et l’exploitent systĂ©matiquement pour faciliter la prise de dĂ©cision.
Vous souhaitez valoriser vos donnĂ©es ? Vous avez besoin de conseils pour savoir quelle architecture mettre en Ćuvre ? Contactez-nous !
Vous souhaitez en savoir plus ? Contactez-nous !
* Ces champs sont obligatoires.

Lounes ACHAB
Responsable offre sectoriel
Partager sur :