Quelle gouvernance pour les projets Data ?

Quelle gouvernance pour les projets Data ?

La gouvernance des données est devenue un sujet primordial au sein des entreprises, notamment du fait de leur prise de conscience sur le volume des données échangées, la variété de ces données ainsi que la vitesse avec laquelle elles transitent (Les fameux 3V du Big Data).  

Mais que fait-on une fois que cette masse de données se trouve dans nos systèmes ? On parle alors de Smart Data et ses 2 V : véracité, pour une donnée cohérente, fiable ou exacte, et enfin le v auquel les entreprises cherchent à répondre, la valeur. Comment valoriser ma donnée pour valoriser mon entreprise ? C’est ce qui constitue les 5V du Big Data.

De ce fait, les entreprises cherchent à la comprendre, l’organiser et l’exploiter, c'est-à-dire à mettre en place une gouvernance des données. Il existe, bien sûr, différentes façons d’aborder une gouvernance et de la mettre en place, car il faut l'adapter à chaque organisation. Malgré ces différences, on peut trouver un tronc commun à tous ces projets Big Data et c’est ce qui m’a amené à partager mon expérience sur le sujet. 

 Lorsqu’il s’agit de parler de gouvernance, on parle souvent, de la façon de fédérer des équipes pluridisciplinaires, afin d'atteindre nos objectifs fixés, avec quelles ressources, quels outils et quelles méthodologies, mais surtout, avec quel soutien du management pour passer du Big Data au Smart Data. 

Les process métier 

Une première étape est de connaître ses process. Par exemple, si l’on prend le process “réception de la commande”, le départ de la commande est donné par le client, elle est réceptionnée par le fournisseur, elle traverse plusieurs étapes, services et systèmes. A chaque étape et lieu, la donnée est acheminée, voire transformée (mise à jour de stock, date de livraison, etc.) ou même des nouvelles données viennent s’ajouter, afin de répondre au processus. 

En ayant cette connaissance, de quel type de donnée on possède, quel système la gère, on peut commencer à cartographier nos données, et faire un premier constat de la qualité de celle-ci. En se basant sur des critères comme l'unicité, la complétude, l’exactitude, la fraîcheur et la cohérence des données, les entreprises pourront prendre les bonnes décisions basées sur des données fiables et précises. C’est ce que l’on appelle la Data Quality Management (DQM).  

Dans la gouvernance, il est aussi important, de prendre en compte, la gestion de risques et de la conformité réglementaire. Toute entreprise a pour responsabilité de sécuriser toute donnée entrante et sortante, de mettre en place des processus d’anonymisation, de définir des profils d’accès, de définir les finalités d’usage et un cycle de vie de la donnée pour être en conformité avec la RGPD, tracer, documenter et avoir des scénariis de protection en cas d’attaques ou fuite des données; ce sont des éléments que la CNIL vérifie lors des contrôles réglementaires. 

Alors, avec quelle architecture et quels outils, peut-on assurer, une connaissance, une bonne DQM et une protection des données?  

Les architectures des systèmes d’information sont multiples et en perpétuelle évolution. De plus, il faut tenir compte du legacy qui ajoute une contrainte conséquente dans la gouvernance. 

Ce qui est certain, dans une architecture de type Big Data ou qui tend, à devenir Big Data, c’est de compter sur des composants de collecte, de transformation et de transport de données multi sources, d’avoir un stockage adapté au besoin de l’entreprise, de bien savoir dimensionner les flux, en termes de volume et de fréquence d’exploitation, pour assurer une performance optimale à chaque niveau d’accès et d’utilisation de la donné.  

Tout ce travail d'architecture est essentiel pour l’extraction, la transformation et la visualisation de la donnée. Les métiers doivent  avoir à leur disposition, des moyens de mesurer, de comprendre, et de valoriser la donnée pour aller de plus en plus vers la Smart Data. Ceci passe par exemple, par des outils de data science, pour faire des modèles prédictifs et anticiper ainsi le besoin des consommateurs. Des outils de data visualisation que les Data Analystes utilisent dans leur quotidien, afin de donner des informations factuelles et claires, conforter dans les stratégies définies et prendre rapidement des décisions pour l’entreprise. 

Comme on peut le voir, la gouvernance est répartie sur plusieurs expertises. Choisir les bons profils et définir les rôles de chacun est essentiel dans les projets. 

Voici un exemple des profils, qui sont les plus souvent impliqués dans ces projets :  

  • le business owner, qui définit les règles métiers et porte le sens de la donnée,
  • le data analyste qui, en collaboration avec les business owner, définit les indicateurs, les données à utiliser pour l’analyse, et propose une visualisation graphique et compréhensibles des données,  
  • le data scientist, avec des compétences statistiques, de développement et de construction de modèles prédictifs, il aborde d’autres points de vue de la donnée, complémentaires à ceux fournis par les data analystes, 
  • le Data engineer et le data architecte seront les garants de la bonne intégration, stockage, transmission et sécurité des données échangées,  
  • le Data steward, qui est responsable des process de création, modification et suppression des données, et veille à ce que les accès soient bien définis, 
  • le responsable de la protection des données ou DPO, soit porté par une personne dédiée à ce rôle ou par le service juridique, il conseille et accompagne sur la conformité des données, et est le contact principal auprès de la CNIL,
  • et bien sûr, les Sponsors qui, avec une forte compréhension des enjeux et de la valeur que la Data apporte, vont porter la vision et incarner la gouvernance des projets Big Data.  

Comme vous avez pu le lire, la gouvernance est l’affaire de tous, des personnes avec un même objectif, celui de valoriser la donnée. 

Les responsabilités sont réparties entre chaque rôle et chacun apportera son expertise essentielle à une bonne gouvernance des projets Big/Smart Data. 

Gouvernance des data

Related articles

Data ESG : Contrainte ou Eldorado ? Retour sur notre table ronde
4 mins
Tendances
Data ESG : Contrainte ou Eldorado ? Retour sur notre table ronde
Checklist pour les CEO pour Déployer l'IA Générative dans les Compagnies d'Assurance
3 mins
Tendances
Checklist pour les CEO pour Déployer l'IA Générative dans les Compagnies d'Assurance
Exploiter l'IA pour un Avenir Durable : Une Feuille de Route pour les Entreprises et les Gouvernements
5 mins
Tendances
Exploiter l'IA pour un Avenir Durable : Une Feuille de Route pour les Entreprises et les Gouvernements

Button / CloseCreated with Sketch.