03 - Collecter et Structurer les données
- Florian Colin
- 4 déc. 2024
- 5 min de lecture
Dernière mise à jour : 18 janv. 2025

Nous arrivons à un moment où avoir de la donnée n'est plus vraiment un problème étant donné le niveau de technologie que nous utilisons tous quotidiennement pour notre usage personnel ou professionnel. Par contre, il est facile de se noyer dans cette océan de données disponibles et ne pas savoir ce qui est utile ou non pour piloter ses opérations ou prendre des décisions stratégiques. De plus, il est important de savoir être rigoureux dans l'ensemble du processus qui permet d'extraire, stocker et structurer la donnée pour garantir un maximum de qualité dans les analyses et tous les autres usages en aval. Pour s'y retrouver, commençons par un pas de recul sur le cycle de la donnée dans une entreprise (l'exemple pris est dans le Retail, mais vous pouvez faire le parallèle dans tous les autres secteurs).

Tout démarre avec les clients, qui peuvent être les clients de votre enseigne ou de votre service, mais également vos propres collaborateurs qui sont clients de certains processus RH dans votre entreprise par exemple (vous les payez, vous œuvrez à leur qualité de vie au travail, etc.), ainsi que les éventuels partenaires à votre activité (intervenants extérieurs, juristes, sociétés auxquels vous faites appel, etc.). Ces clients ont des besoins ou des envies qu'ils vous expriment via ce qu'on appellera une "Interface Client-Entreprise". Pour un Retailer par exemple, les clients peuvent acheter ou vous contacter via votre site web, ou une application mobile, ou un chat interne. Ils peuvent également profiter de vos services directement en magasin ou dans une zone où ils sont autonomes pour répondre à leurs besoins / envies sans nécessairement parler avec qui que ce soit de chez vous. Enfin, ils peuvent aussi interagir avec vous via un conseiller clientèle en magasin, un vendeur ou tout autre collaborateur. Dans chacune de ces interactions il y a potentiellement un ou plusieurs outils digitaux sous-jacent qui interviennent : compte client sur le site web, l'outil de réservation de créneaux de livraison, le système d'encaissement, l'outil qui gère les questionnaires de satisfaction, les outils de gestion des entrepôts ou du stock magasin pour les collaborateurs, l'outil de pointage des heures, l'outil d'édition des fiches de paye, etc. L'ensemble de nos opérations repose maintenant sur un grand nombre d'outils qui manipulent et génèrent des données. C'est ici que la collecte doit commencer. Détaillons cette partie.

La première tâche consiste à s'assurer que chaque outil digital utilisé dans votre entreprise déverse des données qui permettent de suivre son usage dans une base de données de votre entrepôt de données. OVH, AWS, Google Cloud Platform, SAP… Vous travaillez certainement déjà avec un ou plusieurs acteurs du stockage de données dans le Cloud ou dans des Data Centers que vous possédez. Sinon, choisissez en un pour vous lancer ! A ce stade, les données peuvent être quasi brutes mais elles doivent être lisibles et documentées. C'est d'ailleurs une excellente pratique de compléter votre solution gérant les bases de données d'une solution de documentation facilitant la gouvernance des données (DataGalaxy, Dataedo, Collibra, Talend Data Fabric ou dbForge Studio sont des exemples). Les profils qui construisent et gèrent ces flux de données sont souvent appelés "Data Engineers".
Une fois que les flux de données brutes alimentent des bases de données, alors une première phase d'exploitation consiste à apporter de la structure dans les informations. Les profils souvent sollicités sur cette étape (ainsi que sur la mise en place du dictionnaire de données évoqué juste avant) sont appelés "Data Architects". Il s'agit ici de construire un modèle de données permettant de grouper et d'agencer les informations pour les rendre compréhensibles par toute personne des métiers de votre entreprise. Ainsi on verra souvent des tables de données contenant des informations sur les ventes (ex: date et heure de la vente, identifiant du magasin dans lequel la vente est effectuée, identifiant du produit vendu, quantité vendue, prix hors taxe et TTC, marge, identifiant du client achetant le produit si existant, etc.), d'autres tables contenant les informations sur les clients pour suivre le programme de fidélité ou faciliter les actions marketings, d'autres tables sur les informations internes permettant le bon fonctionnement des systèmes de gestion des collaborateurs (heures travaillées, paye, congés, etc.). Si les premières bases de données sortant des outils digitaux peuvent être perçus comme le garde manger des aliments dans une maison, ce deuxième niveau de bases de données serait les plats préparés que l'on garde au frais avant service.
Enfin, la dernière étape concernant la préparation des données consiste à construire des tables dédiées à des usages spécifiques d'animation de la performance de chaque pan de l'entreprise, ou alimentant des outils d'optimisation, d'intelligence artificielle au sens large ou d'automatisation. Les profils intervenant à ce stade sont souvent appelés "Data Analysts" ou "Data Scientists", en partenariat avec les Data Engineers. Ce sont les tables qui agrègent et sélectionnent des informations par rapport à un usage particulier, comme par exemple l'évolution des ventes (chiffre d'affaires, marge, quantités vendues, etc.) par canal de vente (magasin, site internet, application mobile), l'évolution de la satisfaction client par mois et magasin, l'évolution de la productivité moyenne, le suivi des retards des commandes clients, le suivi des émissions de CO2 des opérations par site, etc. En filant la métaphore de la cuisine, à ce stade on extrait les bonnes quantités des plats préparés que l'on cuit ou réchauffe, et on dresse les assiettes des convives. Tout est prêt pour se mettre à table !

Comment est-ce qu'on consomme ces données ? Plusieurs systèmes sont créés pour faire le lien avec les utilisateurs de toutes ces informations. On distingue en général 3 grandes catégories d'outils :
Les rapports statiques (.pdf par exemple) ou dynamiques. Les fameux "dashboards".
Les systèmes d'alertes qui notifient directement les bonnes personnes en cas de problème.
Les systèmes évolués : outils de prévision, de simulation, d'optimisation ou d'intelligence artificielle.
Nous reviendrons sur l'ensemble de ces outils dans les articles suivants puisque ce sont les prochaines étapes de l'approche Business Flow.

L'ensemble de cette matière est ensuite utilisée par des analystes, des managers qui peuvent suivre l'impact de leur équipe dans l'écosystème de l'entreprise et auprès des clients, des collaborateurs eux-mêmes pour suivre leur performance ou creuser des idées qu'ils peuvent avoir, ou des Directeurs pour s'assurer que tout va bien ou guider des décisions stratégiques. L'ensemble des actions menées grâce à ces informations va donc générer le cycle de l'amélioration continue, en ayant un impact positif sur les opérations elles-mêmes, sur les outils digitaux utilisés et sur la qualité des décisions stratégiques prises dans l'entreprise.
La finalité de collecte et structuration des données est donc bien la création de ce cycle :

Maintenant que l'on a la vision d'ensemble du cycle d'usage des données et que l'on a détaillé les grandes étapes de la consolidation et de la préparation des données, il est temps de s'atteler aux premiers rapports. C'est ce que nous verrons dans le prochain article !



Commentaires