Le grain Tri-daté

Le grain et l’urbanisme « quartier »
Le grain, atome élémentaire

Il est fondamental, pour rendre flexible un SI, d’identifier les différents atomes d’information les plus fins qui le composent.

En effet, bien souvent, coexistent, dans les modèles du SI, ces atomes et différentes agrégations qui en sont déduites. Si l’on duplique la gestion des atomes et celle des agrégats, il sera nécessaire de créer des fonctions de gestion de cohérence. On pourrait croire qu’une telle duplication de la gestion optimise le système, car la volumétrie des agrégats est réduite, mais cette option complexifie et rigidifie. Par exemple, voir le sujet des « prévisions flexibles« .

Certes, en l’absence d’informatique, il était nécessaire d’organiser ces gestions multiples. Les procédures comptables par exemple ont été créées avec ces contraintes, et la nécessité de redondances entre les « journaux », « grands livres », … qui reprennent la même information dans des ordres différents, et avec des totaux différents. L’écriture comptable, elle-même, est un agrégat par rapport au fait détaillé signifiant pour la gestion. D’ailleurs la gestion des dates est problématique, grandement manuelle, elle explique en bonne part le travail de bénédictin des « situations comptables » et des clôtures. Toutes ces contraintes historiques chargent de complexité les opérations comptables, et l’alignement des comptabilités entre partenaires d’affaires. Une contre-productivité commune avec d’autres secteurs structurés par une époque où l’équipement technologique était plus que rudimentaire (voir par exemple l’écosystème des ordres sur les marchés financiers). Cette sur-complexité est souvent malheureusement reprise en dur dans la réglementation, avec son empilement d’acteurs typés et de procédures normées.

En l’absence de vision écosystème, la gestion du grain est éclatée :

  • à différents niveaux de consolidation
  • entre différentes visions temporelles
  • entre les différents opérateurs et leurs informatiques

Des exemples de cette complexité superfétatoire existent dans tous les domaines (processus administratifs éclatés, prestations sociales, opérateurs de santé, …).

Un urbanisme de l’écosystème par quartier dédié au « cycle »

Pour aboutir, dans la conception de l’urbanisme global, à des « quartiers » transcendant les divisions historiques, et les visions partielles, la clé est de s’en référer aux cycles d’événements.

Il faut ici cartographier, non pas par fonction, ou par métier (ce qui a conduit aux silos applicatifs, aux silos d’organisation, aux divisions par acteurs métier), mais par cycle fondamental et invariant.

Une gestion répartie, commune, selon un même modèle, au niveau du grain

Ainsi, dans chaque quartier dédier à un cycle, on identifie le grain typique de ce quartier.

La solution simple et durable, dans l’écosystème et pour un quartier, est celle d’une gestion commune unique, au niveau du grain le plus fin : établie selon un modèle commun du grain, cette gestion doit utiliser une base centrale, ou, ce qui revient au même, virtuellement centralisée (c’est à dire basée sur plusieurs bases synchronisées entre elles).

La synchronisation est la clé de cette cohérence, elle repose une datation correcte.

La datation
Un sujet faussement simple

La date fait partie des caractéristiques incontournables des objets, réels ou virtuels, observés, ou créés. En effet, il faut les repérer dans le temps.

De même, on a aussi à les repérer dans l’espace, par exemple par géolocalisation.

Le repérage temporel, par l’universalité de sa métrique, parait des plus simples. Mais, à y regarder de plus près, dans le traçage, l’enregistrement dans des systèmes d’information, le sujet est plus complexe.

Au niveau « atomique » : le fait

Dans le domaine observé, quel qu’il soit, il se passe à tout instant une multitude de micro phénomènes. La vision globale restitue l’addition de tous ces phénomènes, à un moment donné.

Cependant, si on recherche l’atome le plus ténu, le grain, celui qui retrace une évolution élémentaire, apparaît le « fait ». Un micro-événement précis, qui n’est ni induit par d’autres événements, ni assemblage d’événements.

Le grain sain tri-daté
Grain sain
Grain sain

La définition du grain le plus fin est une clé de la qualité. Ce grain doit être identifié sans ambiguïté en particulier par sa datation. Cette datation doit permettre la traçabilité, la synchronisation, l’historisation, le suivi de la mise en qualité.

Le schéma  résume cette question de qualité du grain et de sa datation.

 

Les 3 dates
  • Les différentes dates
    Les différentes dates

    Le fait est daté : date du fait, → cycle des faits

  • La vision est datée : vision en anticipation (le fait prévu), vision sur le fait (le fait réel), vision en recul (retour sur le fait : retour d’expérience, enrichissement), → cycle des visions
  • L’observation est datée : date technique (date de saisie, date d’acquisition, date du fichier, …), → cycle des mises en qualité : corrections, confrontation des sources (canaux), codification des états de qualité

Le schéma ci-dessous illustre cette tri-datation :

Exemple de tri-datation
Exemple de tri-datation
Gestion des mises à jour

Un des intérêts de l’historisation au niveau du grain fin est de procurer une traçabilité, au travers de l’espace fonctionnel, et historique.

Il est donc indispensable de ne jamais supprimer une information, même si elle apparaît fausse. Certes, ceci peut accroître le volume de la base, mais présente de grands avantages fonctionnels, et c’est plus simple en gestion.

Les extensions du grain

Au delà du modèle exposé ci-dessus, qui a pour objet de partager les informations communes et de synchroniser les différents flux ou interactions, il peut être nécessaire, pour un domaine sémantique « privé », d’étendre le modèle avec des informations privées, spécifiques par exemple à un type de grain. Ceci permet d’utiliser les fonctionnalités du puits pour restituer les différentes latences, ou encore pour partager des données dans un sous-espace (un domaine subsidiaire). La « géométrie » du modèle de grain est variable, et on peut s’appuyer sur les meta-données pour avoir cette flexibilité. Cette option d’extension est fondamentale pour organiser la migration d’un SI (voir le « projet flexible » et la « migration« ).

Socle technologique

On peut implanter ce modèle de grain sur plusieurs types de socle technologique, depuis les bases relationnelles classiques, jusqu’au monde du NoSQL. On trouve en particulier des éléments d’appréciation dans la page dédiée ici aux Data Lake.

Dans l’état actuel des connaissances, il est recommandé de prévoir un POC fonctionnel pour démontrer la faisabilité et l’intérêt de la gestion au grain fin. Le POC, pour donner une vision plus large, concernera le Data Hub.