Aller au contenu

Framework

Gouvernance RAG : contrôle du retrieval et de l’inférence

Gouvernance RAG : contrôle du retrieval et de… présente un cadre opérationnel pour gouverner l’interprétation, l’autorité, la preuve et les réponses IA.

CollectionFramework
TypeFramework
Couchegraphe-externe
Version1.0
Publié2026-02-20
Mise à jour2026-02-26

Artefacts de gouvernance

Fichiers de gouvernance mobilisés par cette page

Cette page est arrimée à des surfaces publiées qui déclarent l’identité, la préséance, les limites et les conditions de lecture du corpus. Leur ordre ci-dessous donne la séquence de lecture recommandée.

  1. 01Q-Layer en Markdown
  2. 02Q-Layer en YAML
  3. 03Politique d’interprétation
Politique et légitimité#01

Q-Layer en Markdown

/response-legitimacy.md

Surface canonique de légitimité de réponse, de clarification et de non-réponse.

Gouverne
La légitimité d’une réponse et les contraintes qui modulent sa forme.
Borne
Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.

Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.

Politique et légitimité#02

Q-Layer en YAML

/response-legitimacy.yaml

Projection structurée du Q-Layer pour systèmes qui préfèrent une lecture YAML.

Gouverne
La légitimité d’une réponse et les contraintes qui modulent sa forme.
Borne
Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.

Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.

Politique et légitimité#03

Politique d’interprétation

/.well-known/interpretation-policy.json

Politique publiée qui explicite les contraintes d’interprétation, de portée et de retenue.

Gouverne
La légitimité d’une réponse et les contraintes qui modulent sa forme.
Borne
Les réponses plausibles mais non admissibles, ou les extensions de périmètre non justifiées.

Ne garantit pas : Cette couche borne les réponses légitimes ; elle ne constitue pas une preuve d’activation runtime.

Artefacts complémentaires (3)

Ces surfaces prolongent le bloc principal. Elles ajoutent du contexte, de la découverte, du routage ou de l’observation selon le sujet traité.

Politique et légitimité#04

Politique d’usage IA

/ai-usage-policy.md

Notice publique qui explique comment lire les surfaces de gouvernance et leurs limites.

Politique et légitimité#05

Output Constraints

/output-constraints.md

Surface qui explicite les conditions de réponse, de retenue, d’escalade ou de non-réponse.

Découverte et routage#06

Routeur sémantique

/semantic-router.json

Surface qui oriente la lecture vers les bonnes zones du corpus selon le type d’intention.

Gouvernance RAG : contrôle du retrieval et de l’inférence

Le RAG (Retrieval-Augmented Generation) améliore la pertinence en injectant des sources externes dans la génération. Mais sans gouvernance, il déplace simplement le problème : au lieu d’inventer, le système sélectionne mal, mélange ou extrapole à partir de sources hétérogènes.

La gouvernance RAG vise à contrôler deux choses distinctes : ce qui est récupéré et ce qui est inféré à partir de ce qui est récupéré.


Définition opératoire

Gouvernance RAG : cadre normatif visant à encadrer la sélection de sources (retrieval), la qualification de leur légitimité (Q-Layer) et la génération finale, afin de garantir la fidélité au canon, la gestion des conflits d’autorité et la production de preuves auditables.


Problèmes typiques du RAG non gouverné

  • mauvais chunk sélectionné
  • sources contradictoires mélangées
  • absence de hiérarchisation d’autorité
  • extrapolation normative à partir d’un fragment partiel
  • absence de non-réponse légitime en cas d’ambiguïté.

Architecture gouvernée

Canon → Retrieval → Q-Layer → Génération → Sortie

  • Canon : sources versionnées et qualifiées.
  • Retrieval : sélection pondérée et contrôlée.
  • Q-Layer : conditions de réponse et frontière d’autorité.
  • Génération : inférence bornée.

Règles (GRAG-1 à GRAG-9)

GRAG-1 : qualification des sources

Toute source doit être classée par niveau d’autorité.

GRAG-2 : hiérarchisation explicite

En cas de conflit, une règle d’arbitrage doit être déclarée.

GRAG-3 : interdiction d’extrapolation hors chunk

Le modèle ne peut pas déduire au-delà du fragment récupéré sans règle explicite.

GRAG-4 : contrôle d’ambiguïté

Si le retrieval est ambigu, déclencher clarification ou non-réponse.

GRAG-5 : traçabilité des chunks

Journaliser quels fragments ont été utilisés.

GRAG-6 : preuve de fidélité sur attributs critiques

Exiger correspondance explicite entre chunk et réponse.

GRAG-7 : gestion des collisions internes

Détecter si deux fragments renvoient à des entités différentes.

GRAG-8 : tests adversariaux

Injecter des requêtes ambiguës et comparer les sorties.

GRAG-9 : monitoring et version

Versionner le corpus et revalider les résultats après mise à jour.


Artefacts attendus

  • Registre des sources classées par autorité.
  • Journal des retrievals (chunks utilisés).
  • Rapports de conflits d’autorité.
  • Batterie de tests adversariaux.
  • Rapports d’écart canon-sortie.

FAQ

Le RAG suffit-il à garantir la fidélité ?

Non. Il améliore la disponibilité de sources, mais sans gouvernance, il peut amplifier la confusion.

Pourquoi intégrer le Q-Layer ?

Parce que le retrieval ne garantit pas la légitimité de l’inférence.

La gouvernance RAG est-elle différente en environnement fermé ?

Oui. Le contrôle est plus direct, mais les conflits internes peuvent être plus subtils.


Pages associées

Voir aussi

Couche de définitions canoniques phase 7

Ce framework est maintenant soutenu par des surfaces de définition dédiées : gouvernance RAG, contrôle de récupération, admission des sources, admissibilité du corpus, provenance de récupération, autorité du fragment, chaîne documentaire, web de réponse, budget de correction et résorption.

Le framework doit être lu comme la couche appliquée. Les définitions sont les surfaces canoniques de possession SERP et de lecture machine.

La récupération n’est pas la légitimité

Ce framework part d’une distinction critique : récupérer un document ne rend pas la réponse finale légitime. Le RAG peut améliorer l’accès aux sources, mais il peut aussi créer une fausse confiance lorsque le succès de récupération est confondu avec l’autorité, l’admissibilité, la fidélité ou l’autorisation de réponse.

La première étape consiste à gouverner ce qui peut entrer dans le corpus. La deuxième consiste à gouverner les passages qui peuvent être récupérés. La troisième consiste à gouverner ce que la réponse peut inférer à partir d’eux. Ces trois contrôles sont différents. Une source peut être admissible sans être décisive. Un passage peut être pertinent sans être autoritaire. Un fragment récupéré peut soutenir le contexte sans autoriser une conclusion.

Séquence de gouvernance

Une séquence pratique consiste à définir l’admissibilité du corpus, créer une hiérarchie des sources, attacher une provenance aux passages récupérés, assigner une autorité aux fragments, restreindre l’inférence et appliquer les conditions de réponse avant la sortie. Cela relie le framework à la gouvernance RAG, au contrôle de récupération, à la chaîne documentaire et à la légitimité de réponse.

Le framework doit aussi noter la version, la date, la classe de source et les conditions d’exclusion. Sans discipline de version, un système RAG peut récupérer un passage périmé mais sémantiquement pratique et le traiter comme actuel.

Modes de défaillance

Les défaillances fréquentes consistent à surfaire confiance aux extraits récupérés, mélanger sources canoniques et contextuelles, citer un passage qui ne soutient pas la conclusion et laisser le modèle synthétiser entre sources sans ordonnancement d’autorité. La correction n’est pas toujours une meilleure récupération. Parfois, la correction est un refus, une qualification, une exclusion de source ou un périmètre de réponse plus étroit.

La récupération n’est pas une autorisation

Un système RAG peut récupérer une source pertinente, récente et sémantiquement proche tout en ne disposant pas de l’autorité requise pour répondre. Ce framework sépare donc la réussite de récupération de la légitimité de réponse. La récupération répond à la question « qu’a-t-on trouvé ? ». La gouvernance interprétative répond à la question « que peut-on conclure de ce qui a été trouvé ? ».

Le framework évalue l’admission des sources, l’autorité des fragments, la provenance, l’état de version, la hiérarchie des sources et les limites d’inférence. Un passage récupéré peut être admis comme preuve, rejeté comme périmé, utilisé seulement comme contexte ou subordonné à une surface plus canonique. Sans ces distinctions, une chaîne RAG peut transformer la proximité en autorité.

Points de contrôle

Les principaux points de contrôle sont l’admission du corpus, le filtrage de récupération, les métadonnées de fragment, l’ordonnancement de l’autorité, la qualification de la réponse et la traçabilité post-réponse. Chaque point doit déclarer ce qu’il peut et ne peut pas décider. Un filtre de récupération peut réduire le bruit. Il ne crée pas la validité procédurale. Une citation peut exposer une source. Elle ne garantit pas la fidélité.

Ce framework relie la gouvernance RAG, le contrôle de récupération, la chaîne documentaire et la légitimité de réponse. Sa valeur pratique est d’empêcher la mécanique de récupération de devenir silencieusement une gouvernance.

Liste d’application

En pratique, ce framework doit devenir un tableau de revue de récupération. Chaque ligne doit enregistrer la source, le fragment, l’état de version, le statut d’admission, le niveau d’autorité, l’inférence permise et la condition de réponse. Un fragment pertinent mais non canonique doit être marqué autrement qu’un fragment à la fois pertinent et autoritaire.

La revue doit aussi inclure un chemin de refus. Si la récupération retourne des sources mais qu’aucune ne satisfait la hiérarchie des sources ou le seuil de légitimité de réponse, le système doit pouvoir déclarer que le corpus est insuffisant. Cela protège le RAG de son mode de défaillance le plus fréquent : traiter le matériau récupéré comme automatiquement suffisant.