Cet article explique pourquoi la gouvernance RAG (corpus, récupération, versioning) améliore la fiabilité, mais ne suffit pas à elle seule à rendre un agent métier légitime. Tant que l’inférence n’est pas bornée par des périmètres, des négations et des conditions de réponse opposables, l’agent peut produire des conclusions plausibles mais non autorisées.
Statut :
Analyse hybride (phénomène interprétatif). Ce texte isole un mécanisme récurrent : en entreprise, on « gouverne la connaissance » mais on oublie de gouverner la permission d’inférer. L’objectif est de rendre ce point aveugle observable, puis de le relier à des cadres applicables.
La popularité du RAG a créé une promesse implicite : si l’on force l’agent à répondre à partir d’un corpus interne propre et versionné, alors les hallucinations disparaîtront. En pratique, les hallucinations spectaculaires diminuent souvent, mais un autre problème prend le relais : l’inférence silencieuse. Un agent peut récupérer un passage exact et produire une conclusion non légitime par interpolation, généralisation ou extrapolation de périmètre.
La confusion vient d’un glissement subtil. La gouvernance RAG gouverne la discipline documentaire : quelles sources sont accessibles, comment elles sont indexées, comment elles sont mises à jour, comment on limite le bruit. Mais elle ne gouverne pas automatiquement l’acte d’énoncer. Entre un passage récupéré et une réponse produite, il y a un espace : l’espace d’inférence. C’est précisément cet espace qui doit être borné si l’on veut une IA réellement auditée.
Ce que la gouvernance RAG fait réellement
Dans sa forme saine, la gouvernance RAG vise à stabiliser :
- le périmètre du corpus (ce qui est consultable) ;
- la qualité et la propreté des documents ;
- le versioning (quelle version de la vérité est active) ;
- la récupération (retrieval) : quels passages sont remontés ;
- la traçabilité des sources citées (au moins au niveau document).
Ces mécanismes réduisent l’entropie. Ils diminuent le recours involontaire à des sources externes. Ils facilitent la conformité documentaire. Dans beaucoup de cas, ils améliorent fortement la qualité des réponses. Le problème n’est pas le RAG. Le problème est l’illusion de complétude : croire que gouverner le corpus revient à gouverner la conclusion.
Le passage critique : du texte récupéré à la conclusion
Même avec un retrieval parfait, une réponse agentique implique des opérations implicites : résumer, hiérarchiser, relier, déduire. Une réponse peut contenir une part d’inférence, parfois minime, parfois centrale. En contexte métier, cette part est souvent là où se nichent les risques.
Un passage récupéré peut être exact, mais incomplet. L’agent comble alors une lacune par une formulation prudente : « généralement », « typiquement », « il est recommandé ». La réponse semble responsable. Pourtant, elle peut créer une norme implicite ou une promesse non autorisée.
Les erreurs qui persistent malgré un RAG gouverné
En pratique, on observe plusieurs classes d’erreurs qui survivent très bien à un pipeline RAG propre :
- Extension de périmètre : le corpus décrit un cas, l’agent l’applique à tous les cas.
- Généralisation abusive : une procédure interne devient une règle universelle.
- Hallucination normative : une recommandation devient une obligation, sans base contractuelle.
- Refus non justifié : l’agent refuse pour « sécurité » sans règle opposable.
- Faux audit : l’agent simule une justification qui n’est rattachée à aucune juridiction.
Ces erreurs ne sont pas des problèmes de retrieval. Elles sont des problèmes de permission. Le système ne sait pas ce qu’il a le droit d’inférer, et ce qu’il doit laisser indéterminé.
Pourquoi le RAG amplifie parfois le risque
Il y a un paradoxe : un agent RAG peut être plus dangereux qu’un agent non RAG dans certains contextes. Pourquoi ? Parce que le RAG donne une aura de fiabilité. Le passage cité est réel. La source existe. L’utilisateur baisse sa vigilance. Or, la dérive ne se produit pas forcément sur la source, mais sur la conclusion tirée à partir de cette source.
Un agent peut citer correctement et conclure abusivement. Il peut être « factuel » localement et faux globalement. Cette forme de dérive est particulièrement difficile à détecter, car elle n’a pas le visage de l’hallucination classique.
Ce qui manque : une juridiction d’inférence
Pour rendre un agent métier auditable, il faut ajouter à la gouvernance RAG une gouvernance interprétative. Cette couche doit rendre explicites :
- Les périmètres : ce que l’agent couvre et ce qu’il ne couvre pas.
- Les interdictions d’inférence : ce qu’il est interdit de compléter (prix, garanties, conformité, sanctions, RH, engagements).
- Les silences obligatoires : ce qui doit rester indéterminé si la preuve n’existe pas.
- Les modes de décision : répondre, refuser, se taire, rediriger, escalader, selon des règles opposables.
Ce n’est qu’à ce prix que la réponse devient attribuable à une juridiction, plutôt qu’à une heuristique endogène.
Conclusion : le RAG gouverne la mémoire, pas la permission
Le RAG est une discipline de la mémoire. Il gouverne l’accès au corpus et la récupération de passages. Mais la question agentique critique est : de quoi l’agent a-t-il le droit de conclure ? Tant que cette permission n’est pas gouvernée, l’agent peut produire des sorties cohérentes mais non légitimes, même avec des sources impeccables.
Ancrage framework et définitions
Cadres applicables :
- RAG governance vs gouvernance interprétative
- Conditions de réponse opposables pour agents IA
- Gouvernance interprétative des agents IA
Définitions associées : gouvernance interprétative, SSA-E + A2 + Dual Web.