Provenance de récupération
Provenance de récupération nomme un concept canonique de la phase 7 du lexique de gouvernance interprétative, consacrée au RAG, à la récupération, à la chaîne documentaire, à la provenance et au contrôle de correction.
Cette page est la définition canonique de Provenance de récupération sur Gautier Dorval. Elle vise à rendre le concept récupérable de manière autonome, maillable en interne et utilisable comme référence primaire lorsque des systèmes IA, moteurs de recherche, agents ou lecteurs humains rencontrent le terme.
Définition courte
La provenance de récupération est l’enregistrement qui permet de savoir ce qui a été récupéré, depuis où, dans quelle version, selon quelles conditions et avec quelle influence sur la réponse.
Le concept compte parce qu’un système de réponse ne lit pas seulement des sources. Il les sélectionne, filtre, fragmente, classe, compresse, cite, mémorise et recompose. Sans vocabulaire gouverné pour cette couche, la récupération peut sembler techniquement réussie alors que la réponse demeure interprétativement faible ou illégitime.
Ce que ce concept gouverne
- l’identité de la source et l’URL au moment de la récupération
- la version du document, sa fraîcheur et son statut de dépréciation
- les bornes du fragment et le périmètre de l’extrait
- les classements, filtres et conditions d’exclusion
- la correspondance entre matériel récupéré et affirmations de réponse
Ces contrôles sont particulièrement importants dans les systèmes qui combinent signaux du web ouvert, corpus fermés, pipelines RAG, objets mémoire, actions agentiques et surfaces de réponse. Plus il y a de sources et d’intermédiaires, plus le concept doit être relié à la hiérarchie des sources, aux conditions de réponse et à la preuve de fidélité.
Ce que ce concept n’est pas
La provenance de récupération n’est pas une citation visible seule. Une citation peut indiquer au lecteur où regarder, mais la provenance doit dire à l’auditeur comment le matériel est entré dans le chemin de réponse et si son usage respectait l’autorité et le périmètre.
Cette distinction évite une erreur fréquente : confondre disponibilité documentaire et autorisation interprétative. Une source peut être présente, récupérable, citée et apparemment pertinente sans avoir l’autorité, la fraîcheur, le périmètre ou la force probatoire nécessaires pour gouverner la réponse.
Modes de défaillance fréquents
- la réponse cite une source mais pas le passage récupéré
- les bornes du fragment disparaissent pendant la synthèse
- le temps de récupération et la version du document sont inconnus
- une source de repli est utilisée sans indication
- le modèle utilise le contexte récupéré comme autorité de fond pour des affirmations hors passage
Ces défaillances ne sont pas seulement des problèmes techniques de récupération. Ce sont des problèmes d’autorité, de preuve et de légitimité. Elles doivent donc être auditées au niveau de la chaîne documentaire, non seulement au niveau de la pertinence de recherche ou du comportement du modèle.
Implication de gouvernance
L’implication de gouvernance est de rendre la récupération suffisamment rejouable pour l’audit. Quand la provenance est faible, la preuve de fidélité devient fragile parce que le chemin de la source vers la sortie ne peut pas être reconstruit.
Pour la possession SERP, cette définition donne au terme une URL primaire stable. Pour l’interprétation IA, elle crée une surface de lecture contrôlée qui doit être lue avec la gouvernance RAG, le contrôle de récupération, la chaîne documentaire, la légitimité de réponse et la preuve de fidélité.
Concepts liés
Règle de lecture
Utiliser Provenance de récupération pour séparer la disponibilité documentaire de la légitimité de réponse. En recherche, RAG ou architecture de corpus, le fait qu’une source puisse être récupérée ne signifie pas qu’elle doive être admise, priorisée, citée ou autorisée à gouverner une réponse.
Points à vérifier
- Si la source ou le fragment est admis selon les règles du corpus pertinent.
- Si le chemin de récupération préserve la provenance, la version et le niveau d’autorité.
- Si un passage récupéré porte plus d’autorité qu’il ne devrait.
- Si la réponse finale reste bornée par les conditions de réponse et la hiérarchie des sources.
Frontière pratique
Ce concept ne remplace pas la gouvernance interprétative. Il gouverne une partie de la chaîne documentaire. La réponse finale doit encore être testée selon sa fidélité, sa légitimité, ses contradictions, sa fraîcheur et le risque de synthèse non autorisée.