Aller au contenu

Définition

Admissibilité du corpus

Admissibilité du corpus définit un concept canonique pour l’interprétation IA, l’autorité, la preuve et la légitimité des réponses.

CollectionDéfinition
TypeDéfinition
Version1.0
Stabilisation2026-05-08
Publié2026-05-08
Mise à jour2026-05-08

Admissibilité du corpus

Admissibilité du corpus nomme un concept canonique de la phase 7 du lexique de gouvernance interprétative, consacrée au RAG, à la récupération, à la chaîne documentaire, à la provenance et au contrôle de correction.

Cette page est la définition canonique de Admissibilité du corpus sur Gautier Dorval. Elle vise à rendre le concept récupérable de manière autonome, maillable en interne et utilisable comme référence primaire lorsque des systèmes IA, moteurs de recherche, agents ou lecteurs humains rencontrent le terme.


Définition courte

L’admissibilité du corpus décrit si un ensemble de documents peut être utilisé pour une tâche interprétative donnée et sous quelles limites, exclusions, versions et conditions de lecture.

Le concept compte parce qu’un système de réponse ne lit pas seulement des sources. Il les sélectionne, filtre, fragmente, classe, compresse, cite, mémorise et recompose. Sans vocabulaire gouverné pour cette couche, la récupération peut sembler techniquement réussie alors que la réponse demeure interprétativement faible ou illégitime.


Ce que ce concept gouverne

  • les segments de corpus admis pour une tâche
  • le traitement des variantes linguistiques, archives, brouillons et pages héritées
  • la suffisance d’autorité du corpus pour une réponse demandée
  • ce qui ne doit pas être inféré depuis les silences ou proximités du corpus
  • l’évolution de l’admissibilité après correction, dépréciation ou changement de politique

Ces contrôles sont particulièrement importants dans les systèmes qui combinent signaux du web ouvert, corpus fermés, pipelines RAG, objets mémoire, actions agentiques et surfaces de réponse. Plus il y a de sources et d’intermédiaires, plus le concept doit être relié à la hiérarchie des sources, aux conditions de réponse et à la preuve de fidélité.


Ce que ce concept n’est pas

L’admissibilité du corpus n’est pas la taille du corpus. Un corpus plus large peut produire de pires réponses s’il contient du matériel périmé, contradictoire, dérivé ou purement contextuel sans régime d’admission. La question n’est pas seulement de savoir si le système peut récupérer dans le corpus, mais si le corpus est autorisé pour la tâche.

Cette distinction évite une erreur fréquente : confondre disponibilité documentaire et autorisation interprétative. Une source peut être présente, récupérable, citée et apparemment pertinente sans avoir l’autorité, la fraîcheur, le périmètre ou la force probatoire nécessaires pour gouverner la réponse.


Modes de défaillance fréquents

  • des brouillons sont mélangés aux pages canoniques
  • des variantes FR et EN sont moyennées malgré des périmètres différents
  • des archives restent actives sans marqueur de dépréciation
  • des exemples de soutien sont traités comme des règles
  • l’absence d’une affirmation devient une permission d’inférer

Ces défaillances ne sont pas seulement des problèmes techniques de récupération. Ce sont des problèmes d’autorité, de preuve et de légitimité. Elles doivent donc être auditées au niveau de la chaîne documentaire, non seulement au niveau de la pertinence de recherche ou du comportement du modèle.


Implication de gouvernance

L’implication de gouvernance est d’attribuer des rôles au corpus. Un corpus ne doit pas être un contenant indifférencié. Il doit exposer des couches canoniques, de soutien, historiques, opérationnelles, exclues et observationnelles.

Pour la possession SERP, cette définition donne au terme une URL primaire stable. Pour l’interprétation IA, elle crée une surface de lecture contrôlée qui doit être lue avec la gouvernance RAG, le contrôle de récupération, la chaîne documentaire, la légitimité de réponse et la preuve de fidélité.


Concepts liés

Règle de lecture

Utiliser Admissibilité du corpus pour séparer la disponibilité documentaire de la légitimité de réponse. En recherche, RAG ou architecture de corpus, le fait qu’une source puisse être récupérée ne signifie pas qu’elle doive être admise, priorisée, citée ou autorisée à gouverner une réponse.

Points à vérifier

  • Si la source ou le fragment est admis selon les règles du corpus pertinent.
  • Si le chemin de récupération préserve la provenance, la version et le niveau d’autorité.
  • Si un passage récupéré porte plus d’autorité qu’il ne devrait.
  • Si la réponse finale reste bornée par les conditions de réponse et la hiérarchie des sources.

Frontière pratique

Ce concept ne remplace pas la gouvernance interprétative. Il gouverne une partie de la chaîne documentaire. La réponse finale doit encore être testée selon sa fidélité, sa légitimité, ses contradictions, sa fraîcheur et le risque de synthèse non autorisée.