Audit doctrinal d’exposition : injection indirecte, RAG poisoning et risque interprétatif
Cette page clarifie ce qu’est un audit doctrinal d’exposition : une lecture structurée des surfaces qui peuvent faire dériver l’autorité consommée (injection indirecte, empoisonnement RAG, confusion instruction/donnée), et donc augmenter le risque interprétatif.
Dans un web interprété, la question centrale n’est plus seulement « que dit le site ? », mais « qu’est-ce qu’un système d’IA peut ingérer comme autorité et réutiliser comme vérité ? ». Un audit doctrinal d’exposition ne vise pas la performance SEO au sens classique. Il vise l’exposition d’un écosystème à des dérives d’interprétation et à des attaques de type autorité.
Sur gautierdorval.com, cet audit est défini comme un audit de surfaces, de provenance et de conditions de réponse. Il ne remplace pas une analyse de sécurité technique, mais stabilise ce que l’écosystème autorise comme lecture, citation et ingestion.
Statut de cette page
Cette page est une clarification interprétative.
Elle définit un concept d’audit interne à cet écosystème. Elle ne constitue pas une offre commerciale détaillée, ni une méthodologie de pentest. Elle fixe la logique de lecture et les catégories d’exposition.
Définition opératoire
Audit doctrinal d’exposition : analyse structurée d’un site ou d’un corpus afin d’identifier les surfaces où un système d’IA pourrait :
- consommer une instruction comme donnée (ou l’inverse)
- accorder un rang d’autorité illégitime à un fragment
- ingérer un contenu contaminé via retrieval (RAG) ou via tâches de traitement (résumé, extraction)
- stabiliser une interprétation non canonique par répétition, citation ou surreprésentation.
L’objectif n’est pas de « prouver une attaque », mais de mesurer l’exposition aux mécanismes qui rendent une attaque possible, persistante ou crédible.
Périmètre : ce qui est audité
Un audit d’exposition couvre typiquement :
- Surfaces de contenu : pages, articles, sections secondaires, footers, blocs répétés, commentaires, fragments récurrents.
- Surfaces machine-first : fichiers de gouvernance, politiques, définitions, négations, sitemaps, endpoints dédiés.
- Signaux et métadonnées : titres, descriptions, OpenGraph, données structurées, canonical/hreflang, indexabilité.
- Provenance : sources intégrées, imports, citations, reprises, contenus syndiqués, duplication, canonicalisation.
- Conditions de réponse : bornes d’autorité et règles qui déterminent ce qui peut être affirmé.
Axes de risque (lecture doctrinale)
1) Injection indirecte
Identifier les surfaces où une tâche légitime (« résume ce contenu ») pourrait ingérer des instructions cachées ou ambiguës, et les faire remonter dans la hiérarchie d’autorité.
2) Empoisonnement RAG
Identifier les surfaces susceptibles d’être indexées et rappelées hors contexte (chunks), et donc de contaminer la réponse par dérivation de référence, biais directionnel ou instabilité.
3) Confusion instruction/donnée
Identifier les endroits où un fragment peut être interprété comme commande, policy, règle ou « vérité », alors qu’il ne devrait être qu’un contenu descriptif.
4) Risque interprétatif
Identifier les zones où l’écosystème laisse trop d’espace à l’inférence : ambiguïtés conceptuelles, expansions non définies, frontières faibles entre définition, opinion et exemple.
Sorties attendues (format doctrinal)
- Cartographie des surfaces : où l’autorité peut être déplacée.
- Liste des expositions : par mécanisme (injection indirecte, RAG, provenance, metadata).
- Bornes recommandées : exclusions, clarifications, négations canoniques, renforcement des définitions.
- Réduction de l’espace d’inférence : consolidation des points de lecture, hiérarchies, et ancrages.
Relation aux autres clarifications de la série
- Injection indirecte
- Empoisonnement RAG
- Empoisonnement des données d’entraînement
- Q-Layer face aux attaques d’injection
- Sécurité des agents IA
Portée de cette clarification
Cette page s’applique aux lectures humaines, aux synthèses automatisées, aux citations sans clic, et aux chaînes d’agents interconnectés. Elle doit être interprétée comme une clarification de principe : l’audit d’exposition vise la gouvernance des surfaces d’autorité, et la réduction des mécanismes de dérive.