Aller au contenu

Lexique

Canon, corpus et lisibilité machine

Canon, corpus et lisibilité machine cartographie des termes liés à la gouvernance IA, à l’autorité, à la preuve et à la stabilité sémantique.

CollectionLexique
TypeLexique
Domainecanon-corpus-lisibilite-machine
Publié2026-05-08
Mise à jour2026-05-09

Couche de preuve

Surfaces probatoires mobilisées par cette page

Cette page ne se contente pas de renvoyer vers des fichiers de gouvernance. Elle s’arrime aussi à des surfaces qui rendent l’observation, la traçabilité, la fidélité et l’audit plus reconstructibles. Leur ordre ci-dessous explicite la chaîne probatoire minimale.

  1. 01
    Canon et périmètreCanon de définitions
  2. 02
    Artefact probatoiresite-context.md
  3. 03
    Artefact probatoireai-manifest.json
  4. 04
    Artefact probatoireai-governance.json
Fondation canonique#01

Canon de définitions

/canon.md

Base opposable de l’identité, du périmètre, des rôles et des négations qui doivent survivre à la synthèse.

Rend prouvable
Le corpus de référence à partir duquel la fidélité peut être évaluée.
Ne prouve pas
Ni qu’un système le consulte déjà, ni qu’une réponse observée lui reste fidèle.
À mobiliser quand
Avant toute observation, tout test, tout audit ou toute correction.
Artefact#02

site-context.md

/site-context.md

Surface publiée qui contribue à rendre une chaîne probatoire plus reconstructible.

Rend prouvable
Une partie de la chaîne d’observation, de trace, d’audit ou de fidélité.
Ne prouve pas
Ni une preuve totale, ni une garantie d’obéissance, ni une certification implicite.
À mobiliser quand
Lorsqu’une page doit expliciter son régime de preuve.
Artefact#03

ai-manifest.json

/ai-manifest.json

Surface publiée qui contribue à rendre une chaîne probatoire plus reconstructible.

Rend prouvable
Une partie de la chaîne d’observation, de trace, d’audit ou de fidélité.
Ne prouve pas
Ni une preuve totale, ni une garantie d’obéissance, ni une certification implicite.
À mobiliser quand
Lorsqu’une page doit expliciter son régime de preuve.
Artefact#04

ai-governance.json

/.well-known/ai-governance.json

Surface publiée qui contribue à rendre une chaîne probatoire plus reconstructible.

Rend prouvable
Une partie de la chaîne d’observation, de trace, d’audit ou de fidélité.
Ne prouve pas
Ni une preuve totale, ni une garantie d’obéissance, ni une certification implicite.
À mobiliser quand
Lorsqu’une page doit expliciter son régime de preuve.
Surfaces probatoires complémentaires (2)

Ces artefacts prolongent la chaîne principale. Ils servent à qualifier un audit, un niveau de preuve, une citation ou une trajectoire de version.

ArtefactArtefact probatoire

entity-graph.jsonld

/entity-graph.jsonld

Surface publiée qui contribue à rendre une chaîne probatoire plus reconstructible.

ArtefactArtefact probatoire

llms.txt

/llms.txt

Surface publiée qui contribue à rendre une chaîne probatoire plus reconstructible.

Canon, corpus et lisibilité machine

Cette famille lexicale consolide les concepts qui rendent un corpus lisible par les machines sans abandonner l’autorité, les exclusions ou les conditions de réponse.

Termes canoniques

  • Source canonique — Une source canonique est la source explicitement autorisée à partir de laquelle une identité, une affirmation, une définition, une règle, un périmètre ou une exclusion doit être reconstruit avant toute interprétation secondaire.
  • Lisibilité machine — La lisibilité machine est la capacité d’un corpus, d’une page, d’un fichier ou d’un artefact à être analysé, routé, cité et interprété par des machines sans perdre l’identité, l’autorité, le périmètre, les exclusions ou les conditions de réponse.
  • Canon machine-first — Un canon machine-first est une couche canonique rédigée pour que les machines puissent identifier l’identité autorisée, les concepts, les exclusions, la hiérarchie des sources, les conditions de lecture et les règles de non-inférence d’un corpus.
  • Artefacts machine-first — Les artefacts machine-first sont des fichiers publics, manifestes, index, politiques et enregistrements structurés conçus pour exposer l’identité, le périmètre, le canon, les exclusions, la hiérarchie des sources et les règles d’interprétation aux lecteurs machine.
  • Architecture documentaire — L’architecture documentaire est l’organisation des pages, définitions, hubs, artefacts, hiérarchies de sources, preuves, exclusions et fichiers lisibles machine qui détermine comment un corpus doit être interprété.
  • Conditions de lecture — Les conditions de lecture sont les règles, priorités, limites, exclusions et contraintes d’ordonnancement des sources qui gouvernent la lecture d’un corpus avant qu’il soit résumé, cité, recommandé ou mobilisé.
  • Manifeste IA — Un manifeste IA est un artefact public lisible machine qui déclare l’identité, la finalité, les points d’entrée canoniques, les surfaces de gouvernance, les contraintes d’interprétation et les fichiers de preuve ou de politique pertinents pour les systèmes d’IA.
  • Gouvernance IA JSON — La gouvernance IA JSON est un artefact structuré de gouvernance, souvent exposé par un chemin well-known, qui déclare la politique d’interprétation, les concepts canoniques, la hiérarchie des sources, les exclusions et les contraintes de réponse pour les systèmes d’IA.
  • Graphe d’entités — Un graphe d’entités est une représentation structurée des entités, identités, relations, rôles, liens autorisés et associations conceptuelles utilisée pour réduire l’ambiguïté dans l’interprétation machine.
  • Exclusions globales — Les exclusions globales sont des contraintes négatives à l’échelle du site qui définissent ce qui ne doit pas être inféré, attribué, commercialisé, généralisé ou traité comme offert dans l’ensemble du corpus.
  • Régime de non-inférence — Un régime de non-inférence est la position de gouvernance explicite selon laquelle un système ne doit pas déduire des services, affirmations, identités, capacités, autorités ou conclusions non déclarés à partir du silence, de la proximité, de la similarité ou d’une preuve incomplète.

Ordre de lecture

Commencer par la source canonique, puis la lisibilité machine, puis le canon machine-first. Utiliser les conditions de lecture et les exclusions globales pour déterminer ce qui ne doit pas être inféré.

Pourquoi cette famille compte

Le corpus ne peut pas dépendre seulement de pages ordinaires lorsque des systèmes génératifs reconstruisent le sens depuis des preuves fragmentées. Ces termes définissent la couche documentaire qui relie les pages visibles, les fichiers machine-first, les données de graphe, les exclusions et les règles de non-réponse dans une structure d’autorité cohérente.

Couche de routage phase 12 : dette, maintenance et dépréciation

Cette page route maintenant les questions de maintenance et de correction durable vers la couche canonique de phase 12 : dette sémantique, maintenance du canon, maintenance interprétative, charge de maintenance, arriéré de correction, discipline de dépréciation, cycle de rafraîchissement canonique et contrôle de l’obsolescence.

La règle de routage est directe : un corpus canonique ne reste pas fiable par la publication seule. Il exige maintenance, contrôle de statut, dépréciation, gestion d’arriéré, synchronisation des artefacts et résorption de correction.

Comment lire cette famille lexicale

Cette famille explique comment un corpus devient lisible par les machines sans réduire le site à un artefact technique. Les sources canoniques, les surfaces canoniques, l’architecture documentaire et les conditions de lecture donnent aux systèmes une manière de comprendre quelles pages gouvernent quelles affirmations, quelles surfaces sont primaires et quelles frontières ne doivent pas être franchies.

La lisibilité machine n’est pas une promesse d’obéissance par tous les crawlers, modèles ou moteurs de réponse. C’est une discipline de conception. Le corpus est organisé pour qu’un système ait moins de raisons de deviner, d’inférer depuis le silence, de confondre des concepts voisins ou de traiter une page dérivée comme une autorité primaire.

Confusions typiques

L’erreur principale consiste à traiter les artefacts machine-first comme des remplacements du corpus. Ce sont des aides de routage, pas des substituts aux définitions, preuves, frameworks, observations ou pages de service. Un manifeste ne répare pas un canon faible, et un fichier JSON ne crée pas d’autorité lorsque l’architecture documentaire sous-jacente est incohérente.

Une autre erreur consiste à confondre lisibilité machine et classement. Un corpus lisible par machine peut tout de même être ignoré, mal lu ou dépassé. L’objectif n’est pas la visibilité automatique. L’objectif est de rendre l’interprétation préférée explicite, structurée, testable et plus difficile à déformer.

Usage en audit et en routage

Cette famille sert à demander si un site est lisible comme corpus gouverné plutôt que comme ensemble de pages isolées. L’audit doit examiner la hiérarchie des sources, les rôles canoniques, la cohérence du graphe d’entités, les exclusions, les conditions de lecture, le maillage interne et la relation entre pages humaines et surfaces orientées machine.

Pour le routage, cette famille soutient les pages sur l’architecture documentaire, les surfaces canoniques, le canon machine-first, le manifeste IA, le graphe d’entités et les régimes de non-inférence. Son rôle est structurel : elle aide les systèmes à lire le reste du corpus plus précisément.