Extractibilité
L’extractibilité est la capacité d’un passage, d’un énoncé, d’un tableau, d’une définition ou d’une section de page à être segmenté et réutilisé par un système machine sans perdre le sens qui le rend valide.
L’extractibilité n’est pas de la simplification. Elle rend les énoncés importants assez portables pour survivre à la récupération, aux fragments, au résumé et à la citation, tout en gardant périmètre et limites visibles.
Ce que l’extractibilité ne garantit pas
Une page extractible n’est pas automatiquement récupérée, citée, recommandée ou classée par un système IA. L’extractibilité décrit la forme d’un passage une fois la page accessible ou récupérée ; elle ne remplace ni l’autorité de la source, ni la fraîcheur, ni la hiérarchie documentaire, ni la mesure empirique des sorties.
Elle doit donc être lue comme un signal auxiliaire de gouvernance du contenu. Un passage peut être facile à extraire et rester incomplet, trop promotionnel ou insuffisamment borné. Dans ce cas, l’extractibilité augmente la portabilité d’un énoncé, mais peut aussi augmenter le risque de troncature, de substitution ou de projection.
Signaux pratiques
Un passage extractible présente généralement une réponse directe, un sujet nommé, un périmètre explicite, une limite de non-implication et une relation claire avec une source canonique ou une preuve. La meilleure forme n’est pas la phrase la plus courte ; c’est la phrase qui peut être reprise sans perdre ce qui la rend juste.