Échantillonnage, représentativité et corpus de comparaison

Un corpus doctrinal qui publie des comparaisons finit rapidement par rencontrer une question plus difficile qu’elle n’en a l’air : qu’est-ce qu’un bon échantillon ? Tant que la doctrine se contente d’illustrer un concept, la réponse reste vague. Dès qu’elle publie des benchmarks publics, des cas de test formalisés ou des dossiers comparés, l’échantillonnage cesse d’être une question logistique. Il devient un problème de portée doctrinale.

Un corpus mal composé peut montrer quelque chose de vrai localement et pourtant conduire à une généralisation trompeuse. À l’inverse, un corpus plus modeste mais mieux borné peut rendre visibles des tensions bien plus utiles : cas négatifs, conflits de version, surfaces tierces dominantes, traductions décalées, états archivés, exceptions procédurales, formes légitimes de non-réponse.

Cette page prolonge les benchmarks publics, l’observabilité appliquée et la jurisprudence doctrinale. Elle fixe une exigence simple : un échantillon publiable doit rendre explicite ce qu’il couvre, ce qu’il ne couvre pas, et le type de généralisation qu’il autorise réellement.

1. Pourquoi l’échantillonnage est une question de doctrine

Dans les pratiques faibles, l’échantillonnage est traité comme un détail technique. On retient quelques cas disponibles, quelques exemples convaincants, quelques captures lisibles, puis on laisse la série porter une conclusion trop large.

Dans un corpus doctrinal, cette facilité est dangereuse. Le problème n’est pas seulement le biais statistique. Le problème est le décalage entre la portée du corpus et la portée de l’énoncé. Un site peut comparer trois cas et parler comme s’il avait cartographié un régime. Il peut observer une seule langue et parler comme s’il avait décrit une dynamique générale. Il peut retenir des cas propres et oublier précisément ceux qui rendent la doctrine exigeante.

L’échantillonnage devient donc doctrinal lorsqu’il conditionne la forme légitime de ce qu’on peut dire. Une série mal composée n’est pas seulement moins robuste. Elle autorise un discours trop grand pour son périmètre réel.

2. Cinq objets qu’il faut distinguer

a) L’échantillon

L’échantillon est le sous-ensemble effectivement observé. Il ne dit rien par lui-même sur sa qualité. Il faut encore savoir selon quelle règle il a été constitué.

b) Le corpus de comparaison

Le corpus de comparaison est l’ensemble borné à l’intérieur duquel la comparaison est réputée valable. Il inclut souvent les cas observés, les exclusions, les variantes et les conditions de lecture.

c) La strate

La strate désigne une famille de cas que l’on veut rendre visible dans le corpus : multilingue, tiers exogène, surface multimodale, exception procédurale, archive, non-réponse, conflit de version, etc.

d) Le montage minimal

Le montage minimal isole un mécanisme précis. Il ne vise pas la représentativité d’ensemble, mais la lisibilité d’une tension. Il prépare le cas de test formalisé.

e) La série publiable

La série publiable est l’ensemble final que le site expose. Elle n’a pas besoin d’être exhaustive, mais elle doit être honnête sur sa construction et sa portée.

Sans ces distinctions, un corpus passe facilement du démonstratif au généralisant sans le déclarer.

3. Ce que « représentatif » veut réellement dire ici

Dans un site doctrinal, la représentativité n’est pas nécessairement une ambition statistique au sens fort. Elle est d’abord une exigence de couverture des tensions pertinentes.

Un corpus peut être relativement petit et pourtant bien construit s’il couvre plusieurs régimes qui comptent réellement pour la doctrine : variation de source, variation de langue, variation de temporalité, cas négatif, exception, archive active, surface tierce dominante, conflit entre canon et reprise, ou forme légitime de suspension.

À l’inverse, un corpus volumineux peut être pauvre s’il répète indéfiniment le même type de cas, dans la même langue, sur le même périmètre, avec le même niveau de propreté documentaire.

Autrement dit, un corpus n’est pas plus représentatif parce qu’il contient « plus ». Il l’est davantage lorsqu’il rend visible la diversité des contraintes que l’énoncé prétend couvrir.

4. Les dérives classiques d’un corpus mal composé

La première dérive est le cherry-picking : ne retenir que les cas démonstratifs, ceux où l’architecture paraît élégante ou où le système échoue de manière spectaculaire.

La deuxième est l’homogénéité trompeuse : comparer uniquement des surfaces propres, textuelles, récentes, bien liées, et conclure ensuite sur des terrains où les archives, les captures, les traductions ou les profils tiers jouent un rôle majeur.

La troisième est l’écrasement de temporalité : mélanger des états historiques, courants et supersédés sans déclarer leur statut.

La quatrième est l’effacement des cas négatifs : exclure les non-réponses, les refus légitimes, les sorties partielles, les cas indécidables, ou les contradictions non résolues.

La cinquième est la généralisation rhétorique : parler d’un système, d’un régime ou d’une famille entière alors que le corpus ne porte en réalité que sur une strate étroite.

5. Conditions minimales d’un corpus de comparaison publiable

Un corpus de comparaison publiable devrait rendre visibles au minimum :

la règle d’inclusion des cas ;
les strates retenues et les strates absentes ;
la présence de cas négatifs et de formes de non-réponse ;
la période d’observation et le statut temporel des objets ;
la relation entre le corpus et l’énoncé qu’il prétend soutenir ;
les conditions de révision : ajout, retrait, rectification, supersession.

Ces conditions n’ont pas pour but d’écraser toute publication sous la méthode. Elles visent seulement à empêcher qu’un corpus très local soit lu comme un jugement général sur un régime plus large.

6. Du cas singulier au benchmark : quelle progression saine ?

Une progression doctrinalement propre distingue plusieurs niveaux.

Le cas limite révèle une tension. Le dossier comparé reconstruit cette tension avec ses pièces et sa hiérarchie. Le montage interprétatif minimal isole un mécanisme. Le benchmark ou la baseline intègre plusieurs objets dans une série. Entre ces niveaux, l’échantillonnage joue le rôle de charnière. Il décide quelles tensions deviennent visibles dans la publication.

C’est pourquoi cette page rencontre directement les archives et la rectification. Un bon corpus ne déclare pas seulement ses cas. Il déclare aussi comment il révisera leur série lorsqu’un état sera retiré, supersédé ou requalifié.

7. Portée et limite

Cette page ne propose ni théorie universelle de l’échantillonnage, ni benchmark total, ni promesse d’exhaustivité. Elle fixe une exigence plus modeste : lorsqu’un corpus doctrinal compare, illustre ou observe, il doit faire correspondre la construction de son corpus au niveau réel de généralisation qu’il revendique.

Un site doctrinal peut publier des séries faibles, locales et partielles. Il devient fragile seulement lorsqu’il oublie de dire qu’elles le sont.

Échantillonnage, représentativité et corpus de comparaison