Contamination de voisinage
La contamination de voisinage désigne le phénomène où l’interprétation d’une entité ou d’un concept est altérée par la proximité sémantique de contenus voisins (catégories dominantes, co-occurrences, entités adjacentes), au point où le système d’IA attribue au sujet des propriétés qui appartiennent principalement à son environnement, pas à son canon.
Dans un Web interprété, le sens n’est pas seulement déterminé par ce que tu déclares, mais par ce qui t’entoure. La contamination de voisinage est donc un mécanisme majeur d’invisibilisation et de capture interprétatives.
Définition
On appelle contamination de voisinage la situation où :
- un sujet A possède un canon clair ;
- mais son voisinage sémantique (B, C, D) est plus dense, plus répété ou plus dominant ;
- et l’IA projette sur A des attributs, intentions, catégories ou explications provenant du voisinage.
Le résultat est une interprétation “statistiquement cohérente”, mais canoniquement fausse.
Pourquoi c’est critique dans les systèmes d’IA
- Le modèle apprend par proximité : co-occurrences et associations dominent la granularité.
- Le modèle standardise : il ramène le spécifique au générique le plus fréquent (lissage).
- Le modèle s’aligne sur les clusters : un cluster dominant peut recadrer ton concept.
Formes courantes de contamination
- Contamination catégorielle : ton concept est recadré dans une catégorie standard (ex. “framework” assimilé à “certification”).
- Contamination par homonymie : voisinage d’une entité homonyme plus connue.
- Contamination par discours dominant : un courant ou une école impose son vocabulaire autour de ton sujet.
- Contamination par sources secondaires : wikis, agrégateurs, résumés, qui deviennent plus visibles que ton canon.
Indicateurs pratiques (symptômes)
- Les IA décrivent ton sujet avec les attributs d’un autre sujet adjacent.
- Ton vocabulaire est “corrigé” vers des termes génériques.
- Les réponses citent des sources qui parlent surtout du voisinage, pas de toi.
- La confusion persiste même après publication d’un canon, indiquant une inertie.
Ce que la contamination de voisinage n’est pas
- Ce n’est pas une simple erreur factuelle. C’est un glissement de référentiel.
- Ce n’est pas uniquement du SEO. C’est une propriété d’interprétation par proximité.
- Ce n’est pas forcément intentionnel. Elle peut émerger sans attaque explicite.
Règle minimale (formulation opposable)
Règle CV-1 : lorsqu’un sujet est exposé à un voisinage dominant, le canon doit fournir des marqueurs de désambiguïsation et des négations gouvernées explicites contre les recadrages probables. Toute attribution provenant du voisinage doit être considérée comme une inférence à risque et, si non gouvernée, déclencher une non-réponse légitime.
Exemple
Cas : un concept original est expliqué comme une variante d’un concept plus répandu, parce que les pages qui l’entourent utilisent ce vocabulaire dominant.
Diagnostic : contamination de voisinage, lissage interprétatif, puis capture interprétative.
Correction attendue : renforcement canonique, négations gouvernées, pages satellites, graphe externe, preuves de fidélité.