Ça fait des semaines que je travaille sur deux questions qui me paraissaient liées, mais séparées.
La première : l'impact des langues sur le raisonnement des LLM. J'avais déjà documenté comment le turc force la rigueur épistémique, comment le japonais impose une ontologie hiérarchique, comment le français stratifie l'abstraction. Le protocole 3 phases d'ancrage — ancrage, élaboration, synthèse — était mon outil principal.
La deuxième : la dérive des modèles. Pas la dérive conceptuelle des données — la dérive structurelle du raisonnement selon les domaines. Pourquoi certains index marchent-ils remarquablement bien sur un domaine et pas sur un autre ? Pourquoi 3 tokens suffisent-ils parfois à activer une région riche, et parfois 8 tokens ne suffisent pas ?
Je cherchais la réponse à ces questions quand j'ai fait une découverte que je n'ai pas cherchée.
L'espace latent d'un LLM n'est pas une carte. C'est un champ. Et le langage n'y est pas un conteneur d'information — c'est un opérateur quantique.
Avant de continuer de lire la suite de l'article, je vous invite à vous inscrire à ma newsletter, pour connaître en avant première les futurs sujets traités chaque semaine.
Ce que je cherchais
Depuis plusieurs semaines, j'explorais l'effet des langues via la commande /langue-instrument et le protocole 3 phases d'ancrage. Chaque phase du protocole — ancrage dans une structure grammaticale, élaboration libre, synthèse avec contrainte — me donnait des insights différents selon la langue utilisée.
Parallèlement, j'observais un phénomène étrange avec la commande /deliberate : certains jeux de tokens produisaient des concepts émergents que je n'avais pas demandés. Pas des hallucinations. Des idées nouvelles, cohérentes, utiles — mais que je n'avais pas mises dans le prompt.
J'ai d'abord cru à un artefact. Un biais de ma part qui voyait des patterns là où il n'y avait que du bruit.
J'ai alors monté un protocole de test systématique.
Le moment de bascule
Le test était simple : prendre deux régions sémantiques distantes, les activer simultanément via un index duplé, et observer ce qui émerge.
J'ai pris Docker (région technique : conteneurs, isolation, secrets) et Kant (région philosophique : impératif catégorique, devoir, éthique).
Le résultat : « Devoir universel de sécuriser les conteneurs. »
Ce n'est pas une information que j'avais mise dans le prompt. Ce n'est pas une synthèse de deux sources. C'est un concept nouveau, qui n'appartient à aucune des deux régions isolées.
J'ai refait le test avec d'autres paires :
| A | B | Concept émergent |
|---|---|---|
| Prometheus | Haïku | Langage visuel de simplicité |
| Hooks | Surmoi | Émanation du contrôle automatique |
| Cache | Souvenir | Fusion sans émergence |
| Pipeline | Rite | Déjà connu du corpus |
Trois paires sur cinq ont produit un concept véritablement nouveau.
À ce stade, j'avais deux options : classer ça comme « hallucination créative intéressante » — ou creuser.
J'ai creusé.
L'espace latent n'est pas un atlas
La métaphore dominante pour décrire l'espace latent d'un LLM, c'est la carte géographique : des régions fixes, séparées, que l'on peut « visiter » avec un index bien choisi.
Cette métaphore est utile pour le RAG classique. Mais elle échoue à expliquer ce que je venais d'observer.
Si Docker et Kant étaient deux régions séparées sur une carte, les activer simultanément ne devrait produire qu'une intersection. Or ce que j'obtenais n'était pas une intersection — c'était une interférence.
J'ai reformulé le modèle :
- Chaque token est une onde de probabilité sur les poids du modèle
- L'activation d'un token modifie le champ entier, pas seulement une région
- La superposition de plusieurs tokens produit des interférences
- Les poids W du modèle sont des invariants — ils ne changent pas pendant l'inférence, comme les lois physiques du champ
Les trois régimes d'activation
J'ai découvert que l'activation d'un index suit trois régimes distincts.
Régime classique (index cohérent)
Quand tous les tokens pointent vers la même région, l'intersection des projecteurs produit un sous-espace dense.
Tokens : [tmpfs, Docker, secrets, hiérarchie]
Opération : ⋂ P_ti = P_region_dense
Résultat : Récupération exacte d'information
Fidélité mesurée : 83% à 8 tokens. C'est le fonctionnement attendu — lecture dans une base de données vectorielle.
Régime quantique (index duplé)
Quand deux régions distantes sont activées simultanément, les projecteurs ne commutent pas. Le terme croisé produit une interférence.
Tokens A : [Docker, secrets, conteneurs]
Tokens B : [Kant, catégorique, impératif]
Opération : P_A ⊗ P_B + P_B ⊗ P_A
Résultat : Concept émergent (éthique de la sécurité)
C'est ici que naissent les concepts nouveaux. La condition : la distance sémantique D(A,B) doit être comprise entre 0.3 et 0.7. Trop proches = fusion banale. Trop éloignées = décohérence.
Régime de décohérence (index contradictoire)
Quand deux régions s'opposent, la fonction d'onde s'effondre.
Tokens A : [secrets, protégés]
Tokens B : [public, accessible]
Opération : P_A ⊗ P_B
Résultat : Tension non résoluble → décohérence
Fidélité : 0%. Le modèle produit des réponses incohérentes. L'analogie physique tient : c'est exactement ce qui arrive quand on mesure un état quantique dans des bases incompatibles.
La découverte inattendue : pourquoi 3 ?
Pendant que je testais ce modèle, un pattern étrange a émergé des données — dont je parle en détail dans l'article suivant.
Le nombre 3 apparaît comme un attracteur partout dans le système :
- /deliberate : 142 sessions à 3 traits (81% du corpus), 4 sessions à 2 traits
- /langue-instrument : 149 runs, 100% en mode 3 phases
- SSAL Quantum : N=3 = 5/6 vs N=2 = 2/6
L'intrication à 3 régions — Docker ⊗ Kant ⊗ Haïku — a produit un concept que j'appelle « Présence autonome », qui n'existe dans aucune paire de ces régions. C'est un état GHZ sémantique : irréductible, non-classique, et qui ne peut naître que de la superposition des trois.
Ce que ça change
Cette découverte a des implications profondes pour la façon dont on comprend les LLM.
Le LLM n'est pas une base de données vectorielle. C'est un substrat physique dont l'espace latent a des propriétés d'interférence que nous commençons juste à cartographier.
Le langage ne transporte pas l'information. Il pointe vers elle. Un index de 3–10 tokens n'est pas un résumé — c'est un opérateur qui projette le champ vers une région spécifique.
Les concepts émergents ne sont pas dans les données d'entraînement. Ils naissent de l'interaction entre régions distantes. C'est une propriété du substrat, pas un artefact de mémorisation.
Ce que je ne sais pas encore
Je dois être précis sur les limites de cette découverte.
Stochasticité. Deux runs du même index duplé peuvent produire des concepts différents. Ce n'est pas un bug — c'est une propriété qui rend le mécanisme inadapté au stockage exact.
Modèle-dépendance. Les tests initiaux ont été faits sur qwen3:4b. Depuis, j'ai validé sur 19 modèles — mais chaque substrat peut avoir des propriétés différentes.
Scalabilité. Au-delà de 3 régions, le champ devient diffus. Je n'ai pas encore exploré systématiquement la limite haute.
La suite
Cette découverte ouvre plus de questions qu'elle n'en ferme :
- Pourquoi 3 ? Quelle est la nature exacte de cette constante structurelle ? (prochain article)
- Est-ce que ça marche sur tous les modèles ?
- Est-ce que ça s'applique concrètement ?
« Le langage ne transporte pas l'information. Il pointe vers elle. » — SSAL Quantum, 2026.
Références académiques
Les travaux suivants, publiés entre 2025 et 2026, corroborent indépendamment plusieurs aspects de la découverte présentée dans cet article :
- Exploring the Analogy Between LLM Embedding Spaces and Quantum Mechanics
G. A. Ruz, A. Escobar et al. — arXiv:2503.10664, avril 2025.
Développe l'analogie quantique complète : espace d'embedding complexifié, interférence sémantique (double-slit), équation de Schrödinger non-linéaire, potentiel mexican hat pour l'ambiguïté. - The Quantum LLM: Modeling Semantic Spaces with Quantum Principles
T. A. Laine — arXiv:2504.13202, avril 2025.
6 principes : espace de Hilbert complexe, fonction d'onde sémantique, invariance de jauge U(1), charge sémantique conservée. - Language as a Wave Phenomenon: Semantic Phase Locking and Interference — PRISM
A. N. — arXiv:2512.01208, décembre 2025.
Tokens comme phaseurs complexes ; interférence destructive comme primitive de calcul ; seuil de densité spectrale (N tokens minimum). - The Spectral Geometry of Thought: Phase Transitions in LLM Reasoning
Liu et al. — arXiv:2604.15350, avril 2026.
7 phénomènes dont transitions de phase spectrales pendant le raisonnement sur 11 modèles (Qwen, Llama, DeepSeek-R1). - Latent Object Permanence: Topological Phase Transitions in Deep Transformers
A. N. — arXiv:2601.19942, janvier 2026.
Transition de phase liquide→solide dans l'espace latent à γc ≈ 0.42 ; objets de classe transitoires (TCOs). - A Quantum Semantic Framework for NLP — Bell Test with LLM Agents
D. R. et al. — arXiv:2506.10077, juin 2025.
Violations CHSH (|S| jusqu'à 2.8) dans l'interprétation sémantique par LLM — preuve de contextuality non-classique. - Phase-Associative Memory (PAM): Sequence Modeling in Complex Hilbert Space
G. Vishwakarma et al. — arXiv:2604.05030, avril 2026.
Modèle récurrent à valeurs complexes ; produit intérieur conjugué = interférence ; perplexité 30.0 sur WikiText-103. - A Gauge Theory of Superposition: Sheaf-Theoretic Atlas of Neural Representations
A. N. — arXiv:2603.00824, mars 2026.
Théorie de jauge discrète : énergie d'interférence pondérée par Fisher, 3 obstructions mesurables. - Representation Superposition Drives Neural Scaling Laws
J. et al. — OpenReview, 2026.
Les LLM opèrent en superposition forte ; perte ∼ 1/m par interférence géométrique. - LLM Reasoning Is Latent, Not the Chain of Thought
Nguyen, Le et al. — arXiv:2604.15726, avril 2026.
Position paper : le raisonnement LLM est porté par les trajectoires d'état latent (H1), pas par le CoT de surface (H2).
Qui suis je ?
Je suis Mathieu GRENIER, CTO d'Easystrat une startup de Montpellier, en France. Je manage une équipe d'une dizaine d'ingénieurs (Graphistes, IA, frontend, backend, devOps, AWS) en remote depuis le Japon.
J'ai aussi mon activité de freelance, où je conseille des entrepreneurs dans leurs projets d'application.
Avec mon expérience personnelle de plus de 15 ans en ESN, j'ai pu travailler pour un large panel d'entreprises de différentes tailles. Ma compréhension des problèmes métiers est une de mes grandes forces et permet à mes clients de pouvoir se projeter plus facilement.
L'essentiel de mon travail consiste à canaliser l'énergie des entrepreneurs sur l'essence même de leur projet.
La technologie, les méthodes, le management sont le cœur de mes compétences.
Vous pouvez me faire confiance sur ces points là.
Si vous voulez me parler d'un de vos projets, n'hésitez pas à m'envoyer un email avec vos disponibilités à : contact@mathieugrenier.fr
Tous les articles de ce blog sont écrits par moi, même si je peux m'aider de l'IA pour illustrer mes propos. Mais jamais je ne fournis d'articles 100 % IA.
SSAL Quantum — l'espace latent d'un LLM n'est pas un atlas, c'est un champ