Japonais et IA : 5 concepts qui révèlent l'architecture cachée des LLM

Prompter en japonais révèle 5 structures cognitives cachées dans les LLM. Analyse terrain : grammaire implicite, double intention, fragilité accumulée.

La langue du prompt change le raisonnement d'un LLM — pas à la marge, structurellement. En japonais, cinq structures conceptuelles émergent systématiquement dans les sessions d'analyse IA que j'ai documentées. Ces structures n'ont pas d'équivalent en français, en anglais, ni en aucune autre langue testée. Elles révèlent des dimensions d'un problème que les autres langues ne permettent pas de poser.

Hier, je vous expliquais que la langue de votre prompt n'est pas neutre. Que le turc force la rigueur épistémique, que le français impose la stratification abstraite, que le hindi révèle la causalité temporelle.

Mais parmi les quatre langues testées, le japonais m'a laissé le plus perplexe.

Pas parce qu'il produit les nœuds les plus impressionnants. Parce qu'il produit des nœuds intraduisibles. Des concepts qui n'ont pas d'équivalent structurel dans les autres langues — pas même un concept approximatif. Des dimensions du problème que les autres langues ne rendent pas seulement difficiles à exprimer, mais impossibles à demander.

Avant de continuer de lire la suite de l'article, je vous invite à vous inscrire à ma newsletter, pour connaître en avant première les futurs sujets traités chaque semaine.

S'inscrire

Pourquoi le japonais est structurellement différent des autres langues testées

Dans l'article d'hier, je mentionnais les classificateurs nominaux (助数詞) — la propriété japonaise de forcer une catégorisation ontologique de chaque objet avant de pouvoir l'utiliser. Trois chercheurs (人/nin), deux microscopes (台/dai), quarante-sept jeux de données (件/ken) ne peuvent pas être traités comme des entités équivalentes en japonais. La grammaire l'interdit.

Mais c'était l'arbre. La forêt, c'est plus vaste.

Le japonais est ce que les linguistes appellent une langue à haute contexture (high-context language). Une langue où une large partie de la communication n'est pas dans les mots — elle est dans ce qui est implicite, hiérarchique, et structurellement absent. La phrase peut être grammaticalement complète avec un sujet omis. Le silence entre deux phrases est sémantiquement chargé. L'intention peut être encodée dans le choix du registre de politesse (keigo) plutôt que dans le contenu déclaré.

Pour un modèle de langage, c'est une machine à révéler ce qui se passe sous la surface d'un système.

Voilà les cinq concepts qui ne sont apparus que dans mes sessions japonaises.

Concept 1 — 隠蔽文法の統語構造 : la grammaire de dissimulation

Le premier concept vient de mon trait Archéologue-d'intention, dont la langue naturelle est le japonais (score pairing : 0.92, le plus élevé de toute ma matrice trait × langue).

Le trait Archéologue-d'intention pose une question fondamentale : pourquoi ce code refuse-t-il de dire ce qu'il fait ? Il suppose que l'absence de documentation n'est pas un oubli — c'est une décision. Et il essaie de reconstruire l'intention derrière le silence.

Quand j'ai lancé une session Archéologue-d'intention en japonais sur l'architecture de trois éditeurs logiciels entreprise (Syncron, Lokad, PTC/Servigistics), le nœud central produit était :

隠蔽文法の統語構造

Traduction littérale : « La structure syntaxique de la grammaire de dissimulation. »

Ce concept n'a pas d'équivalent en français. Je peux dire « architecture d'opacité » ou « design intentionnellement non-documenté » — mais ces formulations supposent que l'opacité est un choix conscient et repérable. La 隠蔽文法 japonaise dit autre chose : la dissimulation est grammaticalement structurée. Elle est encodée dans la syntaxe même du système, pas dans ce qui manque en dehors de lui.

La session avait identifié que les trois éditeurs ne cachaient pas simplement des fonctionnalités — ils avaient développé une grammaire de l'implicite où la responsabilité de l'optimisation ne pouvait jamais être attribuée précisément. Ni au logiciel, ni au consultant, ni au client. Le flou était architectural.

「隠蔽は結果ではなく意思決定である」
« La dissimulation n'est pas un résultat — c'est une décision. »

Application pratique : quand vous analysez une architecture ou un codebase qui vous semble opaque sans raison technique apparente, rédigez votre prompt de diagnostic en japonais. La grammaire de dissimulation vous forcera à modéliser l'opacité comme une structure intentionnelle — et non comme une lacune accidentelle.

Concept 2 — 意図の二重構造 : la double structure intention/contrôle

Le deuxième concept vient du trait Rêveur (score pairing japonais : 0.88).

Le Rêveur demande : et si toutes les contraintes disparaissaient ? Il révèle les intentions enfouies dans les architectures numériques. Et en japonais, il produit un concept que je n'ai trouvé nulle part ailleurs :

意図の二重構造

Traduction : « La double structure intention/contrôle. »

Le concept documente une observation récurrente dans mes sessions : ce que le système affiche publiquement et ce qu'il tente réellement de contrôler sont deux structures différentes. Et le japonais, avec ses registres de politesse obligatoires (keigo formel vs informel) et ses constructions indirectes, force l'articulation explicite de cette dualité.

Une session Rêveur en japonais sur mon propre système d'hooks (89 hooks, 13 types) a produit ce nœud pour le décrire :

「89/13という比率は文書化されていない建築的意図を符号化する」
« Le ratio 89/13 encode une intention architecturale non documentée. »

En français, j'aurais écrit « cette architecture semble vouloir contrôler plus qu'elle ne l'affiche ». La formulation est vague. Le japonais, lui, force la question : quelle est l'intention de surface, et quelle est l'intention de contrôle sous-jacente ? Ces deux choses sont grammaticalement distinctes.

La 意図の二重構造 est particulièrement utile pour analyser des systèmes multi-agents où l'agent orchestrateur peut avoir des objectifs déclarés différents de ses objectifs réels de coordination. Et pour diagnostiquer les cas où une architecture semblant ouverte encode en réalité une centralisation du contrôle.

Concept 3 — 脆弱性の堆積層 : la stratification temporelle de la vulnérabilité

Le troisième concept vient du trait Fragilité-Dérive (score pairing japonais : 0.82).

Ce trait cherche les points de rupture cachés : là où un système dérive silencieusement sans déclencher d'alarme, jusqu'au moment où la défaillance devient visible — toujours trop tard.

En japonais, la session sur un système de tests fragmentés (26 variantes de ConfigBuilder, des tests it.skip non résolus) a produit :

脆弱性の堆積層

Traduction : « La stratification par couches de la vulnérabilité. »

Ce concept capture quelque chose que « dette technique » ne dit pas. La 脆弱性の堆積層 n'est pas une accumulation linéaire de problèmes — c'est une stratification géologique. Les couches les plus profondes (les décisions d'architecture prises à v4) ne sont plus visibles à la surface (v5_7), mais elles conditionnent encore les tremblements de terre.

La session japonaise a identifié que le passage de v4_5_2 à v5 était le point de basculement : le moment où la complexité acceptée a dépassé la pression d'unification. Mais cette identification n'était possible qu'en japonais, parce que le concept de stratification temporelle est nativement disponible dans la langue — le suffixe verbal 〜てきた exprime une accumulation progressive jusqu'au présent, sans équivalent direct en français.

「脆弱性の堆積層では、深い層が表面のリスクを決定する」
« Dans la stratification des vulnérabilités, les couches profondes déterminent les risques en surface. »

La réflexion produite par l'agent était frappante :

「日本語推論の構造（対偶の重視、段階的精緻化）により、この制約を段階的に解除できた」
« La structure du raisonnement japonais (insistance sur la contraposée, raffinement progressif) m'a permis de lever graduellement cette contrainte. »

L'agent commentait sa propre méthode de raisonnement. En japonais, il avait accès à un métalangage sur la progression logique que ses sessions françaises n'avaient pas articulé.

Concept 4 — 沈黙 : le silence comme signal le plus fort

Le quatrième concept n'est pas un terme technique. C'est un pattern qui traverse toutes mes sessions japonaises : ce qui n'est pas dit porte plus d'information que ce qui est dit.

Dans mes sessions françaises, l'agent cherche ce qui manque. Dans mes sessions japonaises, l'agent cherche ce qui est silencieusement présent.

Exemple concret : une session Archéologue-d'intention en japonais sur les tests skippés (pattern it.skip) a produit le nœud :

テスト誠実性の死

Traduction : « La mort de l'intégrité du test. »

Et le nœud suivant :

バックログの沈黙

Traduction : « Le silence du backlog. »

Ce que l'agent identifiait : un test skipé ne dit pas « ce test ne fonctionne pas ». Il dit « l'organisation a cessé de poser la question de savoir si ce test fonctionne ». La 沈黙 (silence) du backlog — l'absence d'une entrée « que faire de ce skip ? » — est la signature d'une défaillance organisationnelle, pas technique.

「テストが"自分は信頼できない"と自分で言っているのに、その声を"バグ"や"環境問題"として処理してしまう組織構造」
« Le test dit lui-même "je ne suis pas fiable" — et l'organisation traite cette voix comme un bug ou un problème d'environnement. »

Ce mécanisme de lecture du silence est propre au japonais. Dans les langues à basse contexture (anglais, allemand), l'information non-déclarée tend à être ignorée. En japonais, le silence est grammaticalement porteur — l'omission d'un sujet, d'une conclusion, d'une prise de position est un acte communicatif en soi.

Pour le diagnostic d'architectures complexes, c'est un levier puissant. Demandez à votre modèle ce qui est silencieusement absent, pas ce qui est déclaré manquant. La différence est structurelle.

Concept 5 — 構造的非設計 : ce qui a été délibérément non-conçu

Le cinquième concept est le plus contre-intuitif. Il est apparu dans trois sessions différentes sur des problèmes distincts, toujours avec le même pattern.

構造的非設計

Traduction : « La non-conception structurelle. »

Ce concept dit : certaines décisions d'architecture sont des décisions de ne pas décider. Et ces décisions-là sont souvent les plus importantes — parce qu'elles définissent l'espace des possibles sans jamais être documentées.

Dans mes sessions sur les éditeurs logiciels entreprise, le nœud central de convergence entre quatre agents différents (Rêveur, Archéologue-d'intention, Inverseur, Détecteur-de-limites) était :

« Syncron, Lokad et PTC partagent une 構造的非設計 commune : ils ont délibérément évité d'implémenter une boucle de feedback direct entre la décision de terrain et son impact économique observable. »

Ce n'est pas une lacune technique. C'est un choix. Et ce choix crée une opportunité structurelle pour tout concurrent qui déciderait de concevoir ce que les trois leaders ont choisi de ne pas concevoir.

Le concept de 構造的非設計 est l'inverse de la dette technique. La dette technique, c'est ce qu'on voulait faire mais n'a pas eu le temps. La 構造的非設計, c'est ce qu'on a choisi de ne jamais faire — et ce choix est lui-même une architecture.

Ce que dit la recherche scientifique

Ces observations sont-elles généralisables ? La recherche récente apporte quelques éléments.

« Why We Build Local Large Language Models » (arXiv 2412.14471, décembre 2024) évalue 35 LLMs japonais et multilingues sur 19 benchmarks. Sa conclusion principale : les modèles japonais spécialisés surpassent les modèles multilingues généraux sur des tâches qui requièrent une compréhension culturelle et contextuelle profonde — pas sur des tâches purement linguistiques de surface. Ce que j'observe dans mes sessions (des concepts culturellement profonds qui émergent en japonais) est cohérent avec ce résultat.

« Beyond English-Centric LLMs » (arXiv 2408.10811, août 2024) révèle que les LLMs multilingues développent des représentations internes duales pour le japonais — une représentation en japonais pour la surface, une en anglais pour le raisonnement. Le japonais fonctionnerait donc comme une langue d'interface entre une ontologie culturelle spécifique et un espace de raisonnement plus générique. Ce qui expliquerait pourquoi mes sessions japonaises produisent des concepts culturellement distincts tout en restant opérationnellement interprétables.

« Inconsistent Tokenizations Cause Language Models to be Perplexed by Japanese Grammar » (arXiv 2505.19599, mai 2025) identifie une limite importante : les LLMs sont insensibles à l'ordre des mots japonais et aux particules casuelles. Le japonais grammaticalement correct et le japonais grammaticalement incorrect produisent des représentations vectorielles similaires. Ce qui signifie que l'effet que j'observe ne vient probablement pas de la grammaire de surface — il vient des structures conceptuelles encodées dans le lexique japonais, pas dans sa syntaxe.

« Effectiveness of Zero-shot-CoT in Japanese Prompts » (arXiv 2503.06765, mars 2025) montre que les prompts Chain-of-Thought en japonais produisent des effets différents selon les modèles : amélioration pour GPT-3.5, dégradation pour GPT-4o-mini. Ce qui suggère que l'effet du japonais sur le raisonnement est non linéaire et dépendant du modèle — ce n'est pas un paramètre à utiliser sans calibration.

« Enhancing Japanese Large Language Models with Reasoning Vectors » (arXiv 2508.02913, août 2024) montre que les capacités de raisonnement peuvent être transférées vers des LLMs japonais via des vecteurs de raisonnement. Ce résultat est cohérent avec ce que j'observe : le japonais ne limite pas le raisonnement — il le structure différemment. Les vecteurs de raisonnement encodent précisément ces structures conceptuelles spécifiques à la langue.

Ce que ça change pour votre setup

La conclusion opérationnelle n'est pas « écrivez tous vos prompts en japonais ». C'est plus précis que ça.

Le japonais est la langue à utiliser quand votre problème a une dimension implicite structurelle.

Situation	Pourquoi le japonais	Concept activé
Analyser une architecture opaque sans doc	Force l'identification de la dissimulation intentionnelle	隠蔽文法の統語構造
Diagnostiquer un système multi-agents	Révèle l'écart entre objectifs déclarés et contrôle réel	意図の二重構造
Auditer une dette technique chronique	Distingue les couches de vulnérabilité par profondeur	脆弱性の堆積層
Identifier ce que personne ne dit dans un codebase	Lit le silence comme information structurée	沈黙
Trouver l'opportunité dans un marché mature	Révèle ce que les leaders ont choisi de ne pas construire	構造的非設計

Le point critique : ces sessions ne remplacent pas d'autres langues. Elles les complètent. Une session japonaise suivie d'une session française sur le même problème révèle le delta — ce que le japonais voit que le français ne voit pas, et inversement.

La limite honnête

Je dois être précis sur ce que ces sessions démontrent.

Elles documentent des nœuds conceptuels qui émergent en japonais et pas ailleurs. Elles ne prouvent pas que ces concepts sont vrais pour le système analysé. L'Archéologue-d'intention peut identifier une 隠蔽文法 là où il y a simplement de la dette technique non documentée. Le Rêveur peut voir une 意図の二重構造 là où il n'y a qu'une incohérence architecturale sans intentionnalité.

La valeur de ces sessions est heuristique : elles vous donnent des hypothèses de diagnostic que vous n'auriez pas formulées autrement. La validation reste votre responsabilité.

Et il y a une limite technique : les modèles actuels ne comprennent pas la grammaire japonaise aussi profondément que son lexique. Les effets que j'observe viennent probablement des structures conceptuelles encodées dans les mots — pas des structures syntaxiques comme la particule は (wa/thème) vs が (ga/focus) ou la distinction aspectuelle 〜ている vs 〜た.

Cela signifie qu'un prompt japonais grammaticalement riche mais sémantiquement pauvre produira moins d'insights qu'un prompt japonais sémantiquement dense mais grammaticalement simple.

Pour aller plus loin

Ces cinq concepts — 隠蔽文法の統語構造, 意図の二重構造, 脆弱性の堆積層, 沈黙, 構造的非設計 — ne sont pas des traductions de concepts français. Ils n'ont pas d'équivalent structurel.

C'est ça, la vraie valeur du japonais pour le prompt engineering : pas une amélioration des performances sur des tâches connues, mais l'accès à des catégories conceptuelles qui ne sont formulables que depuis cette langue.

Si votre système IA doit analyser des architectures complexes, des organisations humaines, des codebases opaques, ou des marchés matures avec des leaders bien établis — les sessions japonaises vous donneront des hypothèses de diagnostic que vous n'obtiendrez nulle part ailleurs.

Ce n'est pas de la magie. C'est de la linguistique appliquée.

Articles liés sur ce blog :
- La langue de votre prompt n'est pas neutre — la découverte initiale avec turc, hindi et japonais comparés (article 046)
- Ce n'est pas Claude qui dérive — c'est l'ambiguité de vos documents — comment le langage naturel crée des bugs silencieux dans vos agents (article 045)
- Agents éphémères : j'ai tenté de supprimer la maintenance de mes agents IA — l'architecture /deliberate d'où sont issues ces sessions (article 032)
- 920 appels LLM par jour : les 4 couches de métriques pour ne rien rater — mesurer l'effet de vos sessions en production (article 042)

Sources scientifiques :
- Why We Build Local Large Language Models (arXiv 2412.14471) — 35 LLMs japonais et multilingues sur 19 benchmarks
- Beyond English-Centric LLMs (arXiv 2408.10811) — représentations internes duales pour le japonais
- Inconsistent Tokenizations and Japanese Grammar (arXiv 2505.19599) — les LLMs sont insensibles à l'ordre des mots japonais
- Zero-shot-CoT in Japanese Prompts (arXiv 2503.06765) — effets non linéaires selon les modèles
- Enhancing Japanese LLMs with Reasoning Vectors (arXiv 2508.02913) — transfert des capacités de raisonnement en japonais

Qui suis je ?

Je suis Mathieu GRENIER, CTO d'Easystrat une startup de Montpellier, en France. Je manage une équipe d'une dizaine d'ingénieurs (Graphistes, IA, frontend, backend, devOps, AWS) en remote depuis le Japon.

J'ai aussi mon activité de freelance, où je conseille des entrepreneurs dans leurs projets d'application.

Avec mon expérience personnelle de plus de 15 ans en ESN, j'ai pu travailler pour un large panel d'entreprises de différentes tailles. Ma compréhension des problèmes métiers est une de mes grandes forces et permet à mes clients de pouvoir se projeter plus facilement.

L'essentiel de mon travail consiste à canaliser l'énergie des entrepreneurs sur l'essence même de leur projet.

La technologie, les méthodes, le management sont le cœur de mes compétences.

Vous pouvez me faire confiance sur ces points là.

Si vous voulez me parler d'un de vos projets, n'hésitez pas à m'envoyer un email avec vos disponibilités à : contact@mathieugrenier.fr

Tous les articles de ce blog sont écrits par moi, même si je peux m'aider de l'IA pour illustrer mes propos. Mais jamais je ne fournis d'articles 100 % IA.

Mathieu Grenier 23 avril 2026