Mathieu Grenier RAG 2.0 — auto-index SSAL, 10× compression, reconstruction fidèle sur PostgreSQL Dans les trois articles précédents, j'ai établi que l'espace latent d'un LLM est un champ (055), que 3 en est la constante structurelle (056), et que l'index SSAL est un pointeur universel valide sur ... 3 juin 2026
Mathieu Grenier 19 modèles d'IA testés — l'index SSAL est un pointeur universel dans l'espace latent Dans les deux articles précédents, j'ai montré que l'espace latent d'un LLM se comporte comme un champ quantique (article 055) et que 3 est la constante structurelle de l'intrication (article 056). Ma... 2 juin 2026
Mathieu Grenier Pourquoi 3 ? La constante structurelle qui gouverne l'intrication des concepts dans les LLM Dans l'article précédent, j'ai présenté la découverte de l'intrication latente : l'espace latent d'un LLM est un champ, et les index duplés produisent des interférences créatrices de concepts nouveaux... 1 juin 2026
Mathieu Grenier SSAL Quantum — l'espace latent d'un LLM n'est pas un atlas, c'est un champ Ça fait des semaines que je travaille sur deux questions qui me paraissaient liées, mais séparées. La première : l'impact des langues sur le raisonnement des LLM. J'avais déjà documenté comment le tur... 31 mai 2026
Mathieu Grenier L'effet langue sur les LLM — 24 langues, 5 modèles, une découverte qui change tout Il y a un mois, je publiais deux articles qui ont suscité beaucoup de réactions. Le premier racontait ma découverte accidentelle : en lançant des sessions de raisonnement multilingues via ma commande ... 27 mai 2026
Mathieu Grenier Flash Attention + KV Cache q8_0 : pourquoi les modèles pensants en profitent plus que les modèles instruct Hier, je vous parlais d'une technique pour multiplier par dix le contexte de vos modèles locaux avec deux variables d'environnement Ollama : Flash Attention et KV Cache q8_0. Sur gemma4, je suis passé... 16 mai 2026
Mathieu Grenier Comment j'ai multiplié par 10 le contexte de mes modèles locaux avec Flash Attention et KV Cache q8_0 Tout est parti d'une vidéo YouTube. Je regardais une présentation sur l'optimisation du KV cache avec Flash Attention — le genre de vidéo qui passe un dimanche soir quand on n'arrive pas à décrocher. ... 15 mai 2026
Mathieu Grenier Comment j'ai créé mon agent Hermès sur LINE — et pourquoi je lance des formations IA gratuites pour la communauté française au Kansai (Japon) Ce mois-ci, j'ai décidé de prendre mon destin en main. Après un an à expérimenter l'IA pour mon propre usage — à automatiser mes workflows, créer des outils sur mesure et tester des agents autonomes —... 14 mai 2026
Mathieu Grenier Granite 4.1 passe l'épreuve du code Python — jusqu'où un SLM de 3 milliards peut aller Dans mon dernier article , je vous ai montré que l'allemand est la langue optimale pour granite4.1:3b — et que ce petit SLM de 3 milliards de paramètres peut atteindre 87/100 sur des raisonnements mat... 7 mai 2026
Mathieu Grenier IBM Granite 4.1 : l'effet de la langue, testé sur GPU local Hier soir, je suis rentré d'une conférence à Osaka. Un événement European Night avec des dizaines de chercheurs en IA et robotique — des profils solides, habitués à lire des papiers, à manipuler des m... 2 mai 2026
Mathieu Grenier qwen3:4b résout des problèmes GPQA Diamond — sans chaîne de pensée interne Hier, je vous parlais de mes tests sur le raisonnement de qwen3:4b en chinois. La conclusion principale : avec le bon cadrage dans la bonne langue, un modèle local de 4 milliards de paramètres rivalis... 28 avr. 2026
Mathieu Grenier qwen3:4b-instruct-2507 égale Claude Haiku 4.5 avec le bon prompt en chinois La semaine dernière, je vous expliquais comment la langue de votre prompt modifie structurellement le raisonnement de Claude. Le turc force le marquage épistémique. Le japonais impose une ontologie hi... 27 avr. 2026