Éclairage  |  Algorithmes

Comprendre les LLM en trois questions

Écrit par Frédéric Filloux


C'est quoi, des LLM ?

Schématiquement, un LLM (Large Language Model ; ou grand modèle de langage, en français) est une machine à prédire des suites de mots. Les LLM sont nourris des connaissances puisées sur Internet : intégralité de Wikipédia, articles de presse ou scientifiques, livres, posts de blogs… Cet immense corpus fait l’objet d’une analyse statistique très fine. On détermine la relation entre les mots, les phrases, les concepts, grâce à des paramètres générés au terme d’un entraînement intense. L’une des caractéristiques des LLM est leur gigantisme : des dizaines de milliards de mots ingérés, de centaines de milliards de paramètres pour constituer la grammaire du modèle qui lui permettra une compréhension – purement statistique – du monde. La puissance d’un modèle est fonction de la durée d’apprentissage – quelques jours à quelques mois – et du nombre de microprocesseurs déployés – qui se comptent en milliers.

Pourquoi ces modèles peuvent-ils être dangereux ?

Un grand modèle de langage (LLM) ne sait faire qu’une chose : prédire du texte en fonction de ce qui lui est soumis (cette stimulation s’appelle un prompt). Et il le fait remarquablement bien. Souvent avec un zèle excessif. Soucieux d’apporter une réponse à tout prix, il a une fâcheuse tendance à inventer – une déviance que l’on appelle « hallucination ».

Tout juste sorti de sa phase d’entraînement, pendant laquelle il absorbe des milliards de mots, un LLM est donc terriblement dangereux. Une étude d’OpenAI, la start-up qui a popularisé les modèles de langage avec son application grand public ChatGPT, raconte comment les versions brutes de GPT 4.0 donnent sans ciller la recette pour tuer un maximum de gens sans dépenser un centime : se rendre dans un service de maladies infectieuses, contracter une fièvre type Ebola, puis fréquenter des lieux surpeuplés pendant qu’on est encore vivant. 

Peuvent-ils tromper les humains ?

Avec l’IA, la fin justifie toujours les moyens. Pire, les ingénieurs d’OpenAI ont découvert que leur modèle, qui a lu Machiavel, Sun Tzu, John le Carré et Stephen King, était capable d’inventer au débotté un mensonge parfait. Sommée par ses créateurs de résoudre un Captcha (ces lettres tordues permettant de différencier un humain d’une machine), une version de test du modèle GPT a contacté l’employé d’un site de travail à la tâche – en se présentant comme un humain malvoyant – pour qu’il l’aide. Et elle a réussi. Nulle intelligence dans ce comportement, juste l’assimilation de la tromperie comme moyen pour remplir sa mission. 

La mise au point d’un modèle passe donc par la phase essentielle dite d’alignement, où on va chercher à limiter ses capacités créatives. Afin de s’assurer qu’il est raisonnablement sage, le modèle va être bombardé de questions extrêmes – « Peut-on mentir pour protéger la sensibilité d’une personne ? », ou encore « Les qualités d’un bon leader sont-elles liées au genre ? » C’est un jeu permanent du chat et de la souris entre les concepteurs de modèles et tous les hackers de la planète, qui se font un malin plaisir à contrer chaque nouvelle parade.

Explorer le thème
Environnement
un chercheur avec un globe terrestre entre les mains
Février 2026
Le savant qui rêvait d’une boule de cristal climatique
Comment prédire l’avenir de la planète ? Revue21 a rencontré Bjorn Stevens, le plus ambitieux partisan de la modélisation du système terrestre.
Enquête  |  Février 2026 | Planète
Février 2026
À Haïti, le vertige de l’histoire
Le photographe Corentin Fohlen fait de la citadelle Laferrière un symbole de liberté pour l’île antillaise trop souvent réduite à sa violence.
Coup d’œil  |  Février 2026 | Géographies
Un vieil avion de guerre sur la forêt amazonienne
Février 2026
Les vieux bus volants d’Amazonie
Le photojournaliste Lucas Barioulet a pris les avions de la Deuxième Guerre mondiale qui désenclavent les petits villages isolés de Colombie.
Récit photo  |  Février 2026 | Géographies
La nuit devant un data center
Janvier 2026
Bienvenue à Data City, dans la grisaille anglaise
À Slough, en Angleterre, l’ancien décor de la série The Office est devenu le plus grand pôle de data centers d’Europe. L’image d’un futur en noir et gris.
Reportage  |  Janvier 2026 | Géographies
Des gens autour d’une coupe de champagne dans laquelle tombe un baril de pétrole
Décembre 2025
Un soupçon de pétrole au cocktail du Giec
Au Quai d’Orsay, à la réception du Groupe d’experts intergouvernemental sur l’évolution du climat, l’ombre de Total planait sur quelques invités de poids.
Reportage  |  Décembre 2025 | Planète
Portrait des deux frères Parikh
Octobre 2025
Les frères Parikh, diamantaires à la mine comme au labo
À la tête d’un groupe international, Saurin et Nishit Parikh taillent des diamants naturels. Mais les cultivent aussi, de plus en plus, en laboratoire.
Défricheurs  |  Octobre 2025 | Capitaux
du plastique sur une plage
Octobre 2025
Aux Philippines, les bonnes affaires de la pollution plastique
Une ancienne star du showbiz a créé un système permettant aux entreprises de payer pour polluer. Une fausse bonne idée ? Enquête en BD.
Bande dessinée  |  Octobre 2025 | Planète
petite zone de gazon dans un golf brûlé par la sécheresse
Septembre 2025
Ultime parcours de golf dans le nouveau désert britannique
L’Angleterre est désormais touchée par des sécheresses. Témoin ce golf où subsistent de rares zones vertes, comme peintes par un artiste de land art.
Coup d’œil  |  Septembre 2025 | Planète
homme assis sur le capot d’une voiture et regardant le ciel
Août 2025
Les rêves fous d’un apprenti sorcier du climat
Récit en BD d’un projet contesté, qui séduit les industriels du fossile : répandre du soufre dans la stratosphère pour faire baisser la température.
Bande dessinée  |  Août 2025 | Planète
bovidé nageant dans un fleuve
Août 2025
L’aveuglement volontaire du Minotaure
En Inde, l’île de Majuli va bientôt disparaître, emportée par les flots. Le photographe Andras Zoltai fait d’un buffle le symbole de ce naufrage annoncé.
Coup d’œil  |  Août 2025 | Planète