Bienvenue sur ce blog

Pour l’instant, ce blog contient une série de réflexions sur les Grands modèles de langage (LLM), du type Chat GPT.
Ces articles sont classés du plus récent au plus ancien.
Si vous voulez aller au début, il faut donc scroller vers le bas.
Bonne lecture.

À propos des LLM (9 sur 10)

Pourquoi la plupart des conférenciers que j’ai entendus étaient-ils si négatifs sur les « intelligences artificielles » ? Si acharnés à minimiser leurs capacités ?
Pourquoi évitent-ils à tout prix de dire qu’une frontière a été franchie de manière étonnante ?

Je propose ici, de manière ludique, 4 hypothèses pour expliquer ces réactions :

-1- Première hypothèse : Les experts pensent qu’il faut absolument tenir le grand public éloigné d’une attitude de trop grande fascination devant les IA langagières qui conduirait ce malheureux grand public à leur faire trop confiance ou à croire qu’elles détiennent « La Vérité », voire qu’elles sont douées de conscience.
Faisons crédit aux experts du noble désir d’être les gardiens de la raison et de vouloir protéger les « non-sachants » d’illusions dangereuses. Mais ces motivations citoyennes ne sont-elles pas mêlées à d’autres, peut-être moins conscientes, voire moins honorables ?

-2- Deuxième hypothèse : mortifiés d’avoir été largement dépassés par les américains, les chercheurs français minimisent l’importance des IA. Vexés quoi.
Plus généralement, la recherche publique, totalement distancée par la recherche privée (une distance qui se mesure en milliards de dollars) n’a-t-elle pas tendance à vouloir discréditer un domaine qui lui échappe ? Voir cet article du Monde.

-3- Troisième hypothèse : plus personne ne « croit au progrès ». Aujourd’hui, marcher sur la Lune pour la première fois ne ferait plus un tabac. Sauf si un ou une influenceuse était dans le coup.
Plus personne ne placent d’espoir dans le numérique, y compris ceux qui avaient rêvé d’un monde meilleur avec la naissance d’Internet. Nous sommes tout à fait désabusés et nous entrevoyons pour les IA un avenir semblable à celui des réseaux sociaux, en pire (même s’il n’est pas question d’arrêter de nous en servir). Ces IA vont nous rendre dépendants, paresseux du cerveau et nous priver de libertés (surveillance…).
Et les jeunes qui sont sur leur téléphones toute la journée disent majoritairement qu’ils auraient préférer vivre avant Internet.
L’avis des experts eux-mêmes est empreint de ce pessimisme.

– 4 – Quatrième hypothèse : Freud a décrit 3 grandes blessures narcissiques qui ont marqué l’histoire de l’humanité. Elles ont été provoquées par Copernic, puis par Darwin, puis par lui-même.

Chat GPT & consorts serait la quatrième grande blessure : nous avons créé des machines qui manient le langage souvent aussi bien que nous, parfois même nettement mieux.

Mais c’était quand même le propre de l’homme le fait de parler, de manier le langage, nom d’une pipe ! C’était ce qui nous distinguait de tous les êtres vivants et nous plaçait au sommet de la Création.
Et voilà qu’une machine est capable de produire des textes, de les traduire, de les développer ou de les résumer, d’en changer le ton, etc….
Mon dieu ! Mais assister à ça, c’est bien pire que d’apprendre qu’on descend du singe !
Il faut sauver l’exception humaine ! Il faut sauver la notion d’esprit.
 Il faut sauver l’Homme créé à l’image de Dieu, comme dans le livre de la Genèse.

Alors, il faut à tout prix déconsidérer ces IA qui manient trop bien le verbe, les réduire à des perroquets bavards, mais stupides.

À propos des LLM (6 sur 10)

Précisons : je n’ai pas basculé du côté de la magie.
Je ne suis pas en train de dire « il y a des machines qui pensent, il y a des machines qui sont intelligentes, au même titre que les humains ».
Je suis bien conscient du fait qu’il n’y a pas d’intention dans les productions de ces systèmes, pas de vécu subjectif, pas de perception du monde. Ils n’ont rien à voir avec des êtres vivants.
Mais c’est justement cela qui doit ouvrir une réflexion nouvelle.
Le propre de l’homme, le langage de type humain est « mécanisable » ?! En tout cas possible à imiter avec une machine numérique.
Il y a de temps en temps des faits nouveaux dans l’histoire de l’humanité qui ouvrent des perspectives nouvelles et qui nous obligent à voir les choses autrement, à opérer des changements de paradigme.
L’histoire dira ce qu’il en est, mais il est fort possible que cet événement en fasse partie.
Il devrait , en tout cas, susciter de nombreuses interrogations, non ?
Sur la nature du langage, par exemple.
Sur la cognition et nos « mécanismes mentaux ».
Sur la possibilité de jouer avec les limites du langage d’une manière nouvelle.
Je termine sur une citation de Georges Steiner :
« Inévitablement, “l’animal doué de langage », comme les Grecs anciens définissaient l’homme, habite les immensités limitées par les frontières des mots et de la grammaire.
Il est possible que la pensée soit en exil.
Mais si c’est le cas, nous ne savons pas, ou, plus précisément nous ne pouvons dire, de quoi elle est exilée. »
Les LLM pourraient-ils, si on les y pousse, nous donner quelques éclairages sur ces territoires inaccessibles desquels nous sommes en exil ?

À propos des LLM (5 sur 10)

Dans ce petit tour d’horizon personnel concernant les façons de considérer les LLM, je suis attiré par une autre approche que je n’ai pas rencontrée dans les conférences auxquelles j’ai assisté.
On peut la situer dans le prolongement de la quatrième, mais en allant plus loin dans une direction précise.
Il s’agit de mieux comprendre ce qui se passe avec les LLM, dans le traitement du langage naturel.
Face à leurs capacités nouvelles et surprenantes dans ce domaine, aussi bien pour interpréter les questions que pour construire des réponses élaborées, on l’a compris, j’ai trouvé un peu léger de se contenter de dire : oui c’est bluffant, mais c’est normal, ces machines ont emmagasiné tellement de données, elles vont chercher le meilleur de ce qui a déjà été dit par des auteurs sur le sujet.
A l’opposé de cette légèreté, un peu d’étonnement ne me paraît pas absurde.
Étonnement qui, comme le disait Socrate, est le déclencheur de l’attitude philosophique.
Mais on n’a pas entendu beaucoup de philosophes avoir une réflexion un peu sérieuse sur les LLM. La plupart se sont empressés de se ranger parmi les « minimiseurs », avec des airs hautains.

On peut commencer par s’étonner du fait que ces capacités ne sont pas apparues plus tôt.
Après tout, les moteurs de recherche ont depuis longtemps accès à d’immenses quantités de données.
Et par ailleurs, la compréhension du langage naturel humain a fait l’objet de nombreux efforts.
On voit bien pourquoi : cela permet d’automatiser de nombreuses tâches concernant les textes. Ce fut l’un des objectifs principaux des débuts de l’intelligence artificielle depuis les années 60. De multiples stratégies ont été mise en place pour cela : nettoyage des mots vides, repérage des mots clefs, des règles de structure de phrase, enrichissement du lexique, …..
Parmi les outils interactifs, le programme Eliza a laissé un grand souvenir. Il était capable -en reconnaissant des formes de phrase et des mots clefs- de relancer un interlocuteur cherchant un soutien psychologique, le tout étant inspiré de la psychothérapie rogérienne.
Mais malgré ces efforts, la « compréhension » du langage naturel humain n’a pas été atteinte avant les LLM qui ont apporté un changement radical, un saut qualitatif fondamental.
A partir de 2018-2019, l’architecture des LLM a commencer à se dessiner avec Bert.
Les systèmes capables de comprendre, générer, dialoguer naturellement ont émergé durant l’année 2020 (GPT‑3), puis se sont démocratisés au second semestre 2022 via ChatGPT.
Pour le grand public, le phénomène a explosé, à partir de 2023 -2024.
Il s’est donc passé quelque chose autour de 2020.
Des machines capables de produire l’équivalent de la compréhension naturelle du langage, autrement dit de converser, sont apparues.
La conversation, c’était le propre de l’Homme avec un grand H, non ? La pierre de touche de l’humain…
Je vais continuer à m’étonner. D’abord de ce fait. Et puis du peu d’étonnement que cela suscite chez ceux qui sont censés réfléchir.

À propos des LLM (4 sur 10)

Respirons un peu avec autre façon d’aborder les LLM qui sera ici résumée par la formulation d’un chercheur dans un mail à l’occasion d’un séminaire :
“Lorsque les philosophes et les scientifiques ont étudié l’esprit, ce fut souvent avec le présupposé que l’objet de leur étude était, avant tout, l’esprit humain. Les autres esprits biologiques – animaux – ont longtemps été négligés ou sous-estimés, même s’ils ont été l’objet d’un intérêt croissant au cours des dernières décennies. Plus récemment, les progrès frappants de l’intelligence artificielle ont rendu de plus en plus plausible l’idée d’après laquelle certains systèmes artificiels pourraient, dans un futur proche, être considérés comme des esprits. Reconnaître la réalité ou la potentialité de ces esprits variés soulève des questions théoriques et éthiques cruciales.
Ce séminaire réunit des chercheurs de divers domaines venant de la philosophie théorique et pratique, des sciences cognitives et des sciences humaines, afin de présenter leurs travaux sur le thème des esprits non-humains – qu’il s’agisse d’esprits animaux ou d’esprits artificiels.”

Voilà enfin une réaction ouverte qui ne cherche pas à minimiser quoique ce soit et se propose de regarder sous plusieurs angles scientifiques et philosophique ce qui se passe. Elle ne présuppose rien sur les différents types d’”intelligences” et n’hésite pas à prendre en considération de la même façon les fonctionnements “mentaux” des animaux, des humains et des machines.
Elle propose tout simplement de les étudier telles qu’ils apparaissent. Elle utilise pour cela le terme “esprit”, sans plus de précision. Ce qui peut bien sûr faire pousser de hauts cris à ceux qui veulent réserver le terme aux humains en laissant entendre implicitement que dans leur cas le terme est défini avec clarté.

À propos des LLM (3 sur 10)

Venons-en maintenant à des points de vue qu’on pourrait qualifier d’analytiques. sur les LLM, les “Large langage models”. Autrement dit des points de vue de “sachants”, chercheurs dans le domaine numérique ou philosophes réfléchissant à la question des IA.
Précisons encore, on ne va pas parler ici des conséquences sociétales de l’apparition des nouvelles IA, mais plutôt des questions du type « à quoi avons-nous affaire ? ».
D’abord donc le point de vue que j’ai entendu les plus souvent dans des conférences ou ailleurs.
C’est aussi le point de vue qui m’a donné envie de réagir à travers cette petite série. En voici l’idée générale :
un LLM serait un ensemble de procédures standardisées et prédictives, qui visent à engendrer les expressions les plus probables sur la base des moyennes des expressions passées. Les grands modèles de langage fonctionnent sur la base de calculs probabilistes : lorsque vous posez une question à ChatGPT, le logiciel calcule les séquences de signes les plus probables qui correspondent à votre requête, un peu comme les logiciels d’auto-complétion des téléphones portables ou des moteurs de recherche, qui complètent automatiquement les messages ou les requêtes en fonction des messages ou des requêtes les plus répandus. Les algorithmes ne fonctionnent efficacement que parce qu’ils prédisent toujours ce qui a le plus de chances d’arriver en se basant sur des moyennes de données passées.
J’ai entendu ce genre de propos, par exemple, dans la bouche d’un spécialiste reconnu, lors d’une conférence, après que le présentateur de la conf. ait cité (comme je l’ai fait moi-même dans des circonstances analogues) une réponse d’un LLM à une question un peu subtile. Réponse particulièrement brillante qui à l’évidence était tout autre chose qu’une « moyenne de données passées ».
Encore une fois, ce premier type de réaction est celui qu’adoptent ou ont adopté beaucoup d’experts au sujet des IA.
Cette attitude est marquée par le souci de minimiser ce qui se passe avec les LLM. On peut la caricaturer avec la formule “circulez, il n’y a rien à voir”. Ou en tout cas rien de bien extraordinaire.
On critiquera bien sûr dans la suite ce point de vue et on essayera d’examiner les raisons qui peuvent animer ceux qui en sont les tenants.
Pour plus de simplicité, on pourrait les appeler les « minimiseurs ».

À propos des LLM (2 sur 10)


Je continue avec les Grands modèles de langage (les LLM, c’est-à-dire Chat GPT & co), en évoquant brièvement la réaction du grand public
On peut parler sans doute d’un mélange de sidération et d’acceptation passive
Mais une bonne proportion de personnes se contentent de tourner le dos à l’affaire. Trop compliquée, trop baroque, trop loin des chemins connus.
Et une autre partie, plus jeune ne comprend pas beaucoup mieux, mais adopte, accepte et fait comme si c’était normal. Après tout c’est le progrès, comme on disait autrefois.
Mais ce n’est plus le progrès du temps jadis, celui qu’on vivait comme un espoir de jours meilleurs, non, c’est le flux de l’innovation qui fait tourner la société de consommation. Cette locomotive folle dont il faut sans cesse alimenter la chaudière avec des nouveautés pour tirer de plus en plus vite le train d’une société qui ne sait plus qui rien d’elle-même. Sinon qu’il faut continuer à accélérer pour oublier la catastrophe qui vient.
Bon, c’est très sombre ça, mais j’aime bien évoquer « La locomotive folle » de Stanislaw Witkiewicz, pièce dans laquelle j’ai joué, il il y a longtemps.
J’aurais pu me contenter de rappeler que les mêmes jeunes qui ne lâchent pas leurs téléphones disent majoritairement qu’ils auraient préféré vivre avant le numérique.
Accélérons !

À propos des LLM (1 sur 10)

Les LLM étant les “Large langage models”, les grands modèles de langage, donc les IA du type Chat GPT.
Je vais essayer dans les prochains billets de résumer un peu ce que j’ai ressenti en découvrant ces LLM, en écoutant plusieurs conférences, voire en en présentant certaines et en me documentant.
J’ai envie de le prendre un peu sur le mode de la comédie, tant cela m’a paru parfois en décalage avec la réalité.
Je vais donc passer en revue plusieurs points de vue (regards) très différents sur ces LLM.
En étant conscient que le point de vue de bien des personnes n’est pas tranché ou se révèle hybride. A un moment, elles peuvent voir les IA comme ceci et à un autre comme cela.
Avant d’en arriver à ce que j’ai pu entendre de la part des “sachants”, dans des conférences ou dans des livres, je vais commencer par le point de vue des “marchands” de LLM.
Ce sont souvent aussi des fabricants de LLM, donc en fait des experts. Mais dans la course effrénée à la puissance qui se joue d’emblée depuis peu de temps, ils semblent abandonner toute attitude analytique, toute tentative de recul pour expliquer ce qui se passe.
Ils se concentrent sur deux objectifs : rassembler le plus possible de capitaux, le plus vite possible d’une part, empêcher toute réglementation qui pourrait faire obstacle à leur course en avant.
Rassembler le plus vite possible des capitaux démesurés parce qu’ils ont constaté que la taille joue un rôle essentiel dans l’efficacité des LLM et parce qu’il faut essayer de faire la course en tête pour avoir plus de chances de… rassembler le plus vite possible des capitaux démesurés.
Cette fuite en avant les conduit à faire des promesses mirifiques, à décrire les intelligences artificielles comme ouvrant des possibilités infinies, merveilleuses et invérifiables.
On a vu par ailleurs récemment qu’ils sont prêts pour cela à des retournements de vestes politiques honteux et humiliants et à soutenir le régime autoritaire, antidémocratique et anti-science de Trump.
Si cet épisode ubuesque de l’histoire des US ne se termine pas trop mal, c’est-à-dire si le ballon de baudruche finit par éclater au nez de ceux qui s’époumonent à le gonfler, il faudra repasser en boucle le film de ces grands dirigeants.

© 2025

Theme by Anders NorenUp ↑