L’intelligence artificielle (IA) désigne la capacité d’un système à réaliser des tâches habituellement associées à l’intelligence humaine : apprendre, raisonner, résoudre des problèmes, comprendre le langage, percevoir l’environnement…
Aujourd’hui, les IA sont largement répandues dans notre quotidien. Elles sont cependant discrètes : chacune est conçue pour accomplir une tâche bien précise. On parle alors d’IA spécialisée. Par exemple, une IA peut reconnaître des visages, mais sera incapable de traduire un texte ou de jouer aux échecs si elle n’a pas été spécifiquement entraînée pour cela.
En comparaison, le cerveau humain est capable de réaliser une multitude de tâches très diverses, avec une consommation d’énergie remarquablement faible. Les IA, en revanche, nécessitent d’importantes ressources de calcul et d’énergie pour fonctionner.
L’un des grands objectifs du domaine est de parvenir à une IA générale (AGI – *Artificial General Intelligence*), c’est-à-dire une IA capable d’apprendre n’importe quelle tâche intellectuelle humaine, avec une certaine autonomie, flexibilité et capacité d’adaptation.
L’IA comprend plusieurs champs spécialisés. Voici les principaux :
Le Machine Learning permet à une machine d’apprendre à partir de données sans être explicitement programmée. On lui donne des exemples (d’images, de textes, de chiffres…), et elle apprend à reconnaître des motifs pour prendre des décisions.
👉 Le Machine Learning est aujourd’hui partout dans notre quotidien.
Le Deep Learning est un sous-domaine du Machine Learning qui repose sur des réseaux de neurones artificiels, inspirés du fonctionnement du cerveau humain.
🔍 Pour vulgariser, imaginez un réseau de neurones comme un immense système de filtres à plusieurs couches : chaque couche reçoit une information, la transforme un peu, puis la transmet à la couche suivante. Les premières couches repèrent des éléments simples (comme des lettres ou des sons), les suivantes les combinent pour reconnaître des structures plus complexes (comme des mots, des images ou des intentions).
Chaque neurone artificiel dans le réseau effectue un calcul très simple, mais c’est l’organisation en milliers (voire millions) de neurones interconnectés qui rend le système capable de comprendre et d’apprendre des concepts complexes.
Chaque neurone artificiel dans le réseau effectue un calcul très simple : il reçoit des valeurs en entrée (provenant des neurones de la couche précédente), leur applique un poids (ou pondération), additionne le tout, puis applique une fonction d’activation pour produire une sortie.
Ces sorties sont ensuite transmises à la couche suivante. Ce processus se répète de couche en couche, dans ce qu’on appelle les couches cachées. Chaque couche apprend à détecter des motifs de plus en plus complexes à partir des données brutes.
Enfin, dans la couche de sortie, le réseau donne une série de valeurs qui sont interprétées comme des probabilités. Par exemple, pour un modèle de reconnaissance d’image, chaque sortie correspond à une catégorie possible (ex. : chiffre de 0 à 9), et le chiffre avec la probabilité la plus élevée est celui prédit par le modèle.
C’est l’organisation en milliers (voire millions) de neurones interconnectés et ajustables qui rend le système capable de comprendre et d’apprendre des concepts complexes.
🧠 Ce mécanisme est utilisé pour entraîner les LLM. Lors de l’entraînement, le modèle reçoit d’immenses volumes de texte. Il apprend à prédire le mot suivant dans une phrase, en ajustant les connexions entre ses neurones à chaque essai. Peu à peu, il repère des régularités, des relations grammaticales, des styles et même des raisonnements logiques.
C’est cette architecture neuronale profonde, combinée à une grande puissance de calcul et à l’architecture Transformer, qui a permis l’émergence des LLM modernes comme ChatGPT.
📌 Exemple : pour reconnaître un chat dans une photo, le DL peut d’abord identifier des formes, puis des yeux, puis une tête, etc.
Les Large Language Models (LLM) sont des modèles de Deep Learning spécialisés dans la compréhension et la génération de langage. Ils se situent à l’intersection du Deep Learning et du traitement automatique du langage naturel (NLP).
NLP (Natural Language Processing), ou traitement automatique du langage naturel, est un domaine de l’IA qui vise à permettre aux machines de comprendre, interpréter et générer du langage humain de manière pertinente.
🔍 Le langage humain est riche en subtilités et en ambiguïtés. Un mot peut avoir plusieurs significations selon le contexte. Par exemple, le mot « batterie » ne signifie pas la même chose dans « une batterie de cuisine » et dans « la batterie du téléphone ». Pour qu’un modèle puisse interpréter correctement un mot, il doit donc être capable d’en comprendre l’usage dans son environnement syntaxique et sémantique.
Grâce à ces avancées, les LLM peuvent aujourd’hui comprendre et générer du texte avec une fluidité et une précision impressionnantes, ouvrant la voie à des assistants intelligents capables de collaborer avec les humains dans de nombreux domaines.
Depuis son lancement en novembre 2022, ChatGPT a suscité un immense engouement : plus d’un million d’utilisateurs en cinq jours seulement. Pourquoi un tel succès ? Parce que cette IA est capable de *répondre à des questions*, *traduire des textes*, *résumer des documents*, *écrire du code*, *rédiger des poèmes*… et bien plus encore ! 🤯
Ce cours propose une introduction progressive et accessible à l’intelligence artificielle (IA) et plus particulièrement aux LLM, au cœur de cette révolution.
Un Large Language Model (LLM) est une intelligence artificielle capable de comprendre et de générer du texte, en s’appuyant sur des milliards de mots analysés dans des corpus massifs.
🔍 Concrètement, un LLM reçoit une phrase (ou une suite de mots) et prédit le mot suivant, en tenant compte du contexte. Il est entraîné grâce à des réseaux de neurones profonds (deep learning) et apprend sans supervision directe, simplement en repérant des motifs dans les données.
Voici les grandes étapes du fonctionnement d’un LLM :
Parce qu’ils comportent :
👉 Les LLM ne remplacent pas l’humain, mais augmentent ses capacités dans de nombreuses tâches du quotidien professionnel.
| Terme | Signification rapide |
| IA | Intelligence artificielle : simule l’intelligence humaine |
| ML (Machine Learning) | L’IA qui apprend à partir des données |
| DL (Deep Learning) | Apprentissage profond basé sur des réseaux de neurones |
| NLP | Traitement automatique du langage naturel |
| LLM | Modèle qui comprend et génère du langage humain |