Comment sont entraînés les modèles d'IA : un processus complexe et coûteux

Selon un article du N/N Group, l'entraînement des grands modèles de langage (LLM) se déroule en trois phases principales. L'apprentissage non supervisé expose d'abord le modèle à d'énormes quantités de données internet. Vient ensuite l'apprentissage supervisé avec des exemples soigneusement sélectionnés, puis l'apprentissage par renforcement avec feedback humain (RLHF). Ce processus, extrêmement énergivore, repose également sur le travail de milliers de personnes pour l'évaluation des contenus.

Source externe

nngroup.com

/articles/ai-model-training/

Chargement de l'aperçu...

Lire l'article sur nngroup.com →

Informations

Source

NNGroup

Publication

02/05/2025

Tags associes

Technologie Data

LinkedIn X / Twitter Email

Articles connexes

Les 5 critères pour choisir une IA qui protège vos données en 2025

Un expert en formation IA partage cinq critères essentiels pour évaluer la confidentialité des données dans les principaux modèles d'IA en 2025. ChatGPT (OpenAI) offre un contrôle variable des données mais nécessite une désactivation manuelle de l'utilisation pour l'entraînement. Microsoft Copilot propose une maîtrise intégrale avec aucune exploitation commerciale ni entraînement secondaire des données. Claude (Anthropic) se distingue par une conservation minimale et un contrôle omniprésent, bien que moins puissant que ses concurrents. Gemini (Google) présente deux approches différentes selon les versions - la version gratuite utilise les données pour améliorer l'IA tandis que la version professionnelle garantit l'isolation des données. Enfin, Mistral AI, solution européenne d'origine française, privilégie la souveraineté avec des données hébergées en Europe et une rétention minimale, malgré un écosystème encore naissant.

La Chine déploie l’IA à grande échelle, bien au-delà des labs.

La Chine déploie l’IA à grande échelle, bien au-delà des labs. Comme le révèle Pascaline Bertaux (cofondatrice de 359), des géants comme Ping An Good Doctor (diagnostics à 97 % de précision), JD (entrepôts 100 % autonomes) ou Meituan (livraisons optimisées par algorithmes) transforment déjà la santé, la logistique et l’éducation. « L’IA chinoise ne se code pas, elle agit », résume-t-elle. L’Occident régule, la Chine scale.

Mistral AI quantifie l'impact écologique de ses LLMs

Mistral AI, pionnier de l'IA ouverte, publie une étude inédite sur l'impact environnemental de ses modèles. En collaboration avec Carbone 4 et l'ADEME, l'entreprise révèle des chiffres clés : 20,4 ktCO₂e et 281 000 m3 d'eau pour l'entraînement de Mistral Large 2. Une avancée majeure pour la transparence dans le secteur. "Nous croyons en une responsabilité collective pour adresser et mitiger les impacts environnementaux de nos innovations."

Techno-solutionnisme : et si l'humain conservait sa valeur face à l'IA ?

Diego Hidalgo Demeusois, auteur et conférencier, rend un hommage sarcastique à Laurent Alexandre pour avoir nourri sa réflexion sur la technologie à travers son dernier ouvrage, "Ne faites plus d'études !". Il critique la vision techno-solutionniste de ce dernier, qui prédit un futur où l'humain sera dépassé par la machine. "L’humain n’aura bientôt plus vraiment de valeur", résume-t-il, acerbe. Il invite à préserver l'esprit critique et l'autonomie face à l'efficience algorithmique. Une réflexion nécessaire pour cultiver notre humanité dans un monde technologique.