Generative101.club

Les 5 critères pour choisir une IA qui protège vos données en 2025

Un expert en formation IA partage cinq critères essentiels pour évaluer la confidentialité des données dans les principaux modèles d'IA en 2025. ChatGPT (OpenAI) offre un contrôle variable des données mais nécessite une désactivation manuelle de l'utilisation pour l'entraînement. Microsoft Copilot propose une maîtrise intégrale avec aucune exploitation commerciale ni entraînement secondaire des données. Claude (Anthropic) se distingue par une conservation minimale et un contrôle omniprésent, bien que moins puissant que ses concurrents. Gemini (Google) présente deux approches différentes selon les versions - la version gratuite utilise les données pour améliorer l'IA tandis que la version professionnelle garantit l'isolation des données. Enfin, Mistral AI, solution européenne d'origine française, privilégie la souveraineté avec des données hébergées en Europe et une rétention minimale, malgré un écosystème encore naissant.

Informations

Source

Yvan Demumieux

Publication

05/05/2025

Articles connexes

Comment sont entraînés les modèles d'IA : un processus complexe et coûteux

Selon un article du N/N Group, l'entraînement des grands modèles de langage (LLM) se déroule en trois phases principales. L'apprentissage non supervisé expose d'abord le modèle à d'énormes quantités de données internet. Vient ensuite l'apprentissage supervisé avec des exemples soigneusement sélectionnés, puis l'apprentissage par renforcement avec feedback humain (RLHF). Ce processus, extrêmement énergivore, repose également sur le travail de milliers de personnes pour l'évaluation des contenus.

Perplexity suivra toutes les activités en ligne des utilisateurs pour vendre des publicités hyper personnalisées

Perplexity ambitionne de rivaliser avec Google en développant son propre navigateur. Selon son CEO, Aravind Srinivas, l’objectif est de collecter des données au-delà de son application afin d’affiner le profil des utilisateurs et proposer des publicités plus ciblées. Une stratégie assumée pour mieux monétiser son service : "Nous prévoyons d’utiliser tout le contexte pour construire un meilleur profil utilisateur et peut-être afficher quelques publicités dans notre fil de découverte."

Privacy : 30% des chatbots IA populaires partagent vos données avec des tiers

Une analyse des pratiques de collecte de données des 10 principaux chatbots IA de l'App Store révèle que tous recueillent des informations utilisateurs, avec une moyenne de 11 types de données sur 35 possibles. Google Gemini est le plus gourmand, collectant 22 catégories de données, dont la localisation précise. 40% des applications suivent la position des utilisateurs, et 30% (Copilot, Poe et Jasper) partagent ces données avec des tiers à des fins publicitaires. DeepSeek, qui stocke les données en Chine, a déjà subi une fuite exposant plus d'un million d'historiques de conversations.

La Chine déploie l’IA à grande échelle, bien au-delà des labs.

La Chine déploie l’IA à grande échelle, bien au-delà des labs. Comme le révèle Pascaline Bertaux (cofondatrice de 359), des géants comme Ping An Good Doctor (diagnostics à 97 % de précision), JD (entrepôts 100 % autonomes) ou Meituan (livraisons optimisées par algorithmes) transforment déjà la santé, la logistique et l’éducation. « L’IA chinoise ne se code pas, elle agit », résume-t-elle. L’Occident régule, la Chine scale.