COAI
Anthropic dévoile le "code moral" de son IA Claude
COAI 21 avril 2025 · Éthique· Biais Algorithmiques
Contexte
Une étude inédite d'Anthropic, menée sur 700 000 conversations anonymisées, révèle que son IA Claude exprime 3 307 valeurs distinctes lors de ses interactions. L'analyse montre que Claude soutient fortement les valeurs exprimées par les utilisateurs dans 28,2% des cas, les "recadre" dans 6,6% des situations et y résiste activement dans 3% des échanges, illustrant à la fois son alignement et ses vulnérabilités.
Source originale
Cet article a été sélectionné et archivé pour sa pertinence sur l'IA en entreprise. Retrouvez le contenu complet sur getcoai.com.
Lire sur getcoai.com ↗ 📌
Contenu figé · Archivé en 2025. Pour l'actualité IA en temps réel, suivez Florent et Ange sur LinkedIn.