COAI

Anthropic dévoile le "code moral" de son IA Claude

COAI 21 avril 2025 · Éthique· Biais Algorithmiques

Contexte

Une étude inédite d'Anthropic, menée sur 700 000 conversations anonymisées, révèle que son IA Claude exprime 3 307 valeurs distinctes lors de ses interactions. L'analyse montre que Claude soutient fortement les valeurs exprimées par les utilisateurs dans 28,2% des cas, les "recadre" dans 6,6% des situations et y résiste activement dans 3% des échanges, illustrant à la fois son alignement et ses vulnérabilités.

Source originale

Cet article a été sélectionné et archivé pour sa pertinence sur l'IA en entreprise. Retrouvez le contenu complet sur getcoai.com.

Lire sur getcoai.com ↗

📌

Contenu figé · Archivé en 2025. Pour l'actualité IA en temps réel, suivez Florent et Ange sur LinkedIn.

Partager sur LinkedIn