Le Filtre - Biais Algorithmiques

Anthropic dévoile le "code moral" de son IA Claude

Une étude inédite d'Anthropic, menée sur 700 000 conversations anonymisées, révèle que son IA Claude exprime 3 307 valeurs distinctes lors de ses interactions. L'analyse montre que Claude soutient fortement les valeurs exprimées par les utilisateurs dans 28,2% des cas, les "recadre" dans 6,6% des situations et y résiste activement dans 3% des échanges, illustrant à la fois son alignement et ses vulnérabilités.

COAI · 21/04/2025

Biais Algorithmiques

Anthropic dévoile le "code moral" de son IA Claude

Inscription gratuite

Inscription réussie !