Anthropic dévoile le "code moral" de son IA Claude

Une étude inédite d'Anthropic, menée sur 700 000 conversations anonymisées, révèle que son IA Claude exprime 3 307 valeurs distinctes lors de ses interactions. L'analyse montre que Claude soutient fortement les valeurs exprimées par les utilisateurs dans 28,2% des cas, les "recadre" dans 6,6% des situations et y résiste activement dans 3% des échanges, illustrant à la fois son alignement et ses vulnérabilités.

Source externe

getcoai.com

/news/anthropics-ai-shows-distinct-moral-code-in-700000-c...

Chargement de l'aperçu...

Lire l'article sur getcoai.com →

Informations

Source

COAI

Publication

21/04/2025

Tags associes

Éthique Biais Algorithmiques

LinkedIn X / Twitter Email

Articles connexes

Mistral AI quantifie l'impact écologique de ses LLMs

Mistral AI, pionnier de l'IA ouverte, publie une étude inédite sur l'impact environnemental de ses modèles. En collaboration avec Carbone 4 et l'ADEME, l'entreprise révèle des chiffres clés : 20,4 ktCO₂e et 281 000 m3 d'eau pour l'entraînement de Mistral Large 2. Une avancée majeure pour la transparence dans le secteur. "Nous croyons en une responsabilité collective pour adresser et mitiger les impacts environnementaux de nos innovations."

IA frugale : entre marketing et réalité, le fossé se creuse

Amélie Raoul, chercheuse en IA, dénonce le greenwashing dans le domaine de l'intelligence artificielle. Elle met en lumière le phénomène de l'IA frugale, souvent présentée comme une solution écologique, mais rarement mesurée de manière concrète. Selon elle, les promesses marketing sont loin de la réalité : « Notre IA consomme 90% moins ! » mais 90% moins que quoi ? Les certifications et les slogans verts cachent souvent une absence de données tangibles. Les vrais experts, eux, cherchent des solutions réellement sobres. Une requête GPT-4 consomme 10 Wh, tout comme un chatbot « frugal ». Il est temps de demander des preuves réelles et non des promesses creuses.

Disney, Marvel et Universal attaquent Midjourney pour violation massive de droits d'auteur

Luiza Jarovsky, co-fondatrice de l'AI Tech & Privacy Academy, révèle une offensive judiciaire majeure. Disney, Universal, Marvel et Dreamworks poursuivent Midjourney pour violation de droits d'auteur. "Midjourney a créé un service commercial lucratif en copiant sans autorisation nos œuvres protégées", dénoncent les plaignants. L'industrie cinématographique, représentant 260 milliards de dollars et des millions d'emplois, se mobilise contre ce qu'elle qualifie de "vol de propriété intellectuelle systématique".

Détecter les images générées par IA : un outil "prometteur"

Thomas Buyle, développeur et passionné d'IA, partage sa découverte d'un outil efficace pour identifier les images générées par intelligence artificielle. Ce détecteur permet non seulement de distinguer les images authentiques des fakes, mais aussi d'identifier le modèle d'IA spécifique utilisé pour leur création. L'auteur note toutefois quelques limites: dans son test avec une image de Macron créée par IA, l'outil a correctement identifié qu'il s'agissait d'une image générée artificiellement, mais s'est trompé sur le modèle utilisé (identifiant Stable Diffusion au lieu de Flux). Ce type d'outil devient particulièrement utile dans un contexte où il devient de plus en plus difficile de distinguer à l'œil nu les images authentiques des deepfakes sophistiqués, offrant une solution rapide pour vérifier l'authenticité du contenu visuel en quelques secondes.