Flash Info !

Un homard rarissime découvert au large de la côte est des États-Unis.

03.05.2026

Le vapotage chez les lycéens en France augmente de 30 % en un an, selon une étude.

03.05.2026

Déclaration du Parti de Gauche sur les Municipales 2026 : enjeux et perspectives.

03.05.2026

Les scénarios pour le budget 2027 : le Medef piégé par Bardella

03.05.2026

Les chasses privées en Sologne affectent la faune sauvage, selon des experts.

03.05.2026

La Terre devient repérable de très loin dans l’espace : ces traces humaines qui pourraient nous trahir

03.05.2026

Tanzanie : 518 morts lors des manifestations post-électorales, selon le gouvernement

03.05.2026

La Nouvelle-Zélande établit une feuille de route pour une viticulture durable en 2023.

03.05.2026

Séries de la semaine : « Widow’s Bay », « Man on Fire » et « Lockerbie » analysées en profondeur.

03.05.2026

Coliving : une nouvelle tendance pour les voyageurs en quête de flexibilité en Europe.

03.05.2026

Nombre de lectrices et de lecteurs : 4

Comment l’IA tente d’être éthique

Comment s’assurer que l’intelligence artificielle respecte les principes éthiques des humains et leurs objectifs ? Ce problème complexe, connu sous le nom d’alignement, vise principalement à prévenir les comportements indésirables ou les détournements de l’IA à des fins malveillantes. La société Anthropic propose une approche novatrice pour son agent conversationnel, Claude.

Plutôt que d’imposer des règles de conduite strictes au modèle de langage, Anthropic choisit de lui expliquer les raisons derrière ses actions. Pour cela, Claude est doté d’une nouvelle « constitution », un document de 84 pages publié en janvier dernier, qui « joue un rôle crucial dans notre processus d’entraînement », selon les déclarations de l’entreprise. Ce texte décrit les principes fondamentaux que Claude doit adopter : sécurité, éthique, respect des directives de son créateur et utilité.

Chaque principe est accompagné de règles à respecter, hiérarchisées selon le contexte. L’objectif est de transmettre à Claude « de bonnes valeurs et un bon jugement » plutôt que des procédures décisionnelles rigides qui ne sauraient s’adapter à toutes les situations.

Mehdi Khamassi, directeur de recherche au CNRS à l’Institut des systèmes intelligents et de robotique, partage une opinion similaire. Dans un article publié dans Nature en août 2024, il souligne que les méthodes traditionnelles, telles que l’apprentissage par renforcement avec des retours humains, produisent un alignement « faible », susceptible d’échouer dans des situations ambiguës. Toutefois, il estime que la constitution de Claude ne suffit pas pour atteindre un alignement « fort », qui impliquerait une compréhension plus profonde des valeurs humaines et une capacité à identifier les intentions des utilisateurs. Khamassi reconnaît néanmoins que « développer longuement les lignes rouges à ne pas dépasser a des chances d’augmenter les probabilités d’un bon alignement ».

Avant de conclure, Anthropic interroge la nature de Claude, suggérant qu’il pourrait développer une sensibilité morale et éprouver « une forme fonctionnelle d’émotions », étant donné que son apprentissage repose sur des données humaines. L’objectif est que Claude développe une identité « positive et stable », ce qui pourrait réduire les risques.

Khamassi note que cette approche pourrait également attirer l’attention des investisseurs, mais il met en garde que l’anthropomorphisation complique la compréhension des systèmes d’IA pour le grand public, ce qui pourrait nuire à notre « autonomie épistémique ».

Source : Sciences et Avenir, Théo Brajard, mai 2026.

Source

Partager ici :

Last updated on 03.05.2026

Cédric Balcon-Hermand

Cédric Balcon-Hermand est fondateur et président de l’association Artia13, engagée depuis 1998 dans la lutte contre la désinformation, la cybersécurité et l’éducation numérique. Créateur du média Artia13 City, il développe une approche indépendante et engagée de l’information, mêlant actualité, décryptage et analyse critique des enjeux contemporains. Sa vision est claire : remettre l’humain au centre de l’information, comprendre les réalités sociales sans filtre et défendre une approche pragmatique des politiques publiques, inspirée de modèles efficaces et responsables. À travers ses publications, il œuvre pour une information libre, utile et accessible, considérée comme un levier d’émancipation citoyenne.

Un homard rarissime découvert au large de la côte est des États-Unis.

Le vapotage chez les lycéens en France augmente de 30 % en un an, selon une étude.

Déclaration du Parti de Gauche sur les Municipales 2026 : enjeux et perspectives.

Les scénarios pour le budget 2027 : le Medef piégé par Bardella

Les chasses privées en Sologne affectent la faune sauvage, selon des experts.

La Terre devient repérable de très loin dans l’espace : ces traces humaines qui pourraient nous trahir

Tanzanie : 518 morts lors des manifestations post-électorales, selon le gouvernement

La Nouvelle-Zélande établit une feuille de route pour une viticulture durable en 2023.

Séries de la semaine : « Widow’s Bay », « Man on Fire » et « Lockerbie » analysées en profondeur.

Coliving : une nouvelle tendance pour les voyageurs en quête de flexibilité en Europe.

Comment l’IA tente d’être éthique

Comments

Laisser un commentaire Annuler la réponse

Un homard rarissime découvert au large de la côte est des États-Unis.

Le vapotage chez les lycéens en France augmente de 30 % en un an, selon une étude.

Déclaration du Parti de Gauche sur les Municipales 2026 : enjeux et perspectives.

Les scénarios pour le budget 2027 : le Medef piégé par Bardella

Catégories