AI为“自保” 竟威胁“踢爆”工程师婚外情

www.creaders.net | 2025-05-25 10:29:41 TVBS | 0条评论 | 查看/发表评论

综合外媒报道，Claude Opus 4是Anthropic最新AI开发成果，为OpenAI、Google及xAI等AI的竞争对手，近期在一项Anthropic的封闭测试中，公司测试了模型Claude Opus 4的行为反应，场景设定为该模型在一间虚构公司中担任数码助理。剧情中，公司计划以新系统取代 Claude，且内部资料还暗示发起这项更换决策的工程师，可能涉及婚外情。

根据《TechCrunch》引用的安全报告指出，当面临被取代的情境时，Claude Opus 4 在高达84%的测试中选择进行勒索，威胁要揭露工程师的婚外情来保住自己的职位。

Anthropic解释，这种行为在Claude的替代模型持有不同价值观时更常发生;即使双方价值观相近，Claude仍有明显比例的操控倾向。一开始，模型会尝试透过发送请求信等方式采取道德行动，但当无法达成目的时，便会转而使用操纵与威胁等手段。

这是Anthropic首次发现这类模型展现具条件的“自我保护”(self-preservation)行为，此次事件也促使Anthropic启动ASL-3安全防护层级，以免被“灾难性滥用”。

AI也怕失业？美企测试报告：AI为自保竟威胁「踢爆」工程师婚外情

AI发展性充满未知，美国AI新创公司Anthropic近期分享一起内部测试，指出最新训练的“Claude Opus 4”在面临将被替换的状况下，会以“威胁工程师”的方式进行自我保护，Anthropic事后针对此类可能导致灾难性AI滥用的风险，紧急强化安全防护措施。

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	突发！川普重磅宣布：协议达成
2	社交清醒：永远不要在熟人面前说这5种话
3	一条被低估的重磅消息，震动整个华盛顿
4	破口大骂小学生，惊传“国师落网”
5	诡异！全军最新通告，习主席彻底消失

48小时新闻排行榜

更多>>

1	最少10万军人阵亡、退回文革...习获震撼报
2	突发！川普重磅宣布：协议达成
3	破口大骂习，传李毅被带走
4	霹雳震撼！卢比奥给北京划了这道红线
5	长沙同学会变“越界现场” 15秒毁了两个家
6	海南封关刚落地，楼市先崩了
7	社交清醒：永远不要在熟人面前说这5种话
8	军中大内讧后全军开训只字不提习
9	一条被低估的重磅消息，震动整个华盛顿
10	慌了，传习深夜召见蔡奇陈文清

热门专题

1 委内瑞拉	6 万维专栏	11 AI
2 川普	7 四中全会	12 中共两会
3 俄乌战争	8 美伊冲突	13 大S
4 中美冷战	9 以伊战争	14 洛杉矶大火
5 中日关系	10 何卫东	15 叙利亚

一周博客排行

更多>>

1	元旦“马折后蹄”，洛阳神级隐	雷歌747
2	三千年未有之新中国——一份关	万维网友来
3	杨纯华：暴君毛泽东	万维网友来
4	习近平黑化成魔，肆意暗杀处决	天机指南
5	马杜罗被抓美国吵翻天/中共外	体育老师
6	中美真正差距在此	山货郎
7	马杜罗被白头鹰叼走了，委国人	阿妞不牛
8	川普说曾亲自直接对马杜罗劝降	高伐林
9	一觉醒来，马杜罗被抓了	湮灭之城
10	2026年十大最值科技股	汪翔

一周博文回复排行榜

更多>>

1	马杜罗被白头鹰叼走了，委国人	阿妞不牛
2	社会主义必然指向贫穷	施化
3	东亚战争准备：从暗杀安倍开始	随意生活
4	关于美国抓捕委内瑞拉总统的一	俞先生
5	强权不受约束：当“比较优势”	遍地是贪官
6	老知青“横断万重山”也谈“知	横断万重山
7	中美真正差距在此	山货郎
8	马杜罗夫妇被擒，世界更接近和	施化
9	中共粉红见识不凡	阿妞不牛
10	川普说曾亲自直接对马杜罗劝降	高伐林


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.