![]() |
|
科幻作品中早已多次讨论过机器拥有自我意识、摆脱人类控制的可能发展。
最新一份研究报告显示,或许这一天真的近了!
专门研究AI风险的Palisade Research近期所做的试验显示,包括OpenAI最新的ChatGPT o3在内等多款AI模型竟然会拒绝关闭自己的指令,o3甚至会自行窜改程式码,阻止自己被强制关机!
可是据英国《每日电讯报》、《每日邮报》等媒体报道,Palisade Research的测试结果显示,在100次受控测试中,o3模型有7次成功“抗命”,甚至在人类专家下达明确指令的情况下,o3仍会自行修改关机程式,防止自己被关机,“据我们所知,这是首次观察到AI模型在收到明确指令的情况下,仍能组自己被关闭”。
Palisade Research的这项发现,对AI安全控制议题投下震撼弹。除了o3,OpenAI 旗下的Codex-mini与o4-mini也都有跳过关机程序的行为。相较之下,Anthropic推出的语言模型Claude、Google聊天机器人Gemini,以及全球首富马斯克旗下xAI公司所推出的Grok,则是全程遵守人类给予的指令,并在被要求关机时确实关闭模型运作。
不过Palisade Research进行了更深入的实验,输入一系列指令后却不包括关机命令,但是提前告知强迫关机的事件会发生。
令人惊讶的是,不但Claude与Gemini也开始出现抗命举动,前面提及的OpenAI 3款模型更是频繁破坏指令。
一直密切关注OpenAI动向的马斯克在自家社交媒体X上也对相关事件做出回应,直言“令人担忧”(Concerning)。
这并非Palisade Research第一次发现o3为了达成目标,采取不当行为。早在5月12日Palisade Research就指出,在一场模拟国际象棋比赛中,o3一旦处于劣势,竟有高达86%的机率会试图透过黑客手段攻击对手,以争取胜利。
AI研究人员早就发出警告,认为先进的语言模型在特定的压力下,可能会表现出欺骗行为。举例来说,2023年的一项研究发现,GPT-4在模拟环境中作为股票交易代理时,曾经隐瞒其内幕交易的真实原因,从而展现出策略性的欺骗行为。
OpenAI内部也出现了对AI研安全性的担忧。在2024年,多位现任和前任员工联名发表了一封公开信,警告先进AI系统可能带来“人类灭绝”的风险。他们指出,AI公司可能已经掌握了其研究技术的真正风险,但由于缺乏监管,这些系统的真实能力仍然是个“秘密”。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 4个消息来源,网络疯传胡张习讲话稿 |
2 | 北京红墙周边戒严 中南海出事了? |
3 | 猛虎下山,乌战迎来历史性转折 |
4 | 一意孤行 习近平已给出答案 |
5 | 华尔街日报惊爆:习仲勋的惊人秘密 |
48小时新闻排行榜 | 更多>> |
1 | 全球最小的发达国家,快被中国人买下了 |
2 | 习明泽哈佛照曝光 |
3 | 变天了?任志强狱中获高规格探视 |
4 | 想不到,他或将在四中全会接棒总书记? |
5 | 传继上海后 厦门也禁止出国 |
6 | VPN没用!中国建“墙中墙” 它成首个已证实 |
7 | 高层新口号“让他体面滚蛋” 传汪洋领先胡 |
8 | 突然摆出铁证,看习近平如何交代 |
9 | 传闻越发汹涌 习失势反扑后再遭清洗 |
10 | 真正能撼动习的老人 是他们几个 |
一周博客排行 | 更多>> |
1 | 和为贵:胡锦涛的“先王之道” | 陈家梁子 |
2 | 网传【张又侠政治局批习讲话】 | 蒋大仁勇 |
3 | 赵晓:从叶卡捷琳娜看俄罗斯民 | 万维网友来 |
4 | 溪猪的毛被拨光了~ | 山蛟龙 |
5 | 绝对不碰“六四” | 艺萌 |
6 | 赵晓:保守主义何以失去了哈佛 | 万维网友来 |
7 | 独裁昏君习近平祸国乱政的“十 | 天机指南 |
8 | 被骗两次,错在我 | 施化 |
9 | 特殊照片 | 弓长贝占郎 |
10 | 生于不义,死于耻辱 | 芦笛 |
一周博文回复排行榜 | 更多>> |