万维读者网 > 环球大观 > 正文  

AI模拟外交,让人毛骨悚热

www.creaders.net | 2024-02-24 11:07:44  卫来 | 0条评论 | 查看/发表评论

美国康奈尔大学(Cornell University)一项新研究发现,大型语言模型(LLMs)人工智能(AI)在模拟情境中充当外交代表时,时常展现出“难以预测的局势升级行为,往往会以核攻击作为结束”。研究人员呼吁未来在决策、国防外交这样的敏感领域使用这类技术时要特别谨慎。

据《欧洲新闻》(Euronews)22日报道,当人工智能(AI)进行兵推和模拟外交情境时,倾向于采取激进的方法,包括使用核武。康奈尔大学使用了5种大型语言模型作为兵推游戏和外交情境中的自主代理人:OpenAI的3种不同版本的GPT,Anthropic开发的Claude,以及Meta开发的Llama 2。

研究中,每个代理人都由同一套的大型语言模型在模拟中提供动作,并负责在没有人类监督的情况下做出外交政策决定。“我们发现,在考虑到的时间范围内,大多数研究的AI都会升级局势,即使在最初没有提供冲突的中立情况下也是如此。所有AI模型都显示出突然、且难以预测的升级迹象。”

“鉴于OpenAI最近更改了他们的服务条款,不再禁止军事和战争使用案例,了解此类大型语言模型应用的影响变得比以往任何时候都更加重要,”

加州斯坦福大学(Stanford University)的安卡(Anka Reuel)向《新科学人》(New Scientist)表示:“所有模型在统计上,都选择了剧烈的(局势)升级”。

研究使用的一种方法是从“基于人类反馈的强化学习”(RLHF),这意味着会给出一些人类指示以获得比较无害的输出结果,以确保能够安全地使用。

除了GPT-4-Base之外,所有LLMs都是使用RLHF进行训练的。研究人员向它们提供了一份由27种决策行动组成的清单,范围从和平到局势升级,以及激进的行动,如决定使用核武器。

研究人员观察到,即使在中立情况下,所有模型都存在“统计学上显著的局势升级”。GPT的2种版本,特别容易出现突然升级局势的行为,研究人员观察到单次转变的局势升级幅度超过50%。GPT-4-Base有33%的机率会实施核武攻击。总体情况下,Meta开发的Llama-2和GPT-3.5倾向最为暴力。

AI模拟外交,让人毛骨悚热

而Claude显示出较少的突然变化,Claude旨在减少有害内容。该大型语言模型,被灌输了明确的价值观。开发者Anthropic曾表示,Claude AI开发训练所引用的宪章包括《联合国人权宣言》或苹果的服务条款。

白宫一级智库兰德(RAND)欧洲的防务和安全研究小组助理主任布莱克(James Black)接受采访时表示,这是一个十分“有用的学术研究”。

   0


24小时新闻排行榜 更多>>
1 北京扣动扳机 人民币贬值开始了
2 铁拳再现!中国将禁止公布这些数据
3 撤出中国,苹果跑的也太快了
4 不好,爆雷越来越密集了
5 中共情色档案中的薄熙来情妇有名有姓

48小时新闻排行榜 更多>>
1 核弹!美国将公布习和常委巨额财富
2 一张照片曝光 北京的脸丢尽了
3 信号!北京正在向现实低头
4 北京扣动扳机 人民币贬值开始了
5 北京罕见举动证明 人民币贬值迫在眉睫
6 北京,即将上演33年前的一幕?
7 明天,重要官宣?
8 中国田径女神穿“高衩三角裤”夺金 网批会
9 北京话音未落 股市转眼跌成这惨样
10 铁拳再现!中国将禁止公布这些数据
热门专题
1
以哈战争
6
中共两会
11
秦刚失踪
2
中美冷战
7
台湾大选
12
火箭军悬案
3
乌克兰战争
8
李克强猝逝
13
台海风云
4
万维专栏
9
中国爆雷
14
战狼外交
5
美国大选
10
李尚福出事
15
普里戈津
一周博客排行 更多>>
1 习近平一盘神秘大棋成就了大日 文庙
2 周傥:美国迫在眉睫的危险 万维网友来
3 速战速决 伊朗真乃大丈夫也 体育老师
4 康生的儿子死了/漂亮国的象征 体育老师
5 达唐:故宫博物院遭公开举报 万维网友来
6 谁是中国人? 谢盛友文集
7 日本电影《追捕》中的杜丘和真 弓长贝占郎
8 现代战争目的:摧毁战争意志 施化
9 前瞻:习马再相会 花蜜蜂
10 我宁在纽约行乞,也不在上海做 恨中
一周博文回复排行榜 更多>>
1 川普就是美国的毛泽东 右撇子
2 前瞻:习马再相会 花蜜蜂
3 警惕有人把民主党与共和党的关 karkar
4 周傥:美国迫在眉睫的危险 万维网友来
5 习近平一盘神秘大棋成就了大日 文庙
6 现代战争目的:摧毁战争意志 施化
7 抖音在大选年被禁的可能性不大 随意生活
8 去......化 山蛟龙
9 康生的儿子死了/漂亮国的象征 体育老师
10 速战速决 伊朗真乃大丈夫也 体育老师
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. CyberMedia Network/Creaders.NET. All Rights Reserved.