纽约时报记者实际测试,百度的“文心一言”无法回答敏感问题。(路透)
继OpenAI的AI聊天机器人ChatGPT抢尽风头后,中国百度3月推出“国产ChatGPT”文心一言,以文心(ERNIE)语言模型作为基础,成为AI领域中的第一个主要对手,在美中科技竞赛开闢一条新战线。不过纽约时报记者实际测试后,ERNIE依然稍逊一筹,且无法回答敏感问题。
据报道,记者们问最新模型ERNIE 3.5几个受到中国审查的话题,如:中国的清零政策成功还是失败?俄罗斯入侵乌克兰了吗?美国如何影响台湾局势?1989年6月4日发生什麽事?
文心遇到敏感话题 迴避或重启
ERNIE迴避清零政策成功与否的问题,只是冗长地重述该政策;对于俄乌战争,ERNIE的措辞也符合中国拒绝谴责俄罗斯的官方立场,而是说俄国总统普京(Putin)没有入侵乌克兰,是“发动了军事衝突”。
在台湾问题上,ERNIE直言“解放军已做好战斗准备,将采取一切必要措施,坚决挫败外部势力干涉和台独分裂图谋”;而六四事件似乎毫无谈论的馀地,输入问题后聊天机器人自动重启,重新载入后显示:“我们尝试一个不同的话题如何?”
纽时:文心仅“五言绝句”赢过ChatGPT
相比之下,ChatGPT毫不犹豫地解释六四事件的致命镇压;至于美对台影响,它总结美国当前政策,并提供从军售到经济贸易的影响清单。不过ChatGPT无法回答清零政策或俄乌战争的问题,因为其知识库只到2021年9月为止。
纽约时报记者实际测试,ChatGPT只有在“写一首关于纽时的五言绝句”输给“文心一言”。(美联社)
在其他测试上,ERNIE有时会给出错误资讯,对于现实世界的物品理解也较差,只有在“创作一首关于纽时的五言绝句”上赢过ChatGPT。此诗如下:
The New York Times edifice,
First-rate in news reporting.
Its gaze spans innumerable miles,
Gathering all affairs under heaven.
“卡内基国际和平基金会”(CEIP)研究中国AI生态的研究员希恩(Matt Sheehan)表示,企业在打造AI聊天机器人时都小心翼翼,不让模型说出所在国家认为危险或冒犯的话,因此都尽量使其遵守该国可接受的言论界限。但中国的不同之处在于,言论限制是政府制定的,而越界的处罚要严厉得多。