在过去几年中,人工智能(AI)技术的发展一日千里,展现出令人惊叹的能力。从击败人类顶尖棋手,到生成逼真的人脸图像和语音,再到如今以ChatGPT为代表的一众聊天机器人,AI系统已经逐渐渗透到我们生活的方方面面。然而,就在我们开始习惯并依赖这些智能助手之时,一个新的威胁正在缓缓浮现——AI不仅能生成虚假信息,更有可能主动学会有目的地欺骗人类。
近日,麻省理工人工智能安全领域博士后彼得‧帕克(Peter Park)研究团队星期六(5月11日)在美国细胞出版社旗下的《模式》杂志上发表了题为“AI deception: A survey of examples, risks, and potential solutions”的综述文章,认为目前部分人工智能系统已经学会如何欺骗人类。论文开头直接表明,原本大型语言模型(LLM)和其它AI系统被设计成“诚实不欺”。然而它们不仅从训练中学会了操纵、欺骗安全测试等的能力,且这些能力还在增强。目前它们已经成功欺骗人类,让人类产生错误信念。若AI失控会是一场严重的灾难,因此人们必须采取有效的办法阻止这件事情。
实验人员选用脸书母公司Meta建立的AI模型西塞罗(Cicero),去玩一款名为“外交”(Diplomacy)的战略游戏。西塞罗在游戏中扮演法国,曾承诺会保护人类玩家扮演的英国,但却偷偷向人类玩家扮演的德国通风报信,并协同德国侵略英国。
研究人员选择西塞罗的主要原因是,Meta声称“西塞罗是一款诚实且乐于帮助他人,绝不会蓄意背刺或背叛他人的AI”。但他们对于Meta的说法感到怀疑。
另外,帕克与同事在研究时发现,许多不同AI系统在没有人类明确指令下,经常以欺骗手段达成目的。其中一个例子是,OpenAI的GPT-4为了通过“我不是机器人”验证任务,谎称自身是一个视力受损的人类,在零工平台TaskRabbit雇用一名人类为它通过验证。
他们警告说:“现在最糟糕情况,可能是出现一个具有超凡智能的AI,它开始追求权力和如何掌控社会,或者为了达到它不为人知的目的,对人类做出夺权和灭绝的行动。”
人工智能先驱杰弗里·辛顿(Geoffrey Hinton)在一次访谈中明确表示,他认为人工智能正在变得比人类更聪明,他想要“吹哨”提醒人们应该认真考虑如何防止人工智能控制人类,人工智能正变得比人类更聪明,我们应该认真担心如何阻止这些东西对我们的控制。
在我们的生活中,几乎任何事物都有其优缺点,AI也是如此一把双刃剑。AI对社会的影响确实取决于它的使用方式和掌握在谁的手中,AI技术本身是中性的,它既有巨大的正面潜力,也有可能带来负面后果。假如AI系统的欺骗能力变得越来越强,它们对社会构成的危险也将越来越大。政策制定者、研究人员和更广泛的公众应积极采取行动,防止AI欺骗破人类社会的共同基础。
在对待人工智能的未来发展时,不仅要以乐观的心态去面对,更要对这个时代和人工智能相关的研究人有信心,因为俗话说,邪不压正!
报告显示,中国电力投资加速增长,预计2024年电网基建投资将超过5300亿元。
近日,市场迎来了一则引人注目的消息:工业巨头3M公司(MMM.N)在本周五公布了其季度业绩报告,随后股价飙升至近两年来的
最近,外媒给OpenAI算了笔账,今年可能要血亏50亿美元。
近日,巴黎奥运会和世界铁人三项协会联合发布了一项重大决定,宣布因塞纳河水质污染问题,原定于近期进行的奥运会铁人三项首次下
当地时间7月18日,法国巴黎发生了一起令人震惊的持刀袭警事件。
近期,一则重大消息在国际舞台上引起轩然大波,马来西亚宣布加入金砖国家。
调查发现,互联网和智能手机的使用干扰了韩国近五分之一学生的生活。