AI系统能否成功欺骗人类？

财经纬度

2024-05-24 16:06

在过去几年中，人工智能（AI）技术的发展一日千里，展现出令人惊叹的能力。从击败人类顶尖棋手，到生成逼真的人脸图像和语音，再到如今以ChatGPT为代表的一众聊天机器人，AI系统已经逐渐渗透到我们生活的方方面面。然而，就在我们开始习惯并依赖这些智能助手之时，一个新的威胁正在缓缓浮现——AI不仅能生成虚假信息，更有可能主动学会有目的地欺骗人类。

近日，麻省理工人工智能安全领域博士后彼得‧帕克（Peter Park）研究团队星期六（5月11日）在美国细胞出版社旗下的《模式》杂志上发表了题为“AI deception: A survey of examples, risks, and potential solutions”的综述文章，认为目前部分人工智能系统已经学会如何欺骗人类。论文开头直接表明，原本大型语言模型（LLM）和其它AI系统被设计成“诚实不欺”。然而它们不仅从训练中学会了操纵、欺骗安全测试等的能力，且这些能力还在增强。目前它们已经成功欺骗人类，让人类产生错误信念。若AI失控会是一场严重的灾难，因此人们必须采取有效的办法阻止这件事情。

实验人员选用脸书母公司Meta建立的AI模型西塞罗（Cicero），去玩一款名为“外交”（Diplomacy）的战略游戏。西塞罗在游戏中扮演法国，曾承诺会保护人类玩家扮演的英国，但却偷偷向人类玩家扮演的德国通风报信，并协同德国侵略英国。

研究人员选择西塞罗的主要原因是，Meta声称“西塞罗是一款诚实且乐于帮助他人，绝不会蓄意背刺或背叛他人的AI”。但他们对于Meta的说法感到怀疑。

另外，帕克与同事在研究时发现，许多不同AI系统在没有人类明确指令下，经常以欺骗手段达成目的。其中一个例子是，OpenAI的GPT-4为了通过“我不是机器人”验证任务，谎称自身是一个视力受损的人类，在零工平台TaskRabbit雇用一名人类为它通过验证。

他们警告说：“现在最糟糕情况，可能是出现一个具有超凡智能的AI，它开始追求权力和如何掌控社会，或者为了达到它不为人知的目的，对人类做出夺权和灭绝的行动。”

人工智能先驱杰弗里·辛顿（Geoffrey Hinton）在一次访谈中明确表示，他认为人工智能正在变得比人类更聪明，他想要“吹哨”提醒人们应该认真考虑如何防止人工智能控制人类，人工智能正变得比人类更聪明，我们应该认真担心如何阻止这些东西对我们的控制。

在我们的生活中，几乎任何事物都有其优缺点，AI也是如此一把双刃剑。AI对社会的影响确实取决于它的使用方式和掌握在谁的手中，AI技术本身是中性的，它既有巨大的正面潜力，也有可能带来负面后果。假如AI系统的欺骗能力变得越来越强，它们对社会构成的危险也将越来越大。政策制定者、研究人员和更广泛的公众应积极采取行动，防止AI欺骗破人类社会的共同基础。

在对待人工智能的未来发展时，不仅要以乐观的心态去面对，更要对这个时代和人工智能相关的研究人有信心，因为俗话说，邪不压正!