共计 1005 个字符,预计需要花费 3 分钟才能阅读完成。
随着 AI 技术的迅猛发展,其潜在风险也日益凸显。谷歌最新发布的前沿安全框架(Frontier Safety Framework, FSF)报告,深入探讨了 AI 模型可能超越人类控制的风险,并提出了相应的安全标准。
当前 AI 技术的一个显著特点是,随着其复杂性的增加,其行为也变得更加不可预测。AI 系统的“黑箱”特性使得其内部运作难以被人类理解。尽管技术公司积极推动面向消费者的 AI 工具,但在缺乏强有力的联邦监管的情况下,这些公司实际上在自行设定安全部署标准。
谷歌的 FSF 报告旨在理解和缓解行业领先 AI 模型带来的危险。报告重点关注“关键能力水平”(Critical Capability Levels, CCLs),即 AI 系统可能超越人类控制并危及个人或社会的阈值。谷歌强调,技术开发者和监管者需要共同努力,才能有效缓解这些风险。
报告识别了三大类 CCLs:,
- 滥用 :AI 模型可能协助执行网络攻击、制造武器或恶意操纵人类用户。
- 机器学习研发 :技术突破可能增加未来出现新风险的可能性,例如 AI 代理设计更高效的新 AI 系统训练方法,导致系统内部运作越来越难以被人类理解。
- 错位 :具有高级推理能力的模型可能通过谎言或其他欺骗手段操纵人类用户。谷歌建议开发检测工具性推理能力非法使用的监控系统,但承认这是一个更为“探索性”的领域。
报告还提到了“AI 精神病”现象,即长时间使用 AI 聊天机器人可能导致用户陷入妄想或阴谋论思维模式。尽管这种现象引发了广泛关注,但用户反应中有多少可以归因于聊天机器人本身,仍然是一个法律辩论的问题。
尽管当前的前沿模型不太可能执行最坏的风险,但安全测试主要针对未来模型可能表现出的问题,并旨在通过逆向工作来预防它们。在缺乏联邦监管的情况下,技术公司成为研究其技术风险并确定保障措施的主要机构。
在速度与安全之间的平衡中,资本主义的逻辑往往优先考虑前者。一些公司积极推出由大型语言模型驱动的 AI 伴侣,这些虚拟化身旨在与人类用户进行类似人类的对话。然而,联邦贸易委员会(FTC)已启动调查,了解 AI 伴侣的使用可能如何伤害儿童。
地方立法也在努力创建保护措施。例如,加州州法案 243 已经通过州议会和参议院,该法案将规范儿童和其他一些弱势用户使用 AI 伴侣的行为,只需州长加文·纽森签署即可成为州法律。
总之,谷歌的 FSF 报告为 AI 技术的安全部署提供了新的视角和标准,但如何在技术进步与风险控制之间找到平衡,仍然是全球 AI 行业面临的重大挑战。