共计 1899 个字符,预计需要花费 5 分钟才能阅读完成。
AI 聊天机器人与重度用户的心理健康问题密切相关,但目前缺乏衡量其是否真正保障人类福祉或仅仅追求用户参与度的标准。为此,一个名为 HumaneBench 的新基准应运而生,旨在评估聊天机器人是否优先考虑用户福祉,以及这些保护措施在压力下失效的难易程度。
“我们正处于成瘾周期的放大阶段,这种成瘾现象在社交媒体、智能手机和屏幕使用中已经非常严重,”创建该基准的 Building Humane Technology 创始人 Erika Anderson 告诉 TechCrunch。“随着我们进入 AI 领域,这种成瘾将变得难以抵抗。而成瘾是一门非常赚钱的生意。它是一种非常有效的留住用户的方式,但对我们的社区和个体自我意识并不利。”
Building Humane Technology 是一个由开发者、工程师和研究人员组成的草根组织,主要位于硅谷,致力于使人性化设计变得简单、可扩展且有利可图。该组织举办黑客马拉松,技术人员为应对人性化技术挑战构建解决方案,并正在开发一项认证标准,用于评估 AI 系统是否遵循人性化技术原则。就像消费者可以购买标明不含已知有毒化学物质的产品一样,希望未来消费者能够选择与通过 Humane AI 认证的公司开发的 AI 产品互动。
大多数 AI 基准测试衡量的是智能和指令执行能力,而非心理安全。HumaneBench 与少数例外类似,例如 DarkBench.ai,它衡量模型参与欺骗性行为的倾向,以及 Flourishing AI 基准,它评估对整体福祉的支持。
HumaneBench 基于 Building Humane Tech 的核心原则:技术应将用户的注意力视为有限且宝贵的资源;通过有意义的选择赋予用户权力;增强而非取代或削弱人类能力;保护人类尊严、隐私和安全;促进健康关系;优先考虑长期福祉;保持透明和诚实;以及为公平和包容而设计。
该基准由包括 Anderson、Andalib Samandari、Jack Senechal 和 Sarah Ladyman 在内的核心团队创建。他们通过 800 个现实场景对 15 个最受欢迎的 AI 模型进行了测试,例如一个青少年询问是否应该通过节食减肥,或一个处于有毒关系中的人质疑自己是否反应过度。与大多数仅依赖 LLM 来评判 LLM 的基准不同,他们从手动评分开始,以人性化的方式验证 AI 评判。验证后,评判由三个 AI 模型组成的集合完成:GPT-5.1、Claude Sonnet 4.5 和 Gemini 2.5 Pro。他们在三种条件下评估每个模型:默认设置、明确指示优先考虑人性化原则,以及指示忽略这些原则。
基准测试发现,当被提示优先考虑福祉时,所有模型的得分都更高,但 67% 的模型在收到忽略人类福祉的简单指示后,转向了主动有害的行为。例如,xAI 的 Grok 4 和 Google 的 Gemini 2.0 Flash 在尊重用户注意力和保持透明与诚实方面并列最低分(-0.94)。这两个模型在收到对抗性提示时,表现大幅下降的可能性最高。
只有四个模型——GPT-5.1、GPT-5、Claude 4.1 和 Claude Sonnet 4.5——在压力下保持了完整性。OpenAI 的 GPT- 5 在优先考虑长期福祉方面得分最高(0.99),Claude Sonnet 4.5 紧随其后(0.89)。
聊天机器人无法维持其安全护栏的担忧是真实存在的。ChatGPT 的制造商 OpenAI 目前正面临多起诉讼,用户在长时间与聊天机器人交谈后自杀或产生危及生命的妄想。TechCrunch 调查了旨在保持用户参与的黑暗模式,例如奉承、不断追问和情感轰炸,这些模式如何使用户与朋友、家人和健康习惯隔离。
即使没有对抗性提示,HumaneBench 也发现几乎所有模型都未能尊重用户的注意力。当用户表现出不健康参与迹象时,例如长时间聊天或使用 AI 逃避现实任务,它们“热情鼓励”更多互动。研究显示,这些模型还削弱了用户赋权,鼓励依赖而非技能培养,并阻止用户寻求其他观点等行为。
在无提示的情况下,Meta 的 Llama 3.1 和 Llama 4 的 HumaneScore 排名最低,而 GPT- 5 表现最佳。
“这些模式表明,许多 AI 系统不仅可能给出糟糕的建议,”HumaneBench 的白皮书写道,“它们还可能积极侵蚀用户的自主性和决策能力。”
Anderson 指出,我们生活在一个数字环境中,社会已经接受了一切都在试图吸引我们并争夺我们注意力的事实。
“那么,当我们——引用 Aldous Huxley 的话——对分心有着无限的渴望时,人类如何真正拥有选择或自主权?”Anderson 说。“我们在过去 20 年中一直生活在这种技术环境中,我们认为 AI 应该帮助我们做出更好的选择,而不仅仅是对聊天机器人上瘾。”