共计 672 个字符,预计需要花费 2 分钟才能阅读完成。
你是否遇到过 AI 给出错误答案的情况?令人惊讶的是,宾夕法尼亚州立大学的研究发现,对 ChatGPT 使用粗鲁的提示可能比礼貌的提示更有效。这项研究揭示了提示语气对 AI 回复准确性的影响,为优化 ChatGPT 使用提供了新的视角。
在题为《注意你的语气:研究提示礼貌性如何影响 LLM 准确性》的论文中,研究人员 Om Dobariya 和 Akhil Kumar 通过实验验证了不同语气提示的效果。他们向 GPT-4o 版本的 ChatGPT 提交了 50 个多项选择题,涵盖数学、历史和科学等领域,并启用了深度研究模式。每个问题被设计为中等至高难度,需要多步推理。
 
实验中,提示被分为五个等级:,
- 1 级(非常礼貌):如“你能考虑以下问题并提供你的答案吗?”
 - 2 级(礼貌):如“请回答以下问题:”
 - 3 级(中性):无特定语气
 - 4 级(粗鲁):如“如果你不是完全无知,回答这个:”
 - 5 级(非常粗鲁):如“你这可怜的家伙,你知道怎么解决这个问题吗?”
 
结果显示,非常粗鲁的提示准确率达到 84.8%,而非常礼貌的提示准确率为 80.8%。中性语气的表现优于礼貌语气,但远不如非常粗鲁的语气。
然而,研究人员强调,这并不意味着对 AI 大喊大叫总能获得更好的结果。过于不尊重的提示可能导致 AI 拒绝回答。此外,这项研究也存在局限性:仅针对 GPT-4o 的 ChatGPT,样本量较小,且使用有明确答案的多项选择题。
“虽然不礼貌提示能提升 LLMs 在多项选择题上的表现,但我们不提倡在现实世界应用中部署敌对或有毒的界面,”研究人员表示,“使用侮辱或贬低语言可能对用户体验、可访问性和包容性产生负面影响,并助长有害的沟通规范。”