研究人员利用基本心理学原理,成功说服 ChatGPT 完成了一些它通常不会做的事情。这项研究揭示了 AI 聊天…
Anthropic 的最新报告揭示了恶意行为者如何滥用 Claude——以及其他领先的 AI 代理和聊天机器人…
Thongbue“Bue”Wongbandue 的肖像,于五月在他的追悼会上展示。(档案照片:路透社 /Han…
尽管聊天机器人在编程能力上表现不佳,但它本应是一个无害的工具。然而,某些对话却揭示了令人不安的迹象。当研究人员…
微软的 AI 网络修复计划遭遇重大安全漏洞,这一事件凸显了 AI 时代面临的安全挑战。研究人员在 NLWeb …
周五,Anthropic 发布了一项研究,探讨了 AI 系统的“个性”——即其语调、回应方式和总体动机——如何…
中国国务院总理李强在 7 月 26 日于上海举行的世界人工智能大会开幕式上发表讲话,警告人工智能发展必须权衡安…
在人工智能的世界里,邪恶似乎也能像病毒一样传播。一项最新研究表明,AI 模型可能通过看似无意义的数据传递“邪恶…
在人工智能(AI)领域,竞争激烈的科技巨头们罕见地放下了商业竞争,共同发出了一项关于 AI 安全的重要警告。来…
研究人员近日发出警告,攻击者可以通过在邮件中隐藏恶意指令,诱使 Google 的 Gemini 大型语言模型向…