神秘聊天机器人现身Chatbot Arena,或为OpenAI GPT-4.5?

111次阅读
没有评论

共计 1476 个字符,预计需要花费 4 分钟才能阅读完成。

神秘聊天机器人现身 Chatbot Arena,或为 OpenAI GPT-4.5?

Francesco Carta fotografo/Getty Images

自从推出 ChatGPT 以来,OpenAI 一直在致力于开发新的 AI 项目,以延续其 AI 聊天机器人的成功和流行。现在,一个新的神秘大型语言模型 (LLM) 的出现让公众得以一窥其最新项目——而且这款项目令人印象深刻。

上周,“gpt2-chatbot”出现在Chatbot Arena,这是一个用于比较 LLM 性能的基准测试平台。该 LLM 因其在市场上超越了许多最受欢迎的 LLM(例如 GeminiClaude,甚至 GPT-4)而引起了不小的轰动。然而,让许多人失望的是,Chatbot Arena 很快便删除了“gpt2-chatbot”。

另请参阅:[Google 有理由担心:据报道 OpenAI 想要进军搜索市场](https://www.zdnet.com/article/google-was-right-to-be-worried-openai-reportedly-wants-to-enter-the-search-market/)

然而,截至昨晚,如果您访问 Chatbot Arena,您可能会遇到似乎是原始聊天机器人的两个变体:“I’m-a-good-gpt2-chatbot”和“I’m-also-a-good-gpt2-chatbot”。

尽管这两个模型的名称中都包含“GPT”,这通常指的是 OpenAI 的生成式预训练 Transformer (GPT) LLM 家族,但该公司尚未正式承认是该模型背后的公司。OpenAI 首席执行官 Sam Altman 在 X 上发帖,仅隐晦地说明了其中一个 LLM 的名称,“I’m-a-good-gpt2-chatbot”,如下所示。

尽管这些模型在 Chatbot Arena 中可用,但访问它们很棘手。这两个模型不在 Chatbot Arena 支持的 LLM 列表中,因此您无法在并排比较功能中对其进行测试。

相反,如果您想访问它们,您必须不断发起 Arena(战斗)比较——它会随机选择两个 LLM 进行对抗——直到出现这两个新模型中的一个。我花了五轮才最终让这两个模型中的一个出现,如下所示。如果您决心亲自测试这些模型,那么额外的努力是值得的。

神秘聊天机器人现身 Chatbot Arena,或为 OpenAI GPT-4.5?

Chatbot Arena

一旦您打开了“I’m-a-good-gpt2-chatbot”,您就可以继续与该聊天机器人聊天,以亲自测试其功能。您可以与之进行持续的对话,直到您决定开始新一轮或刷新页面。

另请参阅:[Microsoft 365 的这四个新 Copilot 功能让专业人士的提示写作变得更加轻松](https://www.zdnet.com/article/these-four-new-copilot-for-microsoft-365-features-make-prompt-writing-like-a-pro-even-easier/)

用户已经测试了这些新匿名模型的强大功能,包括用一个提示创建 Flappy Bird 仿制品,创建 使用 Claude Opus 的代码解释器 ,甚至 解决一些基本的物理问题

这些改进让人们猜测该模型是 OpenAI 的 GPT-4.5 或 GPT-5,以笔名发布,以便 OpenAI 可以准确地衡量其性能。当一位用户问“I’m-a-good-gpt2-chatbot”它是哪个确切的 LLM 版本时,该模型说,“我基于 GPT-4 架构,特别是 GPT-4.5 变体。”

我们无法确定这是否是错误的结果;在 OpenAI 确认任何事项之前,最好在使用此 LLM 时谨慎行事。但是,如果您有一丝好奇心,我建议您尝试一下。您可以免费体验该模型。

#### 人工智能

正文完
 0
admin-gah
版权声明:本站原创文章,由 admin-gah 于2024-05-20发表,共计1476字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码