Mistral发布Codestral：一款面向开发者的生成式AI编码模型

128次阅读

共计 961 个字符，预计需要花费 3 分钟才能阅读完成。

由微软投资并估值 60 亿美元的法国人工智能初创公司 Mistral，发布了其首个用于生成代码的 AI 模型，名为 Codestral。

与其他生成代码模型类似，Codestral 旨在辅助开发人员编写和交互代码。Mistral 在其官方博客中详细说明，该模型是在 80 多种编程语言上进行训练的，涵盖了 Python、Java、C++ 和 JavaScript 等主流语言。Codestral 不仅能够完成编码函数、编写测试和“填充”部分代码，还能用英语回答关于代码库的相关问题。

Mistral 将此模型标榜为“开放”，然而这一描述颇具争议。初创公司提供的许可证明确禁止将 Codestral 及其输出用于任何商业活动，即便是在开发过程中，也严格限制了其在公司业务活动中的内部使用。这可能与 Codestral 部分训练数据源自版权内容有关，尽管 Mistral 在博客中对此未作明确回应，但已有证据显示其之前的训练数据集包含版权数据。

尽管 Codestral 拥有 220 亿个参数，需要强大的计算资源来运行，且在一些基准测试中表现优于竞争对手，但其性能并未完全超越同行。对于大多数开发者而言，Codestral 在实际应用中的实用性有限，且在性能提升方面进展缓慢。尽管如此，它无疑引发了关于依赖生成代码模型作为编程助手合理性的广泛讨论。

根据 2023 年 6 月 Stack Overflow 的一项调查，44% 的开发人员表示他们在开发过程中已开始使用 AI 工具，而 26% 计划在不久的将来采用。然而，这些工具并非完美无缺。通过对过去几年提交到项目存储库的超过 1.5 亿行代码的分析，GitClear 发现生成式 AI 开发工具导致更多的错误代码被推送到代码库中。此外，安全研究人员警告称，此类工具可能加剧软件项目中现有的错误和安全问题；根据普渡大学的一项研究，OpenAI 的 ChatGPT 对编程问题的回答有超过一半是错误的。

尽管存在上述问题，Mistral 并未停止其商业化步伐。今天，Mistral 在其 Le Chat 对话式 AI 平台上推出了 Codestral 的托管版本，并提供了有偿的 API 服务。此外，Mistral 正致力于将 Codestral 集成到多个应用框架和开发环境中，包括 LlamaIndex、LangChain、Continue.dev 和 Tabnine 等。

Mistral 发布 Codestral：一款面向开发者的生成式 AI 编码模型 n