Midjourney V7 发布：AI 图像生成技术的重大突破

166次阅读

共计 984 个字符，预计需要花费 3 分钟才能阅读完成。

AI 图像生成器 Midjourney 近日发布了其最新模型 V7，这是该平台相当长时间以来的首次重大更新。V7 不仅是一个从头开始的重构，还以 alpha 版本向用户开放，标志着 Midjourney 在图像生成技术上的又一次飞跃。

V7 的主要改进集中在两个方面：图像质量的提升和新工具的引入。在图像生成方面，V7 承诺在生成手、手指、身体部位以及各种物体时具有更高的连贯性和一致性。此外，V7 还提供了更加细致和真实的纹理与材质表现，例如皮肤皱纹或陶瓷壶的微妙细节。这些改进使得 AI 生成的图像在细节上更加逼真，尽管 Midjourney 并未声称其图像已无法被训练有素的眼睛识别，但用户将明显感受到图像质量的提升。

在功能方面，V7 引入了全新的“草稿模式”。Midjourney 在其官方博客、Discord 和 X 等平台上表示，草稿模式的成本仅为原来的一半，并且能以 10 倍的速度渲染图像。然而，草稿模式生成的图像质量较低，因此不适合用于最终成品。相反，它旨在作为一种快速迭代和探索的工具，帮助用户在切换到更高质量的模式之前找到理想的结果。

V7 提供了两种主要模式：turbo 和 relax。Turbo 模式能够快速生成最终图像，但在信用使用上是原来的两倍；而 relax 模式则花费更多时间，但成本仅为原来的一半。值得注意的是，V7 目前并未提供标准模式，Midjourney 表示标准模式将在稍后推出，因为它需要更多时间进行优化。

V7 是首个默认启用个性化功能的 Midjourney 模型。用户需要通过选择至少 200 张图像来训练模型，以构建其独特的审美档案。个性化功能通过数百次在两张图像之间进行选择，帮助模型理解用户认为“美丽”的标准，并据此定制生成结果。当然，用户也可以选择像之前的模型一样禁用个性化功能。

Midjourney 是最早广泛使用的 AI 图像生成工具之一，最初通过 Discord 进行操作，后来推出了更现代的 Web 界面。它在社交媒体上分享的 AI 艺术中占据了重要地位，并成为许多 AI 视频创作者工作流程的关键部分。然而，Midjourney 也因在受版权保护的作品上训练 AI 模型而卷入多起诉讼，成为关于合理使用辩论的焦点。

尽管面临争议，Midjourney 仍在不断探索新的发展方向。最近，该公司宣布计划在未来推出硬件产品，尽管具体细节尚未明确。无论如何，V7 的发布无疑为 AI 图像生成领域带来了新的活力和可能性。

正文完