共计 984 个字符,预计需要花费 3 分钟才能阅读完成。
AI 图像生成器 Midjourney 近日发布了其最新模型 V7,这是该平台相当长时间以来的首次重大更新。V7 不仅是一个从头开始的重构,还以 alpha 版本向用户开放,标志着 Midjourney 在图像生成技术上的又一次飞跃。
V7 的主要改进集中在两个方面:图像质量的提升和新工具的引入。在图像生成方面,V7 承诺在生成手、手指、身体部位以及各种物体时具有更高的连贯性和一致性。此外,V7 还提供了更加细致和真实的纹理与材质表现,例如皮肤皱纹或陶瓷壶的微妙细节。这些改进使得 AI 生成的图像在细节上更加逼真,尽管 Midjourney 并未声称其图像已无法被训练有素的眼睛识别,但用户将明显感受到图像质量的提升。
在功能方面,V7 引入了全新的“草稿模式”。Midjourney 在其官方博客、Discord 和 X 等平台上表示,草稿模式的成本仅为原来的一半,并且能以 10 倍的速度渲染图像。然而,草稿模式生成的图像质量较低,因此不适合用于最终成品。相反,它旨在作为一种快速迭代和探索的工具,帮助用户在切换到更高质量的模式之前找到理想的结果。
V7 提供了两种主要模式:turbo 和 relax。Turbo 模式能够快速生成最终图像,但在信用使用上是原来的两倍;而 relax 模式则花费更多时间,但成本仅为原来的一半。值得注意的是,V7 目前并未提供标准模式,Midjourney 表示标准模式将在稍后推出,因为它需要更多时间进行优化。
V7 是首个默认启用个性化功能的 Midjourney 模型。用户需要通过选择至少 200 张图像来训练模型,以构建其独特的审美档案。个性化功能通过数百次在两张图像之间进行选择,帮助模型理解用户认为“美丽”的标准,并据此定制生成结果。当然,用户也可以选择像之前的模型一样禁用个性化功能。
Midjourney 是最早广泛使用的 AI 图像生成工具之一,最初通过 Discord 进行操作,后来推出了更现代的 Web 界面。它在社交媒体上分享的 AI 艺术中占据了重要地位,并成为许多 AI 视频创作者工作流程的关键部分。然而,Midjourney 也因在受版权保护的作品上训练 AI 模型而卷入多起诉讼,成为关于合理使用辩论的焦点。
尽管面临争议,Midjourney 仍在不断探索新的发展方向。最近,该公司宣布计划在未来推出硬件产品,尽管具体细节尚未明确。无论如何,V7 的发布无疑为 AI 图像生成领域带来了新的活力和可能性。