Stability AI推出最新文本到图像生成器Stable Diffusion 3 Medium

95次阅读
没有评论

共计 608 个字符,预计需要花费 2 分钟才能阅读完成。

Stability AI 凭借其开源的 Stable Diffusion 模型,在人工智能图像生成领域已成为关键参与者,这些模型在质量、定制化和速度方面树立了行业标杆。现在,该公司通过推出其迄今为止最先进的文本到图像生成器,进一步扩展了其模型系列。

周三,Stability AI 发布了 Stable Diffusion 3 Medium,该公司声称这是其“最复杂”的图像生成模型。这个拥有 20 亿参数的模型在其前代基础上进行了多项升级,从而实现了更高质量的生成。

例如,新模型能够克服图像生成器通常面临的困难任务,包括生成逼真的图像(甚至是手和面部)以及无瑕疵或拼写错误的准确文本。它还能遵循复杂的提示并理解空间关系,如下图中所示。

Stability AI 推出最新文本到图像生成器 Stable Diffusion 3 Medium
Stability AI 推出最新文本到图像生成器 Stable Diffusion 3 Medium

据该公司称,Stable Diffusion 3 Medium 是一个较小的模型,使其成为在个人计算系统和企业级 GPU 上运行的良好候选。Stability AI 还表示,由于该模型能够从少量数据集中收集“细微的细节”,因此它也非常适合定制。

Stable Diffusion 3 Medium 的权重保持开源,并通过 Hugging Face 向所有用户提供免费的非商业许可。对使用商业模型感兴趣的用户被鼓励联系 Stability AI 获取许可信息。

Stable Diffusion 3 Medium 可通过 Stability AI 的 API、Stable Assistant(公司的聊天机器人)以及通过 Stable Artisan 的 Discord 获得。

正文完
 0
admin-gah
版权声明:本文于2024-06-12转载自Zdnet,共计608字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码