Stability AI推出最新文本到图像生成器Stable Diffusion 3 Medium

209次阅读

共计 608 个字符，预计需要花费 2 分钟才能阅读完成。

Stability AI 凭借其开源的 Stable Diffusion 模型，在人工智能图像生成领域已成为关键参与者，这些模型在质量、定制化和速度方面树立了行业标杆。现在，该公司通过推出其迄今为止最先进的文本到图像生成器，进一步扩展了其模型系列。

周三，Stability AI 发布了 Stable Diffusion 3 Medium，该公司声称这是其“最复杂”的图像生成模型。这个拥有 20 亿参数的模型在其前代基础上进行了多项升级，从而实现了更高质量的生成。

例如，新模型能够克服图像生成器通常面临的困难任务，包括生成逼真的图像（甚至是手和面部）以及无瑕疵或拼写错误的准确文本。它还能遵循复杂的提示并理解空间关系，如下图中所示。

Stability AI 推出最新文本到图像生成器 Stable Diffusion 3 Medium

据该公司称，Stable Diffusion 3 Medium 是一个较小的模型，使其成为在个人计算系统和企业级 GPU 上运行的良好候选。Stability AI 还表示，由于该模型能够从少量数据集中收集“细微的细节”，因此它也非常适合定制。

Stable Diffusion 3 Medium 的权重保持开源，并通过 Hugging Face 向所有用户提供免费的非商业许可。对使用商业模型感兴趣的用户被鼓励联系 Stability AI 获取许可信息。

Stable Diffusion 3 Medium 可通过 Stability AI 的 API、Stable Assistant（公司的聊天机器人）以及通过 Stable Artisan 的 Discord 获得。

正文完

发表至： AI行业动态

2024-06-12 23:22

0

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

微软宣布关闭消费者版Copilot的GPT Builder工具

谷歌Project Genie引发行业震动，Unity股价暴跌24%