📁 计算机视觉与模式识别

DiffusionRL

Text-to-image扩散模型是一类深度生成模型,展现了出色的图像生成能力。然而,这些模型容易受到来自网页规模的文本-图像训练对的隐含偏见的影响,可能无法准确地对我们关心的图像方面进行建模。这可能导致次优样本、模型偏见以及与人类伦理和偏好不符的图像。本文介绍了一种有效可扩展的算法,利用强化学习(RL)改进扩散模型,涵盖了多样的奖励函数,如人类偏好、组成性和公平性,覆盖了数百万张图像。我们阐明了我们的方法如何大幅优于现有方法,使扩散模型与人类偏好保持一致。我们进一步阐明了如何这显著改进了预训练的稳定扩散(SD)模型,生成的样本被人类偏好80.3%,同时改善了生成样本的组成和多样性。

#图像生成
#深度学习
#强化学习
定价: 免费试用
DiffusionRL

产品详情

大规模强化学习用于扩散模型

主要功能

1
改进扩散模型
2
使用强化学习对扩散模型进行改进
3
涵盖多样的奖励函数

使用示例

通过DiffusionRL改进了文本到图像扩散模型,提高了图像生成的质量。

DiffusionRL应用于改进了稳定扩散模型,使生成的样本更符合人类偏好。

利用DiffusionRL的强化学习算法,改进了扩散模型的生成效果,提高了图像的多样性。

快速访问

访问官网 →

所属分类

📁 计算机视觉与模式识别
› AI模型
› AI图像生成