数码之家

 找回密码
 立即注册
搜索
查看: 506|回复: 0

[业界] 谷歌携手UC伯克利要终结扩散模型,新方法IGN可单步生成逼真图像

[复制链接]
发表于 2023-11-14 22:54:51 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
谷歌近日携手加州大学伯克利分校(UC Berkeley),研发出了可取代扩散模型(Diffusion Models)的全新生成式 AI 方法--幂等生成网络(IGN)。

                               
登录/注册后可看大图
包括生成对抗网络(GAN)、扩散模型(Diffusion Models)和今年 3 月 OpenAI 发布的一致性模型(Consistency Models)在内,当前主流生成式 AI 模型都是随机噪点、草图或者低分辨率或其他损坏的图像等输入,映射到与给定目标数据分布相对应的输出(通常是自然图像)来生成图像。

                               
登录/注册后可看大图
以扩散模型为例,在训练期间学习目标数据分布,然后通过多个步骤执行“去噪”处理。
谷歌研究团队提出了名为幂等生成网络(IGN)的全新生成模型,从任何形式的输入中生成合适的图像,理想情况下只需一步即可完成。
该模型可以想象为一种“全局投影仪”,将任何输入数据投射到目标数据分布上,和现有其它模型算法不同,不会限于特定的输入。
IGN 和 GAN、扩散模型主要有两点不同:
  • GAN 需要单独的生成器和鉴别器模型,而 IGN 是“自我对抗”的,可以同时扮演着两种角色。
  • 扩散模型需要执行增量步骤,而 IGN 可以单个步骤中将输入映射到数据分布上。
研究人员使用 MNIST 和 CelebA 数据集展示了 IGN 的潜力。该团队展示了一些应用,例如将草图转换为逼真的图像、从噪点生成图像或修复损坏的图像等。

                               
登录/注册后可看大图
IT之家在此附上论文详细地址,感兴趣的用户可以深入阅读。

                               
登录/注册后可看大图

                               
登录/注册后可看大图


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2024-4-27 15:25 , Processed in 0.156000 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2023 smzj.net

快速回复 返回顶部 返回列表