【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路
创始人
2025-01-10 09:03:42
0

文章目录

    • 图片生成Framework 需要3个组件:
      • 相关论文【Stable Diffusion,DALL-E,Imagen】
    • 具体介绍三个组件
      • 1. Text encoder介绍【结论:文字的encoder重要,Diffusion的模型不是很重要!】
        • 评估指标:FID计算
        • CLIP Score 计算
      • 3. Decoder介绍【不需要成对的训练资料】
      • 2. Diffusion Model介绍【训练一个noise predicter】
        • noise 加在 latent representation上


from: https://www.youtube.com/watch?v=JbfcAaBT66U&list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-&index=5

简介:

84,841次观看 2023年3月25日 【機器學習 2023】(生成式 AI)
感謝黃敬峰先生提供字幕

Stable Diffusion
https://arxiv.org/abs/2112.10752

DALL-E series
https://arxiv.org/abs/2204.06125
https://arxiv.org/abs/2102.12092

Imagen
https://arxiv.org/abs/2205.11487


图片生成Framework 需要3个组件:

  1. Text Encoder
  2. Generation Model
  3. Decoder

在这里插入图片描述

相关论文【Stable Diffusion,DALL-E,Imagen】

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

具体介绍三个组件

在这里插入图片描述

1. Text encoder介绍【结论:文字的encoder重要,Diffusion的模型不是很重要!】

在这里插入图片描述

评估指标:FID计算

在这里插入图片描述

CLIP Score 计算

在这里插入图片描述

3. Decoder介绍【不需要成对的训练资料】

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2. Diffusion Model介绍【训练一个noise predicter】

在这里插入图片描述

noise 加在 latent representation上

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

相关内容

热门资讯

透视科技!德普之星辅助器app... 透视科技!德普之星辅助器app,川娱竞技插件,详细教程(有挂揭秘);德普之星辅助器辅助器中分为三种模...
1分钟辅助!阿拉游戏免费辅助器... 1分钟辅助!阿拉游戏免费辅助器(辅助挂)原本有挂(详细辅助2025新版教程);致您一封信;亲爱阿拉游...
科技介绍“友间辅助器十三道窍门... 科技介绍“友间辅助器十三道窍门”hhpoker免费辅助器(确实有挂)准备好在友间辅助器十三道窍门 i...
第十分钟辅助(微乐家乡自建房辅... 第十分钟辅助(微乐家乡自建房辅助app)切实存在有挂(详细辅助技巧教程)1、微乐家乡自建房辅助app...
透视辅助!h5大厅反杀,越乡游... 透视辅助!h5大厅反杀,越乡游辅助工具,攻略教程(有挂透视);科技安装教程;136704302。相信...
透视辅助!fishpoker透... 透视辅助!fishpoker透视,杭州都莱辅助软件有没有用,可靠教程(有挂脚本);1、杭州都莱辅助软...
第5分钟辅助!美猴王大厅怎么修... 第5分钟辅助!美猴王大厅怎么修改数据(辅助挂)原先有挂(详细辅助2025教程)是一款可以让一直输的玩...
六分钟了解“决战十水三余音”w... 六分钟了解“决战十水三余音”wepokerplus脚本(确实是真的有挂)准备好在决战十水三余音 ia...
透视ai!牵手跑得软件,战皇大... 透视ai!牵手跑得软件,战皇大厅辅助排行,扑克教程(有挂软件)是一款可以让一直输的玩家,快速成为一个...
6分钟辅助(胡乐辅助脚本)其实... 6分钟辅助(胡乐辅助脚本)其实存在有挂(详细辅助技巧教程);1)胡乐辅助脚本辅助挂:进一步探索胡乐辅...