Stable Diffusion XL搞偏门:AMD性价比神卡

2024-04-01 00:15:11 154点赞 576收藏 134评论

故事的起源:

在这个充满科技奇迹的时代,恰逢我家的领导是一位朴素的做平面设计的同学,她每天都在和各种线条、色块和创意做斗争。没办法,都是为了生活,自从我介绍给她用Stable Diffusion后,并且把闲置的RTX3070+5900X搭成AI绘图专用Server给她用了之后,她就停不下来了,这样陆陆续续用了Stable Diffusion陪伴她工作了大半年,由于家里领导使用AI绘图后,经常会递交惊艳的作品,屡屡受到她上司的表扬,减负又加薪,自然的,她就更加一条路走到黑,再也离不开了。后面她不知从哪里听闻Stable Diffusion XL发布了,那就给她升级吧,Ubuntu 同步下最新代码,下载几个模型,升级倒是毫无难度,但无奈噩梦就此开始,由于SDXL是1024x1024的图训练的。所以,稍微开点插件,或者分辨率一大,3070 8G的显存就不够用,CUDA Out Of Memory。此类事情,领导天天啰嗦我,说要影响她创作了,手上别的没有更大显存的卡,我只有把华硕4090插过去给她临时用了几天。这一用,卡都不还给我了,于是申请再买一张卡用于搞AI,吃过3070的苦后,家里领导说她说就要显存大,要24G起步,说买我那个游戏卡也行,或者其他完全性能弱一丢丢能接受。由于众所周知的原因,当初为了买4090,谎报了5000元单价,领导还是记事的,果不其然,她转我5000,让给她重新买一张,我才能拿走我的4090。

悲剧!猝!

要知道5000元买全新的3090都要倒贴,而且矿卡横行,二手N卡不敢入手,生产力工具,要买就买全新的,就在我犯愁如何用这5000元买一张堪用的绘图卡的时候,转机出现了。一个偶然的机会,跟朋友提起这个事,他说也在玩SDXL,不过是AMD,专业AI卡,32GB显存,不俗的AI绘图性能,在某鱼全新不到5字头的价格,追问之下知道,此物就是AMD MI100,但此卡缺点也明显,他只能跑AI,因为无显示输出,游戏也是不太可能。但!这刚好符合我需求,无输出不重要,我只要能跑SDXL,毕竟是生产力工具。而且我本来就是跑Ubunu系统,问题不大,所以,所有的这些问题对我都不是问题。只要他性价比够高!

就这么干吧!

最终对比了几个卖家后,凭借三寸不烂之舌,以4.5K的价格,入手了一张全新的(有点惊讶到我,再怎么说此卡也是敢对标A100的神物,因为此卡是被动散热的,我又花了几十元补了个散热器。我擦,5000元居然还有剩),两天后卡和散热器都到了,纸壳内就是如此简陋的工包。金手指完美,确实没上过机,是全新货。但拆开后,惊艳了我,不愧是发行价4.8万的货。

AMD MI100 简陋工包AMD MI100 简陋工包艺术品一样!艺术品一样!用料扎实,秒杀一众消费级显卡!用料扎实,秒杀一众消费级显卡!

这元器件布局,不夸张说,商业级的,就是强。用料真的不惜血本啊。发行时候,号称性能超越A100。

官网部分参数,充满期待:

Stable Diffusion XL搞偏门:AMD性价比神卡

查了一下发行价4.8万人民币,不到1/10的发行价入手,心里乐呵呵,迫不及待上散热器,参考了SMZDM的教程和百度的教程,驱动两下就安装好了,不得不说A卡在Ubuntu下的驱动安装比N卡还要顺畅。。然后很快就搭好了Ubuntu下基于ROCm下的SDXL环境,对于熟悉Linux的人应该也不算难,线上文章太多了,就不重复叙述,新手按照教程问题应该也不大,我这里装的是最新的ROCm 6.0+最新的SDXL。

rocm信息:rocm-smirocm信息:rocm-smi

OK,性能测试准备开始,Let’s Go!

对比平台,刚好3个卡:

丽台3070 8GB / 华硕4090 24GB / AMD MI100 32GB

其他部分硬件配置:

CPU: AMD 5900X

主板:微星 B550M Motar

内存:威刚 DDR4 3200128GB(32GB x 4)

系统盘:M.2 2T

电源:长城800W金牌

其他软件信息:

Ubuntu 版本:22.04.3

WebUI 版本:v1.8.0

Python 版本:3.11.5  

torch:2.4.0dev 20240326

首先外观对比,3名选手登场,MI100竟然是个头最小的。

从上到下分别是4090,3070,MI100从上到下分别是4090,3070,MI100

宽度对比,MI100依然是最苗条的

从上到下4090,MI100,3070从上到下4090,MI100,3070

准备SDXL的启动参数,几个卡启动参数有点小差别,

MI100的启动参数如下:

python3 launch.py --listen --port 7860 --opt-split-attention-invokeai --enable-insecure-extension-access --opt-split-attention

4090,增加xformers,此为N卡支持选项, --xformers

而3070,同样开启xformers,当然还有因为他只有8G显存,因此开启中等显存参数—medvram。

在浏览器输入IP:7860后,就可以开始对比测试了。

Stable Diffusion启动画面Stable Diffusion启动画面

来了,来了,来了,颤抖的小手!

选用模型:realisticStockPhoto_v20.safetensors

从网上找了个prompt,开测:

A stunning, lifelike woman with high-definition features, wearing an elegant evening gown, in a sophisticated and alluring pose,4k epic

生成的图还是很不错的生成的图还是很不错的

因为只看基础对比性能,清华采样器啥,加速绘图的优化暂时都没做,分别测试1024x1024,1536x1536,2048x2048这3种宽高,同时也没做超分。

1024x1024,迭代步数50,批次101024x1024,迭代步数50,批次101536x1536,迭代步数50,批次41536x1536,迭代步数50,批次4

不管是MI100还是4090,生成过于大的宽高比例,容易出现两个头三只手等走样照片,这个应该是跟模型的原始素材尺寸有关,不过不重要,此处只看性能,为了避免吓人,加上人类最伟大的发明——克兄

2048x2048,迭代步数50,批次12048x2048,迭代步数50,批次1

交差,完美完成任务。

集中常见分辨率下的对比集中常见分辨率下的对比

结论:

3070只有8G显存,动不动就Out of memory,实在无法胜任AI绘图,个人建议,SDXL建议16GB起步,最好24GB及以上。

4090仍然是最牛的存在,唯一缺点价格太贵,1.5W+,要弄走好多私房了,虽然MI100纸面数据不差4090太多,但最终SDXL的成绩MI100没有干过4090,差距不小,当然也在意料之中,一来因为AMD的ROCm还在持续优化,而从ROCm 5.7到6.0的提升来看,提升还是很大的。另外对于MI100,它有着更大的显存,能够更好的应对SD 3.0,可能都不是太大问题。况且4.5K价格摆在这里,还要啥自行车。对于只做AI绘图的生产力工具,确实是不错的选择。性能上,当前优化下,不知道能否对标3080-3090,估计还是有点机会,但具体由于我没有平台,没法测试。另外,AMD专用AI绘图平台STARK,可能有更好的表现,但是我懒,也就不测试了。

附上几张随意生成的美图:

Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

展开 收起

文章很值,打赏犒劳作者一下

打赏
4人已打赏
134评论

  • 精彩
  • 最新
  • 为啥不用N卡的计算卡,也是大显存无输出的,走核显即可,主要是跑图快啊,N卡外的都不太行

    校验提示文案

    提交
  • 我有一张Radeon VII看来也能凑合玩

    校验提示文案

    提交
  • 没玩ai前各种心慌,玩了以后,算了,老老实实钓鱼吧 [汗] [汗] [汗]

    校验提示文案

    提交
  • 不知道5090海淘会不会破2w

    校验提示文案

    提交
    必须的,又涨价了

    校验提示文案

    提交
    收起所有回复
  • 我矿渣 rx580 能体验吗

    校验提示文案

    提交
  • 我还是学学工作流吧,没钱啊

    校验提示文案

    提交
  • 我要封面图出处

    校验提示文案

    提交
  • 求题图电影名

    校验提示文案

    提交
  • 封面图是怎么不往下掉的?

    校验提示文案

    提交
  • 这么高端的卡,显示的还都是大颗粒呀!!!

    校验提示文案

    提交
  • 我是进来看封面的 [尴尬]

    校验提示文案

    提交
  • 这可能用在云桌面吗

    校验提示文案

    提交
  • 单双精度算力都是v100的1.5倍,貌似不能对标a100吧

    校验提示文案

    提交
  • 开局一张图

    校验提示文案

    提交
  • 我是被头图拉进来的,感觉进错了门儿

    校验提示文案

    提交
  • 2080ti交火,最有性价比

    校验提示文案

    提交
  • 可以用来训练吗

    校验提示文案

    提交
  • 你的泰坦尼克怎么只有3根烟囱 [惊喜]

    校验提示文案

    提交
  • 今天敢打码,明天就要打值友了 [撞墙]

    校验提示文案

    提交
  • 我孩子大学整体叫嚷6GB显存的gtx1060不够用,要买3870 12GB的。这些AI真的那么吃显存吗?

    校验提示文案

    提交
提示信息

取消
确认
评论举报

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
576
扫一下,分享更方便,购买更轻松

举报成功

该举报信息「小小值」会优先核实并处理哦!