Stable Diffusion XL搞偏门:AMD性价比神卡
故事的起源:
在这个充满科技奇迹的时代,恰逢我家的领导是一位朴素的做平面设计的同学,她每天都在和各种线条、色块和创意做斗争。没办法,都是为了生活,自从我介绍给她用Stable Diffusion后,并且把闲置的RTX3070+5900X搭成AI绘图专用Server给她用了之后,她就停不下来了,这样陆陆续续用了Stable Diffusion陪伴她工作了大半年,由于家里领导使用AI绘图后,经常会递交惊艳的作品,屡屡受到她上司的表扬,减负又加薪,自然的,她就更加一条路走到黑,再也离不开了。后面她不知从哪里听闻Stable Diffusion XL发布了,那就给她升级吧,Ubuntu 同步下最新代码,下载几个模型,升级倒是毫无难度,但无奈噩梦就此开始,由于SDXL是1024x1024的图训练的。所以,稍微开点插件,或者分辨率一大,3070 8G的显存就不够用,CUDA Out Of Memory。此类事情,领导天天啰嗦我,说要影响她创作了,手上别的没有更大显存的卡,我只有把华硕4090插过去给她临时用了几天。这一用,卡都不还给我了,于是申请再买一张卡用于搞AI,吃过3070的苦后,家里领导说她说就要显存大,要24G起步,说买我那个游戏卡也行,或者其他完全性能弱一丢丢能接受。由于众所周知的原因,当初为了买4090,谎报了5000元单价,领导还是记事的,果不其然,她转我5000,让给她重新买一张,我才能拿走我的4090。
悲剧!猝!
要知道5000元买全新的3090都要倒贴,而且矿卡横行,二手N卡不敢入手,生产力工具,要买就买全新的,就在我犯愁如何用这5000元买一张堪用的绘图卡的时候,转机出现了。一个偶然的机会,跟朋友提起这个事,他说也在玩SDXL,不过是AMD,专业AI卡,32GB显存,不俗的AI绘图性能,在某鱼全新不到5字头的价格,追问之下知道,此物就是AMD MI100,但此卡缺点也明显,他只能跑AI,因为无显示输出,游戏也是不太可能。但!这刚好符合我需求,无输出不重要,我只要能跑SDXL,毕竟是生产力工具。而且我本来就是跑Ubunu系统,问题不大,所以,所有的这些问题对我都不是问题。只要他性价比够高!
就这么干吧!
最终对比了几个卖家后,凭借三寸不烂之舌,以4.5K的价格,入手了一张全新的(有点惊讶到我,再怎么说此卡也是敢对标A100的神物,因为此卡是被动散热的,我又花了几十元补了个散热器。我擦,5000元居然还有剩),两天后卡和散热器都到了,纸壳内就是如此简陋的工包。金手指完美,确实没上过机,是全新货。但拆开后,惊艳了我,不愧是发行价4.8万的货。
AMD MI100 简陋工包艺术品一样!用料扎实,秒杀一众消费级显卡!这元器件布局,不夸张说,商业级的,就是强。用料真的不惜血本啊。发行时候,号称性能超越A100。
官网部分参数,充满期待:
查了一下发行价4.8万人民币,不到1/10的发行价入手,心里乐呵呵,迫不及待上散热器,参考了SMZDM的教程和百度的教程,驱动两下就安装好了,不得不说A卡在Ubuntu下的驱动安装比N卡还要顺畅。。然后很快就搭好了Ubuntu下基于ROCm下的SDXL环境,对于熟悉Linux的人应该也不算难,线上文章太多了,就不重复叙述,新手按照教程问题应该也不大,我这里装的是最新的ROCm 6.0+最新的SDXL。
rocm信息:rocm-smiOK,性能测试准备开始,Let’s Go!
对比平台,刚好3个卡:
丽台3070 8GB / 华硕4090 24GB / AMD MI100 32GB
其他部分硬件配置:
CPU: AMD 5900X
主板:微星 B550M Motar
内存:威刚 DDR4 3200128GB(32GB x 4)
系统盘:M.2 2T
电源:长城800W金牌
其他软件信息:
Ubuntu 版本:22.04.3
WebUI 版本:v1.8.0
Python 版本:3.11.5
torch:2.4.0dev 20240326
首先外观对比,3名选手登场,MI100竟然是个头最小的。
从上到下分别是4090,3070,MI100宽度对比,MI100依然是最苗条的
从上到下4090,MI100,3070准备SDXL的启动参数,几个卡启动参数有点小差别,
MI100的启动参数如下:
python3 launch.py --listen --port 7860 --opt-split-attention-invokeai --enable-insecure-extension-access --opt-split-attention
4090,增加xformers,此为N卡支持选项, --xformers
而3070,同样开启xformers,当然还有因为他只有8G显存,因此开启中等显存参数—medvram。
在浏览器输入IP:7860后,就可以开始对比测试了。
Stable Diffusion启动画面来了,来了,来了,颤抖的小手!
选用模型:realisticStockPhoto_v20.safetensors
从网上找了个prompt,开测:
A stunning, lifelike woman with high-definition features, wearing an elegant evening gown, in a sophisticated and alluring pose,4k epic
生成的图还是很不错的因为只看基础对比性能,清华采样器啥,加速绘图的优化暂时都没做,分别测试1024x1024,1536x1536,2048x2048这3种宽高,同时也没做超分。
1024x1024,迭代步数50,批次101536x1536,迭代步数50,批次4不管是MI100还是4090,生成过于大的宽高比例,容易出现两个头三只手等走样照片,这个应该是跟模型的原始素材尺寸有关,不过不重要,此处只看性能,为了避免吓人,加上人类最伟大的发明——克兄
2048x2048,迭代步数50,批次1交差,完美完成任务。
集中常见分辨率下的对比结论:
3070只有8G显存,动不动就Out of memory,实在无法胜任AI绘图,个人建议,SDXL建议16GB起步,最好24GB及以上。
4090仍然是最牛的存在,唯一缺点价格太贵,1.5W+,要弄走好多私房了,虽然MI100纸面数据不差4090太多,但最终SDXL的成绩MI100没有干过4090,差距不小,当然也在意料之中,一来因为AMD的ROCm还在持续优化,而从ROCm 5.7到6.0的提升来看,提升还是很大的。另外对于MI100,它有着更大的显存,能够更好的应对SD 3.0,可能都不是太大问题。况且4.5K价格摆在这里,还要啥自行车。对于只做AI绘图的生产力工具,确实是不错的选择。性能上,当前优化下,不知道能否对标3080-3090,估计还是有点机会,但具体由于我没有平台,没法测试。另外,AMD专用AI绘图平台STARK,可能有更好的表现,但是我懒,也就不测试了。
附上几张随意生成的美图:
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
破碎的冰
校验提示文案
lzhpro2
校验提示文案
njs261
校验提示文案
黑枪贼
校验提示文案
Jacky君
校验提示文案
特价抢
校验提示文案
系统提醒不能使用真名
校验提示文案
cleverxiao
校验提示文案
JOHN乔斯达
校验提示文案
半个天选打工人
校验提示文案
隔壁发发
校验提示文案
NicksonRedfield21
校验提示文案
tarzanzky
校验提示文案
不想努力的小鲜肉
校验提示文案
陸沁瓷
校验提示文案
hoyaryyj
校验提示文案
decree_z
校验提示文案
Wangdarma
校验提示文案
值友9369253200
校验提示文案
flying-v6
校验提示文案
需要四叶草
校验提示文案
Galaxy-Elite
校验提示文案
我就是那只猴子
校验提示文案
双子懒洋洋
校验提示文案
狂躁症患者
校验提示文案
值友4389318445
校验提示文案
值友4389318445
校验提示文案
值友5452133541
校验提示文案
风雨过后见彩虹
校验提示文案
纠了个结
校验提示文案
奇异硕士
校验提示文案
chenzd123
校验提示文案
值友5715504242
校验提示文案
火红的石榴
校验提示文案
fylsh
校验提示文案
股票大涨
校验提示文案
值友8876012760
校验提示文案
很黄鸭
校验提示文案
xbra
校验提示文案
那夜天太黑
校验提示文案