谁说RX 7700 XT只是游戏卡?Microsoft Olive注入Stable Diffusion AI绘画性能测试
前言和配件介绍
AIGC(AI生成内容)在今年开始呈现爆发性增长,包括(ChatGPT)语言模型、(Stable Diffusion)绘画、(synthesia)数字人等众多领域都有涉及,其中最为知名的莫过于Stable Diffusion绘画,最为广泛使用的Stable diffusion WebUI则是来自开源大神的Automatic1111,不过此版本对于AMD驱动支持并不友好,其AI加速器并未能很好发挥。
就在前几个月,AMD和微软合作优化了Microsoft Olive路径,可把基本模型从PyTorch转换成ONNX,以便发挥最佳AMD GPU的AI性能,官方数据显示用了此工具可把RX 7900 XTX的每秒迭代速度从1.87it/s提高到18.59it/s,提升非常巨大,并且经过多个版本的AMD驱动迭代优化,相信A卡在Stable Diffusion中体验会更好,这篇文章就来一起体验一下吧。
测试显卡来自中高端定位的蓝宝石RX 7700 XT白金版,外观还是采用白金版代表性的红色元素进行点缀,大尺寸双飞翼轴流扇的设计,也使之尺寸达到了280mm长,属于精通2K分辨率的游戏显卡,它还具有108个AI加速器和12GB GDDR6大容量显存,用来跑Stable diffusion也是个不错的选择。
配合AI绘图测试的处理器是锐龙 7 7700X,搭配主板来自微星MAG B650M MORTAR WIFI迫击炮,外观方面采用纯黑+斜纹主题设计,看起来就非常硬核,实际上它确实也采用了12(80A)+2的强悍供电,应付锐龙9 7950X都是没有问题,它还加持两组M.2冰霜铠甲,拥有全覆盖VRM散热片,是一款全能型千元级主板。
配备电源来自微星MPG A1000G PCIE5金牌全模组,它采用单路12V供电、全日系105℃电容,并通过了80PLUS金牌认证,最大的卖点就是标配原生12VHPWR 16pin供电接口,可适配现阶段及未来所有的高性能显卡,并且电源提供了10年之长的质保,妥妥能用上2~3套配置。
平台介绍和性能测试
本次测试平台设置处理器锐龙7 7700X开启PBO技术,使用EXPO配置达成DDR5 6000C34 16GB*2双通道状态,并在BIOS中开启Resizable BAR技术提升一些显卡性能。本次测试安装的是AMD Adrenalin 23.11.1最新版本显卡驱动(强烈推荐),操作系统是Windows 11 22H2最新版本。
AMD GPU运行转换Microsoft Olive路径的Automatic1111 Stable Diffusion WebUI
关于Stable diffusion本地部署安装教程很多,甚至国内不少大神已经提供整合包使用,而对于AMD显卡来说,可以参考上述AMD官方这篇BLOG——针对Automatic1111原版WebUI通过Microsoft Olive优化的安装教程,基本软件是需要Git、Miniconda以及Python这些(显卡驱动需要Adrenalin版 23.7.2或更高版本),这里就不再详细介绍了,有兴趣可以去看看。
在部署过程中,一些模型基本都需要魔法才可下载,不然会出现网络错误的提示,也可以通过国内资源下载更方便一些。
正确部署完毕之后,打开http://127.0.0.1:7860页面就能看到WebUI的图形界面,安装好Microsoft Olive后在页面上看到ONNX和Olive的选项,在Olive里进入Optimiza ONNX model子选项点击下方优化按钮,就可以成功转换模型开始绘画了。
正向提示词:1girl,long hair,pink hair,game game cg,full body,best quality,masterpiece,realistic,8K wallpaper,beautiful and aesthetic,detailed background
反向提示词:nsfw,ugly,low quality,low res,bad bad proportions,EasyNegative,missing arms,extra legs,too many fingers,extra arms and legs,text,username
分辨率设置:512X512
迭代步进:20
提示词引导系数:7
生成批次、单批数量:1-1和1-3
生成过程中RX 7700 XT可以完全吃满GPU,12GB显存也基本用到尽了,游戏可达不到这种强度
RX 7700 XT的12GB显存一批次最多可以生成三张图,四张图就会出现报错,理论上相同情况下,24GB显存的RX 7900 XTX就应该可以一次生成六张图了,显存大才是王道。
来看看RX 7700 XT的生成速度吧,分为两种强度的测试,第一种就是一批次生成一张图,属于最常见的操作,而第二种就是一批次同时生成三张图。第一种情况下,使用Microsoft Olive优化后,可以比原版快足足7.5倍,4秒多就能出图。而一次生成三张图的情况,使用Microsoft Olive优化提升也不小,是原来的2.32倍,这效率其实还不错了,作为进阶AI绘图学习都可以。
最后汇总一下这两个月用RX 7700 XT跑多款游戏的帧数吧,在2K分辨率最高画质的3A游戏中它也能跑出流畅的帧率,并且可使用FSR 2和FSR 3技术获得更好的性能提升。
结语
从本次测试结果来看,由于有了Microsoft Olive转换工具的优化,像RX 7700 XT这样的中高端显卡,也可在Stable Diffusion中明显加快出图速度,相较原版生成时间缩短了2~7倍,AMD显卡总算也能在Stable Diffusion中大展拳脚,AIGC应用目前还处于初级爆发阶段,相信不久的将来AMD GPU对于AI加速的优化会越来越好。总得来说,目前RX 7700 XT可不止是一款能胜任2K分辨率的游戏显卡,比对标的RTX 4060 Ti要强不少,而且它的AI绘图效率其实也不错,很适合追求性价比的用户。
大妈我来了
校验提示文案
老周师傅
校验提示文案
3C真过瘾
校验提示文案
神秘消逝
校验提示文案
雄关之漫道
校验提示文案
五十包郵解君愁
校验提示文案
老周师傅
校验提示文案
五十包郵解君愁
校验提示文案
雄关之漫道
校验提示文案
神秘消逝
校验提示文案
3C真过瘾
校验提示文案
大妈我来了
校验提示文案