所在位置: 首页 > 资讯攻略 > 新闻资讯

ROCm加持,RX 7900 XT 本地AI出图效率暴增!

发布时间:2024-04-12 11:49:38作者:小编酱

今年可以被视为AIGC应用的爆发之年,尤其是使用稳定扩散进行局部标绘,这几乎已经成为玩家必备的AI应用。AMD采用RDNA3架构的RX7000系列显卡不仅拥有出色的AI计算能力,而且RX7900系列还配备了巨大的内存,特别适合AI绘图。当然,大多数玩家可能还是会在Windows系统下驱动RX7000显卡以DirectML模式打印。事实上,如果使用AMD ROCm模式,则RX7000显卡在稳定扩散效率中的打印将得到大幅提升。在这里,我们将通过备受玩家追捧的大内存和高性价比绘图武器RX7900 XT在实战中体验ROCm的强大功能。

AMD ROCm是什么?

一般来说,AMD ROCM(镭龙开放计算平台)是一个开放的软件堆栈,其中包含各种编程模型、工具、编译器、库和运行时,用于为AMD GPU开发AI和HPC解决方案。AMD ROCm软件为各种AI工作负载提供优化解决方案,适用于大规模语言模型(LLM)、图像/视频检测和识别、生命科学和药物研发、自动驾驶、机器人等领域,并支持包括开放框架、模型和工具在内的更广泛的AI软件生态系统。简单来说,ROCm是AMD支持镭龙GPU计算的软件平台。使用镭龙GPU时,编程模型为HIP或OpenCL,运行环境为ROCm。既然是AMD自己专门为镭龙GPU打造的软件平台,ROCm的效率自然要高于通用的DirectML,所以使用RX7000显卡画图的朋友,强烈建议使用ROCm模式。ROCm For Windows早在去年就已推出,支持的设备类型也在不断增加(从上图可以看出,RX6800及以上版本完全支持HIP SDK和运行时),但如果玩家想要最成熟的体验,他们可以在基于Linux的系统下使用ROCm。

RDNA3架构加上20GB大内存,RX7900 XT特别适合AIGC。

作为RX7000系列的第二款旗舰产品,RX7900 XT定位于高端甜点,具有出色的性价比,尤其是在AIGC。RX7900 XT采用RDNA3架构,总面积与上一代RX6950 XT相同,但晶体管是上一代的2.15倍以上,因此能效表现较上一代RDNA2大幅提升。此外,与上一代相比,RDNA3架构增加了AI加速器单元,无限缓存也升级到了第二代。等效显存带宽是RX6950 XT的1.67倍,也带来了更强大的数据吞吐量。

RX7900 XT被称为AI利器。一方面,它拥有强大的计算能力,单精度峰值性能高达52 TFLOPS,半精度峰值性能高达103 TFLOPS,分别是RX6950 XT的2.2倍和2.18倍。计算能力直接决定了AI的计算速度,而在这方面RX。另一方面,它具有320位位宽的GDDR6内存和高达20 GB的容量,这意味着高分辨率绘图更适合人工智能绘图。

此外,在目前的高端显卡市场上,16GB内存的RTX 4080的价格接近8000元,然后是天价的RTX 4090,这基本上与性价比无关。相比之下,20GB超大内存的RX7900 XT只需要5000元,ROCm可以让剧情效率大幅提升,特别适合追求高效剧情的玩家。

接下来,我们来看看RX7900 XT在ROCm加持下和稳定扩散下的绘图表现。

实际测试:RX7900 XT+ROCm,绘图效率起飞。

测试平台

处理器:AMD锐龙9 7900X

内存:Kingston Fury DDR5 6000 16GB×2

主板:华硕TUF游戏B650M-PLUS WIFI重炮手

显卡:AMD镭龙RX7900 XT

硬盘:WD_BLACK SN850X 2TB

电源:ROG雷神1200W

操作系统:Ubuntu 22.04.3 LTS版

开启稳定扩散后,我们将迭代步数设置为20,欧拉a采样,512×512分辨率,CFG设置为7,模型选择麦菊美学人物模型V1.0制作文艺人物。根据测试,RX7900 XT的完成时间为13.4秒,比之前在Windows 11系统+DirectML模式下相同参数设置下的22秒快了63%。

让我们进一步增加计算压力,一次生成10张图片。此时,RX7900 XT也完全输出,完成时间为26.9秒,比Windows 11下DirectML模式下的47秒快了75%。可以看出,图片越多,ROCm相对于DirectML的优势就越明显。

为了进一步提高人脸的绘制效果,我们在绘制时检查细节修复,并选择修复模型为mediapipe_face_full。此时完成五张图片的时间为20.3秒,比Windows 11的DirectML模式快了近10%,图片效果更好,面部也没有bug。

由此可见,在ROCm的加持下,7900 XT在稳定扩散中的出图确实有了很大的提升,7900 XT的超高出图速度也让我们感到惊喜。值得一提的是,实际上已经安装了ROCm版本的Windows,并且它提供了对RX7000的完整支持,因此Windows平台的RX7000用户也可以享受该功能。综上所述,如果你想选择一款拥有20GB超大内存的本地AI绘图武器,那么RX7900 XT确实是一款值得优先选择的特殊产品。

摘要:AIGC是一个强大的工具,内存大,效率高。RX7900 XT的性价比无与伦比。

从前面的分析中,我们可以看到RX7900 XT不仅具有强大的计算能力,而且具有20GB的超大显存,超过了RTX 4080的16GB。显然,更大的显存也更有利于提高AI画图和效率的分辨率。此外,RX7900 XT的价格在更大内存的情况下仅为RTX 4080的61%左右,在性价比方面完全完胜,可以说在高端AIGC显卡中没有对手。根据稳定扩散ROCm版本的实测,RX7900 XT效率的出图远超DirectML模式。因此,RX7900 XT可以说是对专业AIGC应用要求较高的用户非常合适的选择。

至于AIGC的实际安装,我们可以从我们列出的两款旗舰配置中看到,AMD平台采用了锐龙9 7950X和RX7900 XT的组合,而英特尔平台则是酷睿i9 14900K和RTX 4080的组合。从总价可以看出,AMD的配置具有5350元的价格优势,同时,它具有额外的4GB显存。它不仅可以在AIGC应用程序中发挥强大的作用,而且在其他生产力应用程序中也具有一流的性能,这是一个全面且经济高效的解决方案。另一方面,英特尔平台总价高出36%,性价比明显落后,内存更小,在AI出图或其他生产力应用中难免受到更多限制。

总之,如果您需要经常面对专业的AIGC应用程序,尤其是非常重视大内存,并且还希望享受极致的性价比,那么RX7900 XT确实是一个值得优先考虑的解决方案,在ROCm的支持下,您甚至可以在AI计算方面获得巨大的提升效率。

收藏

相关资讯

相关游戏

更多 >
  • 热门资讯
  • 最新资讯
  • 下载排行榜
  • 热门排行榜