NVIDIA AI生态与生产力应用
自从2022年底首次发布,ChatGPT以及它所代表的GPT和AIGC生态可以说是彻底改变了人们的计算方式。而随着NVIDIA AI与TensorRT等技术栈的发布,诸多先进的生成式AI技术能够在用户的电脑上使用GeForce RTX家族的游戏显卡展开部署,并以比传统CUDA计算更高效的方式进行计算。
例如,在Stable Diffusion中,我们可以使用TensorRT显著加速SDXL大模型图像生成。我们使用官方提供的TensorRT拓展包训练了基于TensorRT的SDXL加速引擎,并使用1024x1024尺寸、采样50步、CFG SCALE 7的配置生成10批单张图片进行性能测试。
可以看到,与不启用TensorRT的耗时166.6秒的传统CUDA计算相比,启用TensorRT之后我们的大模型图片生成能力显著提升,时间来到了86.8秒,提升幅度接近50%。毫无疑问,考虑到我们给到的参数,这样的时间差十分震撼。同时,随着用户生成的图片数量/参数提升,相信使用TensorRT拓展包能够为用户节约更多的时间和算力资源。而当我们考虑到RTX 4070 Ti SUPER显卡拥有的16GB高带宽GDDR6X显存,这张显卡相当适合专业级别的AIGC内容创作者在丰富的NVIDIA AI生态中的各式应用中进行内容创作,使用TensorRT生态链扩展创意工作流。
除了Stable Diffusion之外,还有很多应用也能够使用NVIDIA AI加速。例如,On1 Resize AI 2023就是一款有效使用了NVIDIA AI技术栈的图像无损放大工具。
我们使用这一工具对几张图片进行了尺寸放大,可以看到,在AI技术加持下,画面的细节得到了良好的保留,且镜头的炫光、聚焦等效果也得到了良好的保留,整体画面观感也让人难以联想到传统印象中的“AI生成”,表现十分出色。
而在速度方面,每张受测图片的生成时间都在十秒以内,最慢的也只有七秒半左右,表现可以说是难以匹敌了。
而在不依赖AI算力的传统GPGPU应用中,影驰GeForce RTX 4070 Ti SUPER OC显卡也拥有颇为强劲的能力。例如,在3D建模与CGI软件Blender中,我们使用官方benchmark针对4.0.0版本下的三个版本进行了测试。在三个不同的Benchmark中都得到了相当可观的采样数表现,十分适合内容创作者。
而在更传统的工业应用测试SPECviewperf 2020中,我们也得到了相当不错的性能表现,证明这颗GPU应对传统工业级工作站负载也同样能够轻松应对,十分出色。
总结
回顾我们进行的全部测试,在3Dmark的测试中,影驰GeForce RTX 4070 Ti SUPER 大将OC对比上一代的RTX 3070 Ti着50%以上的纯光栅+光追性能提升,而在引入DLSS 3这一神器之后提升幅度更是进一步提升到接近翻倍。作为一张定位入门级4K的游戏显卡,即便是在赛博朋克2077、心灵杀手2这样的开启了路径光追的顶级画质3A游戏中,影驰GeForce RTX 4070 Ti SUPER 大将OC也能够在4K分辨率、画质拉满的情况下获得稳定的游戏体验,更不用说目前还不支持路径光追技术的的各类电竞游戏与3A大作了。同时,在如Stable Diffusion这样的生成式AI应用中,我们也能够在开启TensorRT时体验耗时砍半的显著提升,相信用户们也能够用这张显卡在如NVIDIA RTX Remix这样的AI加速创意应用中体验创作的乐趣。
总而言之,这张全新的影驰GeForce RTX 4070 Ti SUPER OC显卡的性能表现相当可观,考虑到4K高分辨率显示器的普及、全景光追等新技术带来的对显存的更高要求,还有NVIDIA AI生态中各类AIGC创意工具链爆发式的增长,这张显卡搭载的16GB高速显存将同样为游戏的体验以及提升生产力水平带来更大的性能空间。所以无论是体验4K分辨率下的3A大作还是在想AI加速的生产力应用中尽情创作的玩家,这张影驰GeForce RTX 4070 Ti SUPER 大将OC都十分适合选购。并且影驰官方还支持三年个人送保,在售后方面也能保证每一位玩家长期用卡体验。
我们拥有决定自己言行的力量,因此会犯错。我们拥有决定自己言行的力量,因 此能从错误中重新站起来。
作为一款武侠游戏,《江湖路》现阶段搭建起来了一个颇具规模的游戏demo。