随着英特尔酷睿Ultra 200V和锐龙AI 300系列新平台的发布,AI PC正式迎来了第二代产品。虽然受限于新平台发布初期的产品上市速度不够快,而导致新产品相对较少,但是我们也尽可能为大家找到了市面上能够找到的主流产品进行了测试,力求为大家呈现新老两代AI PC在基础性能层面的差异。
本次因为是聚焦于AI PC的测试,所以很多不相关的常规测试项目被剔除,而是加入了AI理论和应用性能的测试。
在评测正式开启之前,我们不妨再来熟悉一下英特尔Lunar Lake和AMD Strix Point两大新平台的基本架构特性,这也是为了让大家了解新老两代AI PC硬件平台究竟有何底层设计上的差异?
·Lunar Lake架构特性简介
首先是Lunar Lake。
相对于上一代Metoer Lake而言,它将较为复杂的分离式模块化架构设计做了进一步整合。由此前的计算模块、图形模块、SoC模块、IO模块整合为计算模块和平台控制模块,另外还包含一个没有实际功能的填充模块。同时它还在整个芯片上集成了LPDDR5x内存颗粒,最高支持双通道32GB容量,这也意味着Lunar Lake平台笔记本产品将不会设计单独的主板内存插槽。
其架构设计目标总体力求实现四个方向的突破:
其一,拥有突破性的x86处理器能效表现;
其二,更加出色的核心性能表现;
其三,更为优异的GPU图形性能表现;
其四,更加优秀的AI计算能力。
为了实现这四个设计目标,首先,Lunar Lake在每瓦性能的提升上着实是下了很大功夫,这使得新平台总体功耗下降了50%。同时增强和集成了新的电源管理方案,通过全新的供电架构带来了更好的电源控制,提升了电源利用率。而且内存改用芯片封装之后,PHY功耗降低了40%,再加上改进后的能效核集群,Lunar Lake在功耗方面实现了多项关键创新。这部分我们也将通过理论和实际续航测试予以展现。
其次,Lunar Lake放弃了超线程设计,并将优化重点放在了Lion Cove性能核,以及Skymont能效核上。在关闭超线程之后,Lunar Lake性能功耗比提升15%,性能面积比提升10%,性能功耗面积比提升30%。同时,Lunar Lake采用了低延迟结构设计,能效核延迟大约在23ns左右,性能核间延迟大约在26ns左右,能效核到性能核间延迟大约为55ns,内存延迟控制在了90ns附近,相比Meteor Lake降低了40%!此外,其能效核代际间IPC提升幅度达到68%,性能核IPC提升14%,每线程性能相比前代提升3倍。
其三,Lunar Lake引入了全新Xe2架构GPU,相比Meteor Lake而言,图形性能提升1.5倍,并且提供了更大的光追单元。其图形性能提升主要源于Xe核心最高增加到了8个,图形性能直接强化。
其四,AI性能的提升来源于两个层面,一方面是GPU AI算力提升,这源于Xe矩阵扩展引擎规格的升级。其全新的矢量引擎支持4096OPS/clock和2048OPS/clock的INT8和FP16计算,并且改进了固定功能单元,提高了吞吐量,从而优化了AI计算效率。其总体AI算力达到了67TOPS,并且拥有8MB L2缓存。另一方面是NPU算力升级,NPU4架构带来了48TOPS的峰值AI算力,相比上一代10TOPS的算力提升4.8倍。
·Strix Point架构特性简介
再来看Strix Point。
今年6月份的台北电脑展上,AMD也发布了新一代移动级处理器平台,即AMD锐龙AI 300系列处理器。全新的锐龙AI 300系列的CPU、NPU以及GPU同样是全方位升级:
首先,基于XDNA 2架构打造的全新NPU,其算力提升到了最高55TOPS,而现役的8040系列算力仅为16TOPS,同时在能效表现上更加出色。
其次,基于Zen 5架构设计的CPU核心数量最高达到了12核24线程,多线程性能进一步提升。
其三,基于RDNA 3.5架构打造的iGPU,其计算单元提升到16个,图形性能进一步增强。同时RDNA3.5架构打造的新一代iGPU则带来了出色的每瓦性能表现,时钟频率的增加、33%的计算单元增加带来了实打实的图形性能升级,在应对渲染、AI计算、浮点计算时能够提供更加出色的性能体验。
此外,锐龙AI 300系列针对AI方面的一项重要升级是支持Block FP16混合数据类型。我们都知道,不同数据类型在性能以及数据准确性方面的表现也不同。传统层面来看,8-bit INT8数据类型的特点是性能强但准确性低,而16-bit FP16数据类型的特点是准确性高但性能弱。Block FP16则兼顾8-bit数据的性能与16-bit数据的准确性。目前,AMD已经与超过150家AI赋能的ISV合作伙伴达成深度合作来支持此数据类型,因此能够为AMD锐龙AI 300系列提供兼容性更好、性能体验更好的各类型AI应用。
·参评机型配置信息一览
两大新平台基本信息了解之后,我们来看看本次参评机型的基本配置信息,具体如下:
目前酷睿Ultra 200V和锐龙AI 300系列机型比较少,上市的处理器型号也有限,暂时无法在本次评测文章中全部呈现,不过后续我们会通过天梯图的形式,逐步将上市机型的测试数据录入其中,以供大家参考。
本次测试除了上一代的英特尔酷睿Ultra 9、Ultra 7、Ultra 5机型,以及AMD锐龙8040机型之外,还包含了新的酷睿Ultra 7 258V和锐龙AI 9 HX 370的测试数据。下面来看看新老两代AI PC在基础性能和AI性能方面的表现。
·CPU单核/多核性能评估
首先我们还是依照惯例先看看两大阵营新老硬件平台的CPU核心性能,这部分测试主要参考CINEBENCH R23和2024的测试结果。
单核性能方面,英特尔酷睿Ultra 7 258V表现非常出色,联想YOGA Air 15 Aura AI元启版搭载的英特尔酷睿Ultra 7 258V在CINEBENCH R23单核性能上跑出了1948分的成绩,而AMD锐龙AI 9 HX 370略低一些,单核性能为1941分。华硕灵耀14 Air+这款相对小尺寸的轻薄本上搭载的酷睿Ultra 7 258V也跑出了1933分的成绩,比上一代顶级的酷睿Ultra 9 185H都要高出不少,更是全面优于上一代的锐龙8040系列处理器。
CINBENCH 2024单核性能同样也是酷睿Ultra 7 258V霸榜前两名,酷睿Ultra 9 185H作为上代旗舰,在小新Pro 16的调校下性能表现也很不错,而锐龙AI 9 HX 370的表现其实也是相当可以了。
多核性能方面,酷睿Ultra 200V系列因为主打能效,因此取消了超线程技术的同时,又缩减了核心数量,所以这方面的表现确实不如核心多、线程多的上一代酷睿Ultra处理器以及AMD锐龙平台。CINEBENCH R23多核方面,上一代酷睿Ultra 9 185H独占鳌头,得分高达20055,锐龙AI 9 HX 370位居第二,得分17457,另外酷睿Ultra 7 155H的多核性能要优于锐龙8040系列的同级别处理器。
CINEBENCH 2024的测试结果基本相仿,酷睿Ultra 9 185H独一档,多核得分1119,位居第二的是Redmi Book Pro 14 2024搭载的酷睿Ultra 7 155H处理器,多核得分1042分。这里要着重提一下Redmi Book Pro 14 2024这款产品。在上一代AI PC产品中,它是一匹实力不俗的黑马级产品,性能调校不输联想、华硕这样的传统PC品牌,而且性价比非常不错,其性能调校方面说实话是颇为让人有些意外的。另外锐龙AI 9 HX 370位居第三,多核得分978,相比上一代锐龙8040系列提升也是相当大的。
在CPU性能方面,英特尔酷睿Ultra平台相对锐龙平台依旧有着一定的优势,单核性能新老平台都要略微优于锐龙平台,但多核性能的比拼上,酷睿Ultra 200V跑分上不及锐龙AI 300系列。这主要是因为酷睿Ultra 200V系列的设计逻辑和产品定位与上一代Meteor Lake有很大不同,新平台更加聚焦于能效比和长续航特性,契合轻薄型笔记本电脑的特性。因此基于新老两代平台打造的AI PC,以不同定位和聚焦点满足了不同用户的差异化需求。
·GPU图形&游戏性能评估
新老两代AI PC在集成显卡的性能上也是差异极大,老一代的酷睿Ultra和锐龙8040系列分别搭载锐炫Xe和Radeon 780M iGPU,新一代的酷睿Ultra 200V和锐龙AI 9 HX 370则分别搭载了锐炫140V和Radeon 890M iGPU,二者在架构方面的差异前面我们已经为大家解读过了,下面来看看实际的性能表现。
英特尔与AMD的核显具体到不同的处理器是有一些规格上的差异的,执行单元数量的不同、频率的不同、OEM产品各自调校的差异都会影响最终跑分,这里我们直接给出机器型号以及对应的核显型号,跑分成绩为3DMark Time Spy+Fire Strike两种模式的综合显卡分数,具体如下:
从测试不难看出,英特尔酷睿Ultra新老两代产品的锐炫核显性能总体强于AMD锐龙新老平台,无论是Time Spy DX12和Fire Strike DX11图形性能,锐炫Xe和锐炫140V都比各自同代的Radeon 780M和Radeon 890M强上不少,这也是英特尔在推出锐炫核显之后得以为轻薄本带来更好游戏体验的基础。
当然,3DMark理论测试分数往往不能作为唯一参考标准,毕竟不同游戏的实际表现与3DMark理论成绩是有出入的。在实际游戏测试中,我们选择了《古墓丽影:暗影》和《荒野大镖客2》两款。
《古墓丽影:暗影》的测试是在1080p分辨率、DX12、高画质下进行的,酷睿Ultra 7 258V和酷睿Ultra 9 185H平台的表现最好,平均帧为48fps,接下来是锐龙7 8845H和锐龙AI 9 HX 370平台,平均帧分别为46fps和45fps。
《荒野大镖客2》测试环境是1080p分辨率、低画质,锐龙AI 9 HX 370和锐龙7 8845HS两款机型的表现最好,平均帧数分别为56.86fps、53.2fps和52.7fps。酷睿Ultra 7 258V与上一代酷睿Ultra 7 155H、酷睿Ultra 9 185H的表现相差不大,基本都在50fps附近。
从测试可以看到,英特尔锐炫Xe和锐炫140V核显在3DMark理论性能方面要优于Radeon 780M和Radeon 890M iGPU,不过在实际游戏中的表现其实是互有胜负。毕竟游戏体验与驱动版本、游戏自身优化相挂钩,所以只做参考即可。
·内存延迟测试
在笔记本内存进入DDR5时代之后,内存延迟越来越高。虽然对于普通应用没啥太大影响,用户也很难感知到,但是对于游戏、AI等内存敏感型应用来说,内存延迟就显得比较重要了。降低内存延迟一方面要靠处理器底层架构设计来解决,另一方面其实也与OEM产品自身的设计有关。
英特尔酷睿Ultra 200V平台是着力去进行了降低内存延迟的设计,而且效果也不错。通过AIDA 64内存延迟测试可以看到,酷睿Ultra 7 258V两款机型的延迟分别降到了94.5ns和95.1ns。不过上一代锐龙8040表现比较好的平台可以控制在比较低的水平,但新的锐龙AI 9 HX 370内存延迟还是比较高的,达到了131.7ns。
·AI理论与应用性能评估
对于AI PC而言,最重要的自然是AI性能了。目前其实AI性能测试的标准还不够完整,只有UL Procyon是较早涉足AI Benchmark测试的软件,另外还有Geekbench也加入了AI测试,不过因为后者加入的时间比较晚,很多老机型没有具体分数,所以这次评测只放酷睿出近期测试的英特尔酷睿Ultra 7 258V和AMD锐龙AI 9 HX 370处理器的相关跑分,大家做一个参考即可。
从测试结果来看,酷睿Ultra 7 258V的单精度算力评分低于锐龙AI 9 HX 370,但是半精度和量化性能都要高于锐龙AI 9 HX 370,二者整体性能基本持平。
无论是英特尔还是AMD,其硬件平台的CPU、GPU、NPU三大计算核心其实都支持AI计算,但是相对来说CPU的AI算力比较弱,所以我们没有放入相关测试成绩。
NPU的测试目前锐龙平台还不支持,所以先来看看酷睿Ultra两代产品在NPU算力上的进化。参考UL Procyon NPU Float16测试,酷睿Ultra 7 258V得分在960以上,相比上一代平均260分左右的成绩提升了3.7倍。
GPU的AI性能是目前能够被客观衡量的,而且在很多AI应用中,其实GPU才是主力硬件。参考UL Procyon GPU Float16测试,酷睿Ultra 7 258V搭载的锐炫140V核显的AI算力达到了870分以上,是上一代的近2倍,是锐龙平台的约2.7倍。另外锐炫核显的AI性能普遍优于锐龙的Radeon核显。
接下来看看实际应用方面的表现。
目前的测试方法中,AI应用性能很难有标准化的测试方法,毕竟大模型的种类、数量、是否针对特定加速器有优化等情况是相当复杂的,所以我们人为设定了Stable Diffusion默认的anything v5模型,这个模型基本不支持任何硬件平台的加速,这样可以抛开加速器的干扰。文生图与图生图设定也尽量剔除人为干预,文生图使用默认的512×512,单张,迭代20步的设定,采样器为默认。
总之一句话,只人为设定测试平台,不人为干预测试环境和具体选项,总体结果如下:
因为是以秒为单位,所以条形柱越短性能体验越好。可以看到酷睿Ultra 9 185H的表现非常优秀,文生图+图生图总时间为159秒,接下来是酷睿Ultra 7 258V,总时间为192秒左右,AMD锐龙AI 300和锐龙8040平台的耗时都要更长一些,相对快一些的锐龙AI 9 HX 370平台也达到了261秒。所以在非独显环境的文生图、图生图应用上,英特尔平台是有比较明显的优势的。
当然如果在实际应用中选择对应平台的加速器和优化过的大模型,整体效率会显著提升,一般512×512单张图生成时间不会超过10秒。
·PCMark 10办公续航能力评估
AI PC因为大都是轻薄本,所以其在实际应用中也往往扮演着商务办公本的角色。以往x86 Windows平台的最大短板就是续航,被MacBook或高通骁龙这些ARM平台笔记本吊打,但现在,得益于英特尔酷睿Ultra 200V平台,x86 Windows本也有非常不错的续航能力了。
PCMark 10办公续航测试中,50%屏幕亮度、60Hz刷新率、30%音量、Wi-Fi/蓝牙开启状态下,酷睿Ultra 7 258V平台的两款机型续航时间都达到22小时以上。而老平台续航表现最好的是Redmi Book Pro 14 2024,成绩为902分钟。其实锐龙AI 9 HX 370相对锐龙8040系列,在续航方面也有显著提升,达到了800分钟,也就是13.3小时。
此外需要说明的是,PCMark 10理论续航测试与实际使用时间差异是比较大的,酷睿Ultra 7 258V平台实际办公应用续航大概在11小时以上,B站4K视频连续播放时间大概在6小时左右。相应的上一代酷睿Ultra平台和锐龙AI 300、锐龙8040平台,实际续航能力也都有不同程度的缩水,毕竟影响续航能力的因素太多,谁都无法给出确切表现,只能作为参考数据。
·评测总结
对于当下的AI PC市场而言,即便酷睿Ultra 200V和锐龙AI 300系列新平台上市,其实上一代的酷睿Ultra和锐龙8040平台产品依旧会延续一定的生命周期。从测试来看,我们可以得出以下几个结论:
其一,英特尔酷睿Ultra 200V在单核性能、AI性能、图形性能、续航表现方面非常出色,但是多核性能是其短板。
其二,AMD锐龙AI 300系列处理器在多核性能、实际游戏性能、能效比方面的表现不错,但是AI性能、续航能力相对偏弱一些。
其三,上一代的酷睿Ultra平台里,Ultra 9 185H可以说是当之无愧的旗舰级核心,即便放在新一代产品里也依然能打。而锐龙8040系列则更加均衡,锐龙7 8845H和8845HS平台依旧是目前主打高性价比产品的首选平台,这对于预算不多的朋友来说非常适合。
本文属于原创文章,如若转载,请注明来源:A/I阵营谁更强?10款新老AI PC性能对决https://nb.zol.com.cn/909/9096564.html