25年9月22日,联发科新旗舰天玑9500正式发布:再刷纪录的300亿晶体管、首发最新的C1系列CPU核心和G1-Ultra架构GPU、光线追踪和AI性能再次翻倍、首发大量GPU和AI的新特性。
天玑9500提前省流:发哥的CPU单核和GPU性能,依然维持30%以上的提升;AI和光追性能,还在倍增级提升。
CPU单核性能暴涨32%,峰值性能下的单核功耗降低55%;
CPU多核性能提升17%,峰值性能下的多核功耗降低37%;
GPU性能提升33%,同性能下功耗下降42%;
AI性能提升111%,同性能下功耗下降56%;
光追性能提升119%,已经可以支持120fps的高帧率光追游戏。
PS:发哥旗舰的发布时间越来越早了——天玑9300是23年11月7日发布,天玑9400是24年10月9日,天玑9500是25年9月22日。
PSS:自2020年三季度以来,发哥已经连续19个季度的市场第一,发哥在旗舰中的占比已经超过40%。
最新的台积电第三代3nm工艺(N3E → N3P。和苹果A19/A19 Pro同代);
再刷纪录的300亿晶体管↑(天玑9400是291亿,苹果M4是280亿,估计得明年的天玑9600才有可能打破这纪录了);
首发最新的Arm架构“全家桶”,Arm V9.3,全核心支持SME2:
1颗4.21GHz的C1-Ultra超大核,2MB的L2缓存(L1缓存提升1倍)
+3颗3.5GHz的C1-Premium性能核,1MB的L2缓存
+4颗2.7GHz的C1-Pro能效核,512KB的L2缓存
16MB的L3缓存(比前代大33%)+10MB的SLC系统缓存。
首发G1-Ultra GPU,搭载全新的动态缓存Dynamic Cache架构(能显著降低功耗并提升性能);
支持10667Mbps的LPDDR5X内存(理论带宽85GB/s);
首发支持4通道UFS 4.1闪存(连续读取性能提升100%,大模型载入速度提升40%);
NPU 990改成超性能+超能效双NPU架构(后者有NPU里,首个CIM存算一体架构);
Imagiq 1190大幅提升追焦/对焦和防抖计算性能,首发4K60帧电影人像渲染引擎+天玑RAW域处理引擎。
最近两代旗舰SoC↑
CPU这边的关键词,就是全套首发架构+SME2矩阵运算指令集。
天玑9500沿用之前的1颗超大核+3颗性能核+4颗能效核的核心比例,3个CPU架构全部都是首发,且全部支持最新的SME2矩阵运算指令集。
Arm表示SME2矩阵运算指令集能在AI上带来5倍的性能提升,3倍的能效提升,10bit AV1视频解码性能可以提升22%,同时功耗降低12%。而发哥的说法是↑,在视觉、语音、翻译等AI任务,可以有20%性能提升,物体侦测运算性能提升57%,运行编解码模型功耗下降50%。
【C1-Ultra】↑是安卓阵营最强的超大核,它是X925的迭代,单线程提升25%,IPC比骁龙8E强20%,和X925峰值性能相同时,功耗降低28%。
【C1-Premium】用于代替原来的X4,官方宣称游戏性能提升16%,而且芯片面积比Ultra小35%。
【C1-Pro】是A725的迭代,从能效曲线上看,就知道它可能是今年能效进步最大的核心。
而联发科这边落地之后,因为有架构优化,数据比Arm官方还猛:单核性能暴涨32%,多核性能提升17%。
其实比起峰值性能,这一代最惊艳的是能效提升:天玑9500在和天玑9400相同性能时,功耗降低37%。
也就说,在前代多核9000分附近的成绩,天玑9500有接近4成的功耗下降。日用使用中,需要8核全开的应用开启或短时间重载中,可以更长时间地维持高性能输出。
发哥也公布了其他关于低功耗区间的数据:例如在王者+通话场景的功耗可降低30%、吃鸡+通话功耗下降16%、短视频功耗降低13%、4K 120fps录像的功耗也降低了22%等等等。
GPU这边的关键词,是和苹果殊途同归的动态缓存Dynamic Cache+翻倍的光追单元。
发哥表示3年前就开始研究GPU的Dynamic Cache动态缓存。后者可以根据实际寄存器的压力,动态调整线程数量,减少寄存器的浪费,给整个GPU的运行效率带来巨幅提升(以前的GPU很难一直保持满载,经常“被迫摸鱼”。但有Dynamic Cache之后,GPU就能长时间维持输出)。
发哥表示,天玑9500的G1-Ultra GPU可以直接读取10MB的SLC系统缓存。单单这个改进,能在绝区零中,就能省下600MB/s的内存带宽,立竿见影地降低功耗和机身温度(降低60mA的电流,温度降1度)。
而传统的光栅性能方面,在3DMark Steel Nomad Light测试中,发哥表示天玑9500的GPU性能提升33%,同性能下,功耗降低42%。
因为光线追踪单元翻倍,天玑9500直接在3DMark Solar Bay Extreme光追测试能跑出2773分(前代是1173),光追性能提升119%。而且天玑9500将首发暗区突围光追120fps模式(天玑9400是90fps)。
反映到实际游戏:极致画质120fps的王者,功耗下降19%;60fps全高画质的原神,功耗下降9%。
联发科的工程机↑ 已经是老朋友了,从天玑9000开始就是这套模具。它和量产机的散热条件,有亿点不同。它只有基础的均热板,电池容量很小。
今年的配置是天玑9500,搭配16GB 10667Mbps的LPDDR5X内存+1TB UFS 4.0闪存,以及6.78英寸2800x1260的1.5K AMOLED屏幕。
实测,天玑9500的GeekBench 6.4单核3610分,多核10837分。
天玑9500工程机的单核性能提升27.5%,多核性能提升19.5%。
天玑9500的C1-Ultra超大核,CPU单核性能堪称大跃进:在频率提升16.3%的情况下,单核性能提升27.5%。同频分数和苹果A19 Pro/A18 Pro非常接近,已经超过了A19/A18。
PS:GeekBench 6的单核测试中,很多测试都是短于1秒的。但A18/天玑9400/骁龙8至尊版之后的现代CPU,单核功耗都是6W起步。A19系列量产机在常温下,貌似出现了机身散热压不住单核功耗的情况。
PSS:GeekBench 6和逻辑和GeekBench 5不一样,它的多核测试其实是核越多,越不利,利好苹果这种少核心策略。
PSSS:GeekBench在6.3之后引入对SVE/SME支持,后两者在AI、图形等密集计算场景,会有明显的加速作用。
天玑9500的GFX与3DMark测试成绩↑
GPU测试这边,这次改成了以3DMark为主,GFXBench为辅:
GFXBench用的是老一点的API,会更贴近传统手游的渲染管线。
而3DMark在24年6月加入的Steel Nomad Light测试,特性更新,会更贴近现代3A游戏的渲染管线,适合用来看新的旗舰GPU(它对移动设备的要求很高,强制要求8GB内存,导致A16跑不了这个该测试)。
光追这边,3DMark在25年6月更新的3DMark Solar Bay Extreme测试,加入了大量光追的反射、透明、软阴影、漫反射,光追占比超过50%,宣称压力是Solar Bay的5倍(后者的光追占比只有10%到15%),是现在最适合测光追性能的单一测试。
天玑9500工程机在GFXBench Aztec 1440P Vulkan离屏测试是154帧。
在3DMark Steel Nomad Light场景,是3380分(作为对比,极客湾“强能冷条件”下的A19 Pro和A19,分别是3004和2598)。
这两项偏向传统光栅性能的测试中,天玑9500实际提升分别是26%和36%。
实在是太可怕了,天玑9400本身就是上一代的GPU冠军,结果这一代还有30%级别的提升,是“学霸比你还努力”的恐惧感……
而更可怕的是Solar Bay Extreme光追测试,天玑9500工程机跑出了2601分的成绩,比前代高了221%(这么大的代际差异,在历史上也是非常少见的)。
作为对比,极客湾“强能冷条件”下的A19 Pro和A19,分别是2407和2115分(比A18系列提升50%左右)。光追单元堆这么猛,波真是下血本了。
室温22度,屏幕亮度200尼特。
先看“轻轻松松”的王者荣耀,极致画质120fps模式,主要看功耗。
天玑9500工程机,平均119.9帧,1% Low帧 118.14fps,重点是功耗竟然只有2.73W。功耗之低,甚至都不能叫热身。
然后我们直接去972P+画质拉爆的《崩坏:星穹铁道》黄金的时刻↑↓。
天玑9500工程机平均58帧,平均功耗6.5W。可以说是基本征服崩铁,幸福来得太突然了。
作为对比,骁龙8至尊领先版的荣耀GT Pro(975P),在同样路线上,即便打开“幻影稳帧”(把不足60fps的画面插帧到60fps),平均帧率也只有55.5帧,平均功耗7.3W。
游戏方面,发哥除了提升绝对性能,还有一批游戏相关的优化:
提高了触控和高刷的一致性,宣称延迟可以压缩到42ms±6ms(iPhone 16 Pro是109ms±20ms);
内存压缩(提升APP启动速度);
天玑调度2.0(120fps吃鸡功耗下降14%);
动画的预测运行(将由Find X9首发落地)。
另外,天玑9500还引入了很多真·PC级的特性:
切换成原生PC光追管线(提升效率,光影明显更强);
首发支持虚幻引擎5.5 Nanite(支持的三角形数量提升超过10倍。PS:现在原神是30万到80万个三角形,现在可以千万级的三角形。安卓终于有希望在画质上摆脱“低PC一等”的局面);
首发支持虚幻引擎5.6 MegaLights(支持的多点光源数量,从几十个,提升到200个以上。PS:其实以前的机器也能跑百级多光源,但会巨卡)。
AI这边的关键词,是新增超能效核+存算一体+大量首发的AI特性。
天玑9500的NPU 990,改成了超性能+超能效双NPU架构。宣称AI性能提升111%,同性能下功耗下降56%(*在千问2.5-3B-CL=4096测试中)。
之前传言天玑9500的NPU算力达到100TOPS,在看到天玑9500工程机的苏黎世测试(ETHZ AI Benchmark v6.0.3)超过1.5万分之后,我信了……
天玑9400工程机在苏黎世测试是6700分,天玑9300工程机是3410分。前代是翻倍,天玑9500这代翻倍都不止(提升了1.24倍)。
天玑9500毫无悬念地登顶苏黎世AI Benchmark榜单↑。
NPU 990的超能效核,首发CIM存算一体(Compute In Memory),自带Cache,可以省去频繁读取内存的功耗,单这部分就能省24%功耗,最多可以降低42%。
这颗超能效核,宣称已经可以像低功耗前摄那样,做到All Ways On的全天候常驻——让AI模型可以常驻,且机身不发烫。
端侧的AI翻译↑(没眼花,这就是原速)
端侧的AI摘要↑(每秒100多Token)
天玑9500工程机的AI性能强得很夸张,在跑本地AI翻译和AI摘要的时候,竟然可以1秒100多Token,一走神,它都跑完了。
这暴涨的AI性能+暴降的NPU功耗,可以明显提升全时语音转文字、翻译、相机对焦/追焦/录像的功耗表现,也是业界梦寐以求的主动式AI的前置条件。
就算不想那么远,发哥表示,天玑9500的追焦性能从以前的5、6fps提升6倍,能做到和视频帧率同步的30fps。中译中就是,如果拍摄30fps视频,等于每一帧都能完成追焦,运动摄影爱好者都听哭了。
首个手机端的4K文生图↑
另外, NPU 990还有很多首发特性:
生成式引擎2.0,有Transformer固化电路(响应速度快2倍以上)+内存压缩升级(4B模型的内存占用从2GB降到1.6GB);
首发端侧BitNet,1.58bit推理框架。速度提升2倍,内存占用减少60%;
Diffusion Transformer性能翻倍,手机端首发4K文生图;
文生文模型性能翻倍,支持的录音长文本从32K提升到128K;
首发LLM大语言模型,端侧LoRA训练;
端到端的模型训练优化(vivo X300会做首个个人化的AI美颜模型,本地训练的内存占用降低80%,占用低于2GB。PS:训练模型的内存需求,是推理的2倍以上)。
(1) vivo X300系列除了AI定制美颜还会有录音转录提升、异构加速;
(2) OPPO Find X9系列则主要做流畅多任务、读屏AI意图等。
发哥同时还表示,已经用AI做信号做频谱补偿、WiFi自动频宽和速率选择(宣称传输速率提升20%)、AI定位(搜星速度提升20%)、AI选网/抢网(在拥塞场景的选基站,宣称流畅度提升50%)等。
ISP方面,关键词也是降功耗。这是天玑9500将首发4K 60fps的电影人像视频的核心原因(强如苹果,iPhone今年依然是4K 30fps的电影模式)。
发哥表示,同样是4K 60fps的SoC功耗,如果天玑9200是100%的话,天玑9300是89%,天玑9400是77%,天玑9500是69%(每年11%到13%的功耗下降,几年下来降低了31%)。
Imagiq 1190 ISP内化了vivo V3+影像芯片,核心包括:
内置4K 60帧电影级人像渲染引擎(景深光斑+肤质打光+调色风格);
内置RAW域处理引擎(降低存取频宽),用好2亿像素传感器(之后vivo X300的主摄、X300 Pro都是2亿像素传感器);
追焦抓拍提升。支持30fps的追焦,追焦引擎提升5倍+对焦引擎提升3倍:33ms追焦(友商150ms)+3ms对焦(友商100ms);
支持4K 120fps杜比视界的双轨防抖(以前做不了的核心原因,还是因为功耗太高了)。
这部分的实测表现,得等vivo X300系列和OPPO Find X9系列的量产机来揭晓了。
我们本以为,在“如超新星爆发”的天玑9300之后就不会再有30%级别的提升,结果天玑9400和天玑9500都在猛涨,让我们像极了踏空的股民。
天玑9500这一代,CPU单核实测有27.5%的提升,CPU多核有接近20%的提升;本就是最强的GPU竟然还有26%和36%的提升;AI性能涨了124%,光追测试更是暴涨221%。
这一代的悬念,还是实际功耗。峰值性能是用来争门面的,暴降的功耗才是用来过日子的。
比起峰值性能,同性能下的功耗降幅,才是最值得关注的数值(就像天玑9400,它在日常功耗区间的性能,就已经超过火力全力的前代,过程中节省的电量和降低的发热,才是最影响日常使用的)。
而发哥给的数据是:同性能下,CPU功耗降低37%,GPU功耗降低42%,AI功耗降低56%。这才是我们看好天玑9500的核心原因。
和同代的苹果A19 Pro对比,天玑9500的CPU多核性能小胜,GPU依然和苹果拉开了一代的差距。
虽然高通的成绩还没出来,但估计发哥又又又会是GPU卫冕冠军。下一次破纪录,估计得等明年的天玑9600了。
关注我们的微博@爱搞机
关注我们的微信公众号:爱搞机(playphone)
当然,也关注我们的哔哩哔哩账号:爱搞机