联发科天玑9500测试与分析：再刷纪录的300亿晶体管+GPU卫冕冠军

25年9月22日，联发科新旗舰天玑9500正式发布：再刷纪录的300亿晶体管、首发最新的C1系列CPU核心和G1-Ultra架构GPU、光线追踪和AI性能再次翻倍、首发大量GPU和AI的新特性。

天玑9500提前省流：发哥的CPU单核和GPU性能，依然维持30%以上的提升；AI和光追性能，还在倍增级提升。

CPU单核性能暴涨32%，峰值性能下的单核功耗降低55%；
CPU多核性能提升17%，峰值性能下的多核功耗降低37%；
GPU性能提升33%，同性能下功耗下降42%；
AI性能提升111%，同性能下功耗下降56%；
光追性能提升119%，已经可以支持120fps的高帧率光追游戏。

PS：发哥旗舰的发布时间越来越早了——天玑9300是23年11月7日发布，天玑9400是24年10月9日，天玑9500是25年9月22日。

PSS：自2020年三季度以来，发哥已经连续19个季度的市场第一，发哥在旗舰中的占比已经超过40%。

【简要规格】

最新的台积电第三代3nm工艺（N3E → N3P。和苹果A19/A19 Pro同代）；

再刷纪录的300亿晶体管↑（天玑9400是291亿，苹果M4是280亿，估计得明年的天玑9600才有可能打破这纪录了）；

首发最新的Arm架构“全家桶”，Arm V9.3，全核心支持SME2：

1颗4.21GHz的C1-Ultra超大核，2MB的L2缓存（L1缓存提升1倍）
+3颗3.5GHz的C1-Premium性能核，1MB的L2缓存
+4颗2.7GHz的C1-Pro能效核，512KB的L2缓存

16MB的L3缓存（比前代大33%）+10MB的SLC系统缓存。

首发G1-Ultra GPU，搭载全新的动态缓存Dynamic Cache架构（能显著降低功耗并提升性能）；

支持10667Mbps的LPDDR5X内存（理论带宽85GB/s）；

首发支持4通道UFS 4.1闪存（连续读取性能提升100%，大模型载入速度提升40%）；

NPU 990改成超性能+超能效双NPU架构（后者有NPU里，首个CIM存算一体架构）；

Imagiq 1190大幅提升追焦/对焦和防抖计算性能，首发4K60帧电影人像渲染引擎+天玑RAW域处理引擎。

全套首发的新架构：暴降的峰值功耗

最近两代旗舰SoC↑

CPU这边的关键词，就是全套首发架构+SME2矩阵运算指令集。

天玑9500沿用之前的1颗超大核+3颗性能核+4颗能效核的核心比例，3个CPU架构全部都是首发，且全部支持最新的SME2矩阵运算指令集。

Arm表示SME2矩阵运算指令集能在AI上带来5倍的性能提升，3倍的能效提升，10bit AV1视频解码性能可以提升22%，同时功耗降低12%。而发哥的说法是↑，在视觉、语音、翻译等AI任务，可以有20%性能提升，物体侦测运算性能提升57%，运行编解码模型功耗下降50%。

【C1-Ultra】↑是安卓阵营最强的超大核，它是X925的迭代，单线程提升25%，IPC比骁龙8E强20%，和X925峰值性能相同时，功耗降低28%。
【C1-Premium】用于代替原来的X4，官方宣称游戏性能提升16%，而且芯片面积比Ultra小35%。
【C1-Pro】是A725的迭代，从能效曲线上看，就知道它可能是今年能效进步最大的核心。

而联发科这边落地之后，因为有架构优化，数据比Arm官方还猛：单核性能暴涨32%，多核性能提升17%。

其实比起峰值性能，这一代最惊艳的是能效提升：天玑9500在和天玑9400相同性能时，功耗降低37%。

也就说，在前代多核9000分附近的成绩，天玑9500有接近4成的功耗下降。日用使用中，需要8核全开的应用开启或短时间重载中，可以更长时间地维持高性能输出。

发哥也公布了其他关于低功耗区间的数据：例如在王者+通话场景的功耗可降低30%、吃鸡+通话功耗下降16%、短视频功耗降低13%、4K 120fps录像的功耗也降低了22%等等等。

GPU这边的关键词，是和苹果殊途同归的动态缓存Dynamic Cache+翻倍的光追单元。

发哥表示3年前就开始研究GPU的Dynamic Cache动态缓存。后者可以根据实际寄存器的压力，动态调整线程数量，减少寄存器的浪费，给整个GPU的运行效率带来巨幅提升（以前的GPU很难一直保持满载，经常“被迫摸鱼”。但有Dynamic Cache之后，GPU就能长时间维持输出）。

发哥表示，天玑9500的G1-Ultra GPU可以直接读取10MB的SLC系统缓存。单单这个改进，能在绝区零中，就能省下600MB/s的内存带宽，立竿见影地降低功耗和机身温度（降低60mA的电流，温度降1度）。

而传统的光栅性能方面，在3DMark Steel Nomad Light测试中，发哥表示天玑9500的GPU性能提升33%，同性能下，功耗降低42%。

因为光线追踪单元翻倍，天玑9500直接在3DMark Solar Bay Extreme光追测试能跑出2773分（前代是1173），光追性能提升119%。而且天玑9500将首发暗区突围光追120fps模式（天玑9400是90fps）。

反映到实际游戏：极致画质120fps的王者，功耗下降19%；60fps全高画质的原神，功耗下降9%。

性能实测：

大跃进的单核性能+外星科技GPU

联发科的工程机↑ 已经是老朋友了，从天玑9000开始就是这套模具。它和量产机的散热条件，有亿点不同。它只有基础的均热板，电池容量很小。

今年的配置是天玑9500，搭配16GB 10667Mbps的LPDDR5X内存+1TB UFS 4.0闪存，以及6.78英寸2800x1260的1.5K AMOLED屏幕。

实测，天玑9500的GeekBench 6.4单核3610分，多核10837分。

天玑9500工程机的单核性能提升27.5%，多核性能提升19.5%。

天玑9500的C1-Ultra超大核，CPU单核性能堪称大跃进：在频率提升16.3%的情况下，单核性能提升27.5%。同频分数和苹果A19 Pro/A18 Pro非常接近，已经超过了A19/A18。

PS：GeekBench 6的单核测试中，很多测试都是短于1秒的。但A18/天玑9400/骁龙8至尊版之后的现代CPU，单核功耗都是6W起步。A19系列量产机在常温下，貌似出现了机身散热压不住单核功耗的情况。
PSS：GeekBench 6和逻辑和GeekBench 5不一样，它的多核测试其实是核越多，越不利，利好苹果这种少核心策略。
PSSS：GeekBench在6.3之后引入对SVE/SME支持，后两者在AI、图形等密集计算场景，会有明显的加速作用。

天玑9500的GFX与3DMark测试成绩↑

GPU测试这边，这次改成了以3DMark为主，GFXBench为辅：

GFXBench用的是老一点的API，会更贴近传统手游的渲染管线。
而3DMark在24年6月加入的Steel Nomad Light测试，特性更新，会更贴近现代3A游戏的渲染管线，适合用来看新的旗舰GPU（它对移动设备的要求很高，强制要求8GB内存，导致A16跑不了这个该测试）。
光追这边，3DMark在25年6月更新的3DMark Solar Bay Extreme测试，加入了大量光追的反射、透明、软阴影、漫反射，光追占比超过50%，宣称压力是Solar Bay的5倍（后者的光追占比只有10%到15%），是现在最适合测光追性能的单一测试。

天玑9500工程机在GFXBench Aztec 1440P Vulkan离屏测试是154帧。

在3DMark Steel Nomad Light场景，是3380分（作为对比，极客湾“强能冷条件”下的A19 Pro和A19，分别是3004和2598）。

这两项偏向传统光栅性能的测试中，天玑9500实际提升分别是26%和36%。

实在是太可怕了，天玑9400本身就是上一代的GPU冠军，结果这一代还有30%级别的提升，是“学霸比你还努力”的恐惧感……

而更可怕的是Solar Bay Extreme光追测试，天玑9500工程机跑出了2601分的成绩，比前代高了221%（这么大的代际差异，在历史上也是非常少见的）。

作为对比，极客湾“强能冷条件”下的A19 Pro和A19，分别是2407和2115分（比A18系列提升50%左右）。光追单元堆这么猛，波真是下血本了。

游戏实测：基本征服崩铁！

室温22度，屏幕亮度200尼特。

先看“轻轻松松”的王者荣耀，极致画质120fps模式，主要看功耗。

天玑9500工程机，平均119.9帧，1% Low帧 118.14fps，重点是功耗竟然只有2.73W。功耗之低，甚至都不能叫热身。

然后我们直接去972P+画质拉爆的《崩坏：星穹铁道》黄金的时刻↑↓。

天玑9500工程机平均58帧，平均功耗6.5W。可以说是基本征服崩铁，幸福来得太突然了。

作为对比，骁龙8至尊领先版的荣耀GT Pro（975P），在同样路线上，即便打开“幻影稳帧”（把不足60fps的画面插帧到60fps），平均帧率也只有55.5帧，平均功耗7.3W。

游戏方面，发哥除了提升绝对性能，还有一批游戏相关的优化：

提高了触控和高刷的一致性，宣称延迟可以压缩到42ms±6ms（iPhone 16 Pro是109ms±20ms）；
内存压缩（提升APP启动速度）；
天玑调度2.0（120fps吃鸡功耗下降14%）；
动画的预测运行（将由Find X9首发落地）。

另外，天玑9500还引入了很多真·PC级的特性：

切换成原生PC光追管线（提升效率，光影明显更强）；
首发支持虚幻引擎5.5 Nanite（支持的三角形数量提升超过10倍。PS：现在原神是30万到80万个三角形，现在可以千万级的三角形。安卓终于有希望在画质上摆脱“低PC一等”的局面）；
首发支持虚幻引擎5.6 MegaLights（支持的多点光源数量，从几十个，提升到200个以上。PS：其实以前的机器也能跑百级多光源，但会巨卡）。

性能继续倍增的AI与ISP

AI这边的关键词，是新增超能效核+存算一体+大量首发的AI特性。

天玑9500的NPU 990，改成了超性能+超能效双NPU架构。宣称AI性能提升111%，同性能下功耗下降56%（*在千问2.5-3B-CL=4096测试中）。

之前传言天玑9500的NPU算力达到100TOPS，在看到天玑9500工程机的苏黎世测试（ETHZ AI Benchmark v6.0.3）超过1.5万分之后，我信了……

天玑9400工程机在苏黎世测试是6700分，天玑9300工程机是3410分。前代是翻倍，天玑9500这代翻倍都不止（提升了1.24倍）。

天玑9500毫无悬念地登顶苏黎世AI Benchmark榜单↑。

NPU 990的超能效核，首发CIM存算一体（Compute In Memory），自带Cache，可以省去频繁读取内存的功耗，单这部分就能省24%功耗，最多可以降低42%。

这颗超能效核，宣称已经可以像低功耗前摄那样，做到All Ways On的全天候常驻——让AI模型可以常驻，且机身不发烫。

端侧的AI翻译↑（没眼花，这就是原速）

端侧的AI摘要↑（每秒100多Token）

天玑9500工程机的AI性能强得很夸张，在跑本地AI翻译和AI摘要的时候，竟然可以1秒100多Token，一走神，它都跑完了。

这暴涨的AI性能+暴降的NPU功耗，可以明显提升全时语音转文字、翻译、相机对焦/追焦/录像的功耗表现，也是业界梦寐以求的主动式AI的前置条件。

就算不想那么远，发哥表示，天玑9500的追焦性能从以前的5、6fps提升6倍，能做到和视频帧率同步的30fps。中译中就是，如果拍摄30fps视频，等于每一帧都能完成追焦，运动摄影爱好者都听哭了。

首个手机端的4K文生图↑

另外， NPU 990还有很多首发特性：

生成式引擎2.0，有Transformer固化电路（响应速度快2倍以上）+内存压缩升级（4B模型的内存占用从2GB降到1.6GB）；
首发端侧BitNet，1.58bit推理框架。速度提升2倍，内存占用减少60%；
Diffusion Transformer性能翻倍，手机端首发4K文生图；
文生文模型性能翻倍，支持的录音长文本从32K提升到128K；
首发LLM大语言模型，端侧LoRA训练；
端到端的模型训练优化（vivo X300会做首个个人化的AI美颜模型，本地训练的内存占用降低80%，占用低于2GB。PS：训练模型的内存需求，是推理的2倍以上）。

(1) vivo X300系列除了AI定制美颜还会有录音转录提升、异构加速；

(2) OPPO Find X9系列则主要做流畅多任务、读屏AI意图等。

发哥同时还表示，已经用AI做信号做频谱补偿、WiFi自动频宽和速率选择（宣称传输速率提升20%）、AI定位（搜星速度提升20%）、AI选网/抢网（在拥塞场景的选基站，宣称流畅度提升50%）等。

ISP方面，关键词也是降功耗。这是天玑9500将首发4K 60fps的电影人像视频的核心原因（强如苹果，iPhone今年依然是4K 30fps的电影模式）。

发哥表示，同样是4K 60fps的SoC功耗，如果天玑9200是100%的话，天玑9300是89%，天玑9400是77%，天玑9500是69%（每年11%到13%的功耗下降，几年下来降低了31%）。

Imagiq 1190 ISP内化了vivo V3+影像芯片，核心包括：

内置4K 60帧电影级人像渲染引擎（景深光斑+肤质打光+调色风格）；
内置RAW域处理引擎（降低存取频宽），用好2亿像素传感器（之后vivo X300的主摄、X300 Pro都是2亿像素传感器）；
追焦抓拍提升。支持30fps的追焦，追焦引擎提升5倍+对焦引擎提升3倍：33ms追焦（友商150ms）+3ms对焦（友商100ms）；
支持4K 120fps杜比视界的双轨防抖（以前做不了的核心原因，还是因为功耗太高了）。

这部分的实测表现，得等vivo X300系列和OPPO Find X9系列的量产机来揭晓了。

总结：功耗是最后的悬念

我们本以为，在“如超新星爆发”的天玑9300之后就不会再有30%级别的提升，结果天玑9400和天玑9500都在猛涨，让我们像极了踏空的股民。

天玑9500这一代，CPU单核实测有27.5%的提升，CPU多核有接近20%的提升；本就是最强的GPU竟然还有26%和36%的提升；AI性能涨了124%，光追测试更是暴涨221%。

这一代的悬念，还是实际功耗。峰值性能是用来争门面的，暴降的功耗才是用来过日子的。

比起峰值性能，同性能下的功耗降幅，才是最值得关注的数值（就像天玑9400，它在日常功耗区间的性能，就已经超过火力全力的前代，过程中节省的电量和降低的发热，才是最影响日常使用的）。

而发哥给的数据是：同性能下，CPU功耗降低37%，GPU功耗降低42%，AI功耗降低56%。这才是我们看好天玑9500的核心原因。

和同代的苹果A19 Pro对比，天玑9500的CPU多核性能小胜，GPU依然和苹果拉开了一代的差距。

虽然高通的成绩还没出来，但估计发哥又又又会是GPU卫冕冠军。下一次破纪录，估计得等明年的天玑9600了。

关注我们的微博@爱搞机

关注我们的微信公众号：爱搞机（playphone）

当然，也关注我们的哔哩哔哩账号：爱搞机