本文只有一个目的,那就是全方位聊聊Apple Silicon M系列芯片这三年的发展,以M1 Pro、M2 Pro、M3 Pro为主线,看看这三年苹果都做了啥,以及M系列芯片的高度究竟如何。

本文2万字,阅读大概需要50分钟!如有帮助,不吝赐赞关注哈! @红叶绮罗香
如果你只关注M1、M2以及M3芯片,那可以查看前一篇评测分享。
无门槛红包,最高11111元,祝好运!
缘起
到了最新一代3纳米工艺制程的M3系列芯片,苹果已经可以一下子端出来M3、M3 Pro、M3 Max三颗芯片了,这基本预示着Apple Silicon M系列芯片已经形成了成熟的迭代套路了。Apple Silicon M系列芯片如今已经迭代到第三代了,但是我发现很多人对于M系列芯片的认识还是有很大的偏差。

有的人会觉得M3 Pro可以完虐M2 Pro和M1 Pro,也有人觉得M3 Pro不过是挤牙膏。在我看来,这些想法其实都不准确。M3 Pro有提升乏善可陈的地方,也有绝对惊艳四座的实力。
其实当年M1那是出道即巅峰的节奏,说的直白点,那是一经问世就傲视群雄的节奏,后续能够保持每年稳定提升就已经很超乎想象了。也就去年年底高通的X Elite,借助12个全大核设计,勉强可以和8大核的M2 Max过过招,而GPU性能还停留在略强于M2的水平,结果没几天就被M3 Max吊打了!而且苹果这边还是发布即现货。

苹果官方给的数据倒是直接了当,M3 Pro相较于M2 Pro来说,CPU基本没有提升,不过实测下来并不是那么回事哈!GPU提升10%,实测也依然不是那个回事。而NPU则提升15%,这个倒是比较贴合实际情况。

而M2 Pro相较于M1 Pro来说,CPU提升20%,GPU提升30%,NPU提升40%。


M3 Pro的提升显然不及M2 Pro的表现,不过呢?M3 Pro一方面是因为要和M3 Max解耦,另一方面则是M3 Pro真正的提升重点根本就不在于CPU和GPU的绝对性能。M3 Pro在常规提升之外,还带来了一些重要的新特性,这个我们后面会说到。
不过呢?我是不可能满足于官方给的这么点数据的,所以接下来不妨一起深挖一下。
PS:以下提供的链接,一般还会有一些额外的优惠券,购买前别忘了活动页领取一下。
MacBook Pro M3 8GB + 512GB版本。
MacBook Pro M3 Pro 18GB + 512GB/1TB版本。
MacBook Pro M3 Max 36GB + 1TB版本。
而对于16英寸版本来说,则是这么几款。
MacBook Pro M3 Pro 18GB/36GB +512GB/1TB。
关建指标
直接上图!先看核心参数。




M系列芯片的优势
Apple Silicon M系列芯片从问世以来,就是近乎天花板级的台积电工艺制程、夸张的晶体管数量以及恐怖的单核心性能。

极致的能效水平。

到了M3系列芯片,索性就不再藏着掖着,直接自称个人电脑最先进的芯片了。

更重要的是,Apple Silicon M系列芯片的最大意义在于,它让主板的复杂设计,变得异常简洁。这是以前MacBook的主板设计,CPU、GPU、运行内存、I/O芯片、安全芯片、雷雳控制器等,分散在主板各个位置。各种互相通信,各种带宽限制,各种高功耗发热。

甚至是CPU和GPU都有着各自的运行内存,数据需要在两个独立内存之间频繁拷贝。

而从M1开始,这些东西都做到了All-in-one。

使用集成大量功能的M1芯片以后的主板,不仅设计简单,故障率更低,而且做到了功耗极低,性能更强。

当然,这些可不是单纯的技术分析。无论是搭载Apple Silicon M系列芯片的MacBook获得近乎翻倍的续航提升,与此同时还能带来极致的性能提升,还是离电性能等同于插电的表现和60W打人家160W的性能释放,都足以体现Apple Silicon M系列芯片在移动端的地位和价值了。
短短三年时间,Apple Silicon M系列芯片做到了此前最强Intel处理器版本MacBook Pro性能的12倍,是不是有点耸人听闻呢!

如今苹果整个Mac产品线都已经过渡到Apple Silicon M系列芯片了,往后只要能够保持每年10%以上的性能提升,那可就太给力了啊!

制造工艺和晶体管数量
近些年芯片性能提升离不开生产工艺的贡献,M1系列芯片采用的第一代N5工艺,其实和A14所用到的工艺是一样的。
M1 Pro当时集成了337亿颗晶体管,相较于M1直接翻倍。

而等到M2 Pro用上N5P工艺以后,晶体管数量增加了近20%,达到了400亿颗。

有意思的是,M2用200亿颗晶体管,差不多追上了8核心CPU的M1 Pro的性能水平。只不过,M1 Pro可是有着337亿颗晶体管的!不得不说,工艺的进步和架构的提升,很多时候真的是可以用更少的物料做出更好的产品的。
而M3 Pro则直接上了台积电最新的3nm工艺制程,也就是所谓的N3B工艺,晶体管密度进一步提升。不过这一次M3 Pro不再是此前M1/M2 Max阉割出来M1/M2 Pro,而是完全重新设计了一颗芯片。
也就是说,从M3这一代开始,Pro和Max就彻底解耦了!优势嘛?Pro级芯片可以更好的服务于产品,降低成本,剔除专为Max设计的冗余部分。比如M3 Pro就是明显减小了晶体管需求,同时打造了更多的能效核心,带来了更高的能效表现。缺点嘛?可能就是缺少了Max级芯片的某些高级特性,比如超高的内存带宽。
但是懂芯片的人都应该知道,同样的工艺之下,晶体管数量决定了芯片面积,芯片面积决定了一块晶圆能切出多少颗芯片,而晶圆那可就是实打实的钱了!

其实随着芯片性能的不断提升,同时伴随着芯片生产工艺的进步,单颗芯片集成的晶体管规模就是在不断提升的。
M1:160亿
M2:200亿
M3:250亿
M1 Pro:337亿
M2 Pro:400亿
M3 Pro:370亿
M1 Max:570亿
M2 Max:670亿
M3 Max:920亿
M1 Ultra:1140亿
M2 Ultra:1340亿
这里面的唯一例外,其实就是M3 Pro。相较于M2 Pro而言,M3 Pro的晶体管数量不仅没有增加,反而减少了30亿颗!这也是很多人吐槽苹果M3 Pro阉割严重的根本原因,不过我倒是觉得这恰恰是苹果厉害的地方。还记得前面说的,200亿颗晶体管的M2,性能差不多可以打平337亿颗晶体管的入门款M1 Pro吗?

如果我告诉你M3 Pro整体性能进一步稳定提升,而且M3系列芯片所有的新特性M3 Pro一个都不缺,你会不会也觉得用更少晶体管低成本做到这样的事情,是很酷的呢?这部分细节后面会重点聊哈!
CPU架构设计
M系列芯片采用了类似于A系列芯片的大小核心设计,这样的设计优势很明显,大核心P核保证绝对性能,小核心E核保证绝对能效,而Apple Silicon M系列芯片也是目前为止唯一能够把这个设计理念贯彻的比较到位的产品了。高通同为ARM架构的X Elite,其实用的还是全大核心设计,为了保能效,估计是要大核心降频跑了!
M1 Pro的CPU部分有两个规格,6P + 2E和8P + 2E。
M2 Pro也有两个规格,分别为6P + 4E和8P + 4E。
M3 Pro依然维持了两个规格,5P + 6E和6P + 6E。

不难看出,Pro级芯片其实是越来越注重能效核心的作用了。从M1 Pro的2E到M2 Pro的4E,再到M3 Pro的6E。其实到这里已经不难看出,采用Pro级芯片的Mac,实际上依然是更注重能效的。而主打绝对高性能的M3 Max,愣是可以搞出12P + 4E的规格,一看就是注重CPU极致性能的产品。
M1 Pro采用的是和A14相同的Firestorm性能核心和Icestorm能效核心,而M2 Pro采用的则是和A15一致的Avalanche性能核心和Blizzard能效核心。M3 Pro大概率采用的是和A17 Pro一致的核心架构,不过目前苹果没有透露任何关于核心架构的细节,所以目前还不知道A17 Pro和M3 Pro架构的具体细节。

一定程度上讲,A系芯片的设计很大程度上可以体现M系芯片未来的走势。
CPU性能纵向对比
M1 Pro性能核心有着192KB指令缓存和128KB数据缓存,四个性能核心共享24MB的L2缓存。而M1 Pro的能效核心则有着128KB指令缓存和64KB数据缓存,四个能效核心共享4MB的L2缓存。

多说一句,苹果这边没有L3 Cache的说法,而是用的SLC,也就是片上缓存,一般都是几十MB的规模。
M2 Pro则把8个性能核心共享的L2缓存提升到了32MB,这真的是非常夸张的规模了。

M3 Pro这一代CPU部分变化不大,主要是调整了大小核心的规格。苹果官方给的数据,其实基本就是M2 Pro的性能水平。M3 Pro比较神秘,很多架构数据苹果并未对外公布,逆向数据也不多。

M1 Pro的主频当年只做到了3.2GHz,Geekbench 6测试基准下,M1 Pro(6P + 2E)单核跑分2365分,多核10320分。相较于M1来说,单核心性能没区别,多核心性能提升23%。

M1 Pro(8P + 2E)多核12254分,相较于M1来说,多核心性能提升46%。

M2 Pro把主频提升到了3.5GHz,Geekbench 6测试基准下,M2 Pro(6P + 4E)单核跑分2642分,多核12143分。相较于M2来说,单核一致,多核提升24%。而相较于M1 Pro(6P + 2E),单核心提升12%,多核心提升16%左右。

M2 Pro(8P + 4E)多核14249分,相较于M2来说,多核提升46%。而相较于M1 Pro(8P + 2E),多核心提升18%左右。

M3 Pro则比较夸张,主频直接上到4.1GHz,Geekbench 6测试基准下,M3 Pro(5P + 6E)单核跑分3093分,多核14014分。相较于M3而言,单核性能一致,多核性能提升20%。而相较于M2 Pro(6P + 4E),单核性能提升17%,多核心性能提升15%。

M3 Pro(6P + 6E)多核15262分。相较于M3而言,单核性能一致,多核性能提升30%。而相较于M2 Pro(8P + 4E),多核心性能提升7%。

其实稍微细看一下以上CPU的性能,不难发现新一代入门款的Pro芯片,基本就是刚好追上上一代顶配Pro芯片的性能。所以在选购苹果电脑的时候,与其一味等待未来新款芯片性能提升,远不如直接加钱升级配置,这样完全可以省下等待的时间。
不过这里需要多说一句,Geekbench 6多核性能体现的是这些核心间存在相互关联关系情况下的性能释放,性能表现要比单纯让不同核心做不同任务的性能释放小一些。换句话说,如果让这些处理器独立做不同的事情,多核性能表现会好很多哈!
M1当年发布的时候,在移动端轻薄本领域,那就是一副秒天秒地的架势。对标同期竞品,10W功耗输出竞品2倍性能,而达到竞品峰值性能,功耗仅仅是竞品的1/4功耗。而M1 Pro基本上是完美延续了这样的水准,M1 Pro对标当时最新款8核心处理器的笔记本,性能强了70%。而在达到竞品同等性能的情况下,竞品的功耗是M1 Pro的3倍左右,M1 Pro真的就是20W功耗打人家60W的节奏。

其实在Apple Silicon M系列芯片问世之前,每年CPU的能效提升都微乎其微,基本都是在以能耗提升换性能提升,而M1一下子带来了3倍能效提升,可谓是降维打击。

这玩意当时就是地表能效最强的CPU。

而后续的M2 Pro、M3 Pro可都是在M1 Pro这种巨幅提升的基础上进一步提升,所以那些说M2 Pro、M3 Pro挤牙膏的人,多半都是没看到M1 Pro当年出道即巅峰的极致状态。
M2 Pro保持了M1 Pro以来的超高能效表现,同时做到了CPU性能20%的提升。

实际上,在具体的应用场景中,M2 Pro的CPU性能提升还可以更高。比如Xcode代码编译的速度就可以块25%。

而M3 Pro的CPU性能和能效表现也依然很亮眼,简单来说,性能稳步提升,而能效依然行业领先。

M3系列芯片的能效提升其实是很恐怖的,比如入门款的M3芯片CPU部分实现了只用一半功耗就能达到M1的峰值性能,短短三年时间,还是相当震撼的!
不过也需要注意M3的曲线其实是有向右延伸的,这也就意味着M3虽然在M1峰值功耗下性能更强,但是再往后的性能提升,也是依赖拉高功耗了!

对标12核心的i7 1360P,M3的CPU只用到1/4的功耗就可以达到1360P的峰值性能。

而在绝对性能上,M3 Pro CPU的高性能P核心相较于M2 Pro提升15%,相较于M1 Pro提升30%。

M3 Pro的四个高能效E核心,相较于M1 Pro提升50%,相较于M2 Pro提升30%。

其实M3系列芯片发布的时候,最霸气的一句话是这样的:个人电脑最先进的芯片。

CPU性能横向比较
Geekbench 6
Apple Silicon M系列芯片Geekbench 6的数据前面已经分析过了,这里拉上AMD R7 7800X3D、i9-14900HX以及i9-14900K一起对比一下,需要注意的是,AMD R7 7800X3D和i9-14900K那可是台式机的处理器了!Apple Silicon M系列芯片哪怕是到了M3 Max,也依然是立足于移动端笔记本电脑的。
不难看出,M3 Pro单核性能基本没有对手,多核性能也就和i9-14900K有着明显的差距。不过需要强调一句,Geekbench 6的多核跑分很难反应i9-14900K这种24核心处理器的绝对性能哈!

Cinebench 2024
另外,我也简单测试了一下Cinebench 2024 CPU单核、多核渲染的成绩。简单来说,M3 Pro单核性能一骑绝尘,多核性能完虐Ultra 5和12代i5。
只有对标24核心的i9-13900HX和R9 7935HX这种24核心、16核心的高端处理器,才能明显拉开差距。毕竟,M3 Pro也就6P + 6E的配置啊!
另外,也可以象征性的对比一下i9-14900K,看看差距有多大。这里提前剧透一下,M3 Max在这个测试下,已经可以达到i9-14900K的性能水平了。笔记本处理器媲美顶级桌面级处理器,敢想不?
后续想要第一时间了解Max系列的评测,也不妨关注一下吧! @红叶绮罗香

应该有不少小伙伴还在用着老款的英特尔处理器,比如我自己还在用的一个台式机,i7-4790K处理器,单核只有M2一半的性能,多核则只有M1一半的性能。但是说实话,即便是i7-4790K,搁今天也依然是可以很好满足日常办公需求的哇!

说到这,你兴许也就不奇怪,为什么MacBook Air M1至今依然在售了吧!
怎么说呢?Apple Silicon M系列芯片这三代芯片,CPU部分真的是相当亮眼了!
GPU性能纵向对比
Apple Silicon M1 Pro
M1 Pro一共有两个不同的版本,一个是14核心GPU,另一个是16核心。说实话,购买搭载M1 Pro芯片的产品时,真的没必要纠结这么两颗GPU核心的差异。因为在iGPU领域,那个8核心GPU的M1相较于同期产品就已经是吊打的水平了!

10W下的GPU性能输出是同期最新笔记本集显性能的2倍。

而达到同期最新笔记本集显峰值性能的功耗仅仅只有1/3。

而M1 Pro的GPU性能实际上达到了M1的两倍。

其实到了M1 Pro这个级别,苹果的集显性能已经开始对标很多笔记本的独立显卡性能了。重点依然是,那类独显要想跑出M1 Pro的峰值性能,基本都得3倍以上的功耗。对于笔记本来说,30W的功耗和100W的功耗,完全不是一码事啊!实际上,笔记本要是真的让显卡跑100W,那基本也就只能无时无刻都插着电源玩了。

Apple Silicon M2 Pro
M2 Pro也有两个GPU规格,16核心GPU和19核心GPU。相较于M1 Pro来说,M2 Pro的GPU性能提升了30%。

在16个核心基础的情况下,仅仅增加3颗GPU核心,性能提升30%,足以看出苹果GPU设计能力的剽悍之处了。

而在具体的使用场景中,GPU的性能提升可以远不止30%。

另外,相较于M1 Pro,M2 Pro也进一步提升了芯片能效。
Apple Silicon M3 Pro
到了M3系列这一代就有点夸张了,M3跑出M1的性能仅仅需要一半的功耗,而峰值性能可以比M1高出65%。说真的,集成显卡这样的进化速度还是很让人惊艳的,尤其是在不强烈依赖堆核心规模、拉高功耗的情况下。

对标12核心的i7 1360P,集成Iris Xe显卡,M3的GPU只用到1/5的功耗就可以达到i7 1360P的峰值性能。关健是,作为笔记本的处理器,这功耗直接拉高到30W+,确定还适合笔记本使用吗?

而M3 Pro相较于M2而言,GPU性能提升10%,算是中规中矩吧!

但是,M3 Pro的GPU真正强大之处不在于这种纯粹GPU算力的提升,而是M3 Pro终于补足了最后一块短板,那就是硬件光线追踪能力呀!

在此基础上,M3 Pro还加入了动态缓存以及硬件加速的网格着色功能,这就让M3 Pro的GPU实际表现截然不同了!
硬件光追和网格着色在聊A17 Pro的时候已经讲过了,这里就不多赘述了。
简单来说,就是Apple Silicon M系列芯片终于有硬件光追和网格着色了,GPU架构层面是一次飞跃。
硬件光追可以很好的模拟真实世界,阴影和反光更加真实,无论是游戏还是专业3D渲染软件都能受益于此。
渲染速度方面,相较于M2最快提速1.8倍。这是不是和前面聊到M3 Pro的GPU性能提升10%根本不是一回事了呢?

再比如Redshift中的渲染速度,M3 Pro基本就是直接翻倍了!

硬件加速的网格着色对于几何模型处理的功能和效率大幅提升,可以打造视觉效果更复杂的场景。

而M3 Pro GPU还新引入了Dynamic Caching,也就是动态缓存。传统GPU还在根据最大任务需求提前预留内存呢!M3 Pro已经可以根据实际需求动态调整局部内存使用了,GPU平均利用率大幅提升。话说,M3 Pro本来就能配备超大的统一内存,GPU更是能够拿到2/3的内存当显存使用,再能大幅提升内存利用率,那这个GPU的显存可就很夸张了。

这个技术本身对开发者透明,也就是说,专业级的app可以更加充分发挥GPU的性能了。用苹果自己的说法:行业首创,开发者透明,新一代GPU的基石。很多时候,苹果这边的创新总是来的这么猝不及防。

GPU性能横向对比
当然,我知道很多人还是比较喜欢对比各种传统PC显卡的性能,甚至早就习惯拿着Apple Silicon M系列芯片的集成显卡对标独立显卡了。
简单对比倒是问题不大,不过需要注意的是,比较显卡性能其实会受到很多因素的限制,比如测试基准,不同的测试会有不同的性能表现。

再比如测试设备本身的设计,同款显卡轻薄本一般就跑不过游戏本,低频内存就跑不过高频内存。甚至是那些跨平台的测试基准,也很难绝对反应显卡的真实水平。
比如macOS可以原生运行的博德之门3,M3 Max在2160P最高画质下可以跑40帧,表现可以比i7 13700H + RTX 4060还要强。如果降低到1440P,那么M3 Max甚至比i9 13900HX + RTX 4080还要厉害。要是画质降低到1080P,那可就得AMD 7950X3D + RTX 4090才能比了!

其实M3 Max哪怕是套几层转译最高画质运行赛博朋克2077,表现依然可以接近i7 13700H + RTX 4060的水平。

这里面有很多原因,比如画质降低以后,压力可就不一定是GPU了,而是给到了CPU呀!
以上这种特定场景的性能表现,肯定会刷新不少人的认知。但是我如果就是要跑一把Stable Diffusion,那么RTX 4060可以完虐M3 Max。
说以上这些当然不是为了聊M3 Max,而是想借此说明显卡性能的释放其实受限于软硬件平台的各种约束,甚至也受限于软件本身的优化。比如同样是M2芯片,达芬奇导出同样的素材,在机身散热处于劣势的iPad Pro上,却可以比MacBook M2还要快。

所以需要强调一句,同一颗芯片搭载在不同平台上,不同的内存配置,不同的散热条件,不同的功耗墙,也一样会有一定的性能差异。以下只是定性的比较一下跨平台的性能,而不是绝对性能的定量对比。
Geekbench 6对比
首先看看Geekbench 6测试,主要测试苹果的Metal和跨平台的OpenCL。

这里也拉来了手机端的A17 Pro作为对比,不过由于移动端的手机平板测不了OpenCL,所以A17 Pro只测试Metal成绩。不难看出,A17 Pro的Metal成绩已经接近M1,差不多也有了M1 Pro一半的性能。

比较有意思的是,M2 Pro、M3 Pro的Metal和OpenCL分数基本一致,而相较于英伟达和AMD的入门显卡,M系列芯片在原生Metal上更有优势,而OpenCL就明显被拉开差距了。
但是,毕竟这里依然只是拿Pro级芯片对比,实际上换成巨无霸M3 Max,就可以和很多中高端显卡打个有来有回了!
3DMARK对比
再看3DMARK测试,这是专门为高端移动设备打造的,非常适合手机、平板和轻薄本的测试。
主要测试了Wild Life Extreme,虽然不是离屏测试,但是这个测试统一采用3840× 2160(4K UHD)的渲染分辦率,保证了不同设备上渲染分辨率的一致性。

不过这个分辨率对于大部分移动端设备来说压力都太大了,比如我这个A17 Pro也就能跑25FPS。

Wild Life Extreme测试中,M3 Pro最强,比M2 Pro强了12%,比M1 Pro强了40%。这部分对比数据比较贴近苹果的官方数据。

这里多说一句,RTX 4060也拿过来简单对比一下,树立个高度,给以后Max和Ultra留个对手。
Cinebench 2024对比
再看下Cinebench 2024,这个测试基准更接近3D应用的真实使用场景。

Cinebench可以分别跑CPU单核多核渲染,也可以单独跑GPU渲染,我们这里主要关注GPU渲染成绩,比如这个10核心的M2芯片的成绩。

不难看出,在特定的应用场景下,M3系列的GPU速度提升可不算小,性能提升有76%之多,相较于M1 Pro更是翻倍还不止。当然,想要对标RTX 3060这样的独显,那还是略逊一筹,还得Max来打了,这个咱们以后再说。

Blender 4.0.0对比
接下来看看Blender 4.0.0的跑分,测试涉及三个场景,monster、junkshop以及classroom,最后累计三部分的总分。

怎么说呢?M3 Pro算是巨幅提升了!这其实依然是我最开始说的,GPU性能很依赖特定场景。其实在macOS下,甚至仅仅是app层面的优化,都可以让app的处理速度大幅提升,而这其实就是软件生态的价值。

GFXBench 5.0对比
最后看下GFXBench 5.0的测试,这个测试本身其实更适合手机和平板,不过得益于GFXBench优秀的跨平台特性和多API支持,我们也拿过来参考一下。

这里主要测试Aztec Ruins在不同分辨率下的离屏测试。注意,不同设备的屏幕规格完全不同,不做离屏测试的话,同一个SoC都会变得没有可比性。

注意,这个测试结果只能定性的看一下。这里还专门测试了一下上古的A9X,成绩是真的有点惨不忍睹哇!

重点看看Aztec Ruins 4K分辨率下离屏的成绩,A9X只有5FPS,A17 Pro可以跑到25FPS,M1是35FPS,M2是48FPS,M3则略微提升跑到52FPS。
那么Apple Silicon M系列芯片Pro级几款芯片表现如何呢?

也不难看出,随着分辨率降低,每个SoC的成绩都得到了快速提升。但是总体来看,M3 Pro其实都是小幅提升。
再拿RTX 2050 Mobile和RTX 4090 Laptop简单对比一下,需要注意的是,RTX 4090 Laptop跑Aztec Ruins 1080p实在是太小Case了,直接跑到了1253PPS,已经严重影响制图比例了,这里对X轴做了特殊处理,实际上最大只到600。
怎么说呢?对标顶级独显,还是得Max甚至Ultra才能勉强比比哈!
苹果官方对比
其实对于真正打算入手Apple Silicon M系列芯片的人来说,苹果官方的对比其实更容易一目了然的搞清楚产品相对性能和差异。
3D渲染:

视频渲染:

图像处理:

工程模拟:

苹果的这种对比方式,数码极客看了肯定不爽,但是对于打算从老款升级的人而言,却是帮助极大的啊!更新之后能有多大提升,真的是一目了然呀!
M3 Pro机型内存和存储支持的情况
我看有很多人都拿苹果MacBook Pro内存选配的各种限制说事,搞的就像苹果故意捆绑内存销售一样。
实际上呢?这就是对于芯片上内存控制器的部份一点都不了解。对于芯片来说,支持更多的内存规格和更大的内存带宽,内存控制器的面积那是要实打实增加的啊!更不用说,Apple Silicon M系列芯片采用的是UMA统一内存架构,不同内存规格带来的封装影响就更大了。下图Dieshot画了一下内存控制器部分,可以直观感受一下内存控制器的面积占用。

如果任意一款芯片都给你放开8GB/16GB/18GB/24GB/36GB/48GB/64GB/96GB/128GB全规格定制,那得提供多少颗定制芯片封装?内存控制器得做多大的冗余设计?这个成本得高到什么程度?成本最终由谁承担呢?
目前Apple Silicon M系列芯片支持的内存规格如下:
M1只支持8GB和16GB运行内存
M1 Pro只支持16GB和32GB运行内存
M1 Max只支持32GB和64GB运行内存
M2支持8GB、16GB以及24GB运行内存
M2 Pro只支持16GB和32GB运行内存
M2 Max 30核GPU版本支持32GB和64GB运行内存
M2 Max 38核GPU版本只支持32GB、64GB以及96GB运行内存
M3支持8GB、16GB以及24GB运行内存
M3 Pro只支持18GB和36GB运行内存
M3 Max 30核GPU版本支持36GB和96GB运行内存
M3 Max 40核GPU版本只支持48GB、64GB以及128GB运行内存
而在储存空间方面,MacBook Pro支持的也很给力,就是价格确实也不便宜就是了。
512GB 固态硬盘
1TB 固态硬盘
2TB 固态硬盘
4TB 固态硬盘
8TB 固态硬盘
不过需要注意的是,MacBook Pro M3系列产品中,只有搭载M3 Max的机型才可以选配8TB的固态硬盘哈!
关于M3 Pro的性能规格倒吸
有了以上的性能分析,直接说M3 Pro性能倒吸显然是扯淡了!
M3系列芯片发布以后,关于M3 Pro的吐槽是最多的。吐槽的点主要集中在两个地方,一个是M3 Pro居然少了性能核心P-core,换成了能效核心E-core,另一个则是吐槽内存带宽掉了1/4,只有150GB/s了。

首先需要明确一点,M3 Pro所有规格都拉满,从芯片的角度讲当然更好,但是从产品的价格来看可就不一定了。以N3B工艺的良品率来看,无论是堆P核心的面积,还是堆内存控制器的面积,那都会大幅增加成本,体现在产品上就是更高的价格。
而在苹果这边的产品策略里面,M3 Pro机型的核心任务并不是进一步拉高CPU、GPU的性能,你看隔壁的Intel Ultra系列,那CPU性能基本就是原地踏步。
M3 Pro最关键的使命,其实是补足M2 Pro的硬伤。也就是M3系列芯片引入的硬件光追,网格着色,动态缓存等,这些东西放到具体的使用场景中,那是分分钟可以性能翻倍的存在。
M3 Pro性能核心缩减的原因
今年M3 Pro之所以会是6核心的P核设计,其实是因为M3这一代芯片P核簇的设计就是6个P-core组成一个Cluster,这也就不难理解M3 Max满血版是12个P-core了吧!下图蓝色部分就是6个P-core。

而5个P-core的M3 Pro和4个P-core的M3,其实都是一个Cluster裁剪得到的。如果让M3 Pro上两个Cluster,然后6个P-core裁剪出2个P-core,那就已经不是良品率的问题了,而是设计问题了。
不过需要注意的是,虽然M3 Pro少了P核,苹果官方的宣传也是M3 Pro的CPU多核性能基本没有提升,但是实际上并不是这样的。苹果这边的宣传往往更为保守,实际上多核依然有着10%左右的性能提升。而M3 Pro的单核性能那是直接提升了17%,得益于更多能效核心的加入,如今M3 Pro的能效也要更好。
M3 Pro为什么是150GB/s内存带宽
还有很多人吐槽的150GB/s内存带宽,不如上一代的200GB/s不假,但是150GB/s不算小也是事实。隔壁高通对标M2 Max的X Elite,借助高频的LPDDR5x-8533,也才把内存带宽做到136GB/s,不妨了解一下?

传统PC架构下,比较不错的双通道DDR5 4800,差不多也就是76GB/s的内存带宽。实际上,很多人用的还都是DDR4 3200呢!双通道也就50GB/s的内存带宽。
M3 Pro在使用LPDDR5-6400、192bit位宽内存的情况下,提供了6400 * 192 / 8 / 1000 GB/s = 153.6GB/s的内存带宽。前面说过,较少一个内存通道可以减少大量晶体管的使用。但是苹果又是凭什么敢这么做的呢?不怕内存访问延时吗?

其实苹果完全可以无视成本依然保持200GB/s的内存带宽,从而获得宣传层面的优势。至于极为有限的效用和高成本,反正以苹果产品的整体实力,用户自然还是会愿意买单的。但是你真的希望是这样的产品策略吗?是不是很多Android手机就是这个路数呢?
实际上,苹果之所以敢用三通道192bit的内存位宽设计,是因为这一代SLC缓存的预取机制有变化。芯片工作的时候,并不是什么东西都得跑到内存去找的,那样即便内存带宽再大,也会是很大的瓶颈。只有当L2 Cache、SLC都找不到的时候,才需要访问内存数据。芯片工作的时候,现实情况往往是内存带宽大部分时候根本占不满,这其实就是很大的浪费。

而得益于台积电3nm工艺的优势,苹果可以增加SLC部分逻辑控制和SRAM的规模,借助全新的缓存分配和预取机制,可以让内存带宽一直保持充分利用,结果就是M3 Pro 150GB/s的内存带宽可以长时间保持较高占用,但是不会成为瓶颈。相较于集中访问内存的M2 Pro,即便后者有200GB/s的内存带宽,M3 Pro也不会有什么劣势。
其实这颗完全重新设计的M3 Pro,不再是由M3 Max简单砍掉GPU、SLC、MC等模块的规模,而是可以直接控制内存控制器、硬盘IO、媒体引擎以及显示引擎等部分的具体规模,这也是M3 Pro可以面积减少20%、晶体管减少30亿颗,还能保证不错性能提升的根本原因。
再聊M系列芯片的架构优势
我们再回头聊聊Apple Silicon M系列芯片架构层面的优势,以及Apple Silicon M系列芯片的特色功能。

上一次聊到Apple Silicon M系列芯片优势,重点介绍的是超低功耗、地表单核最强的CPU核心,以及M系列芯片集成了大量传统PC分散在主板上的元器件,比如:
Advanced power management
High-bandwidth caches
Cryptography acceleration
High-performance unified memory
Machine learning accelerators
High-efficiency CPU cores
High-performance CPU cores
Secure Enclave
Low-power video playback
Advanced display engine
HDR video processor
High-performance GPU
High-performance video editing
Always-on processor
High-quality image signal processor
Low-power design
High-performance NVMe storage
Thunderbolt / USB 4 controller
High-efficiency audio processor
Neural Engine
HDR imaging
Gen 4 PCI Express
Performance controller
Advanced silicon packaging

效果嘛?立竿见影,复杂的主板瞬间变得无比清爽。

难道这一切只是为了让主板变得清爽吗?或者仅仅是故障率更低吗?显然并不是。
统一内存架构(UMA)
M1问世以后,很多人看到的芯片就不再是单纯的一块硅片,而是有点诡异的全新封装。同时也把UMA这个词带到了用户面前,也就是统一内存。当然,A系芯片其实早就是统一内存架构了。

是的,这颗芯片边上的两块黑色物体,其实就是很多人都知道的DRAM,也就是电脑的运行内存。
很多人可能不知道的是,其实对于如今CPU超快的处理速度来说,哪怕是内存条距离CPU、GPU的距离,都足以增加访问内存时的开销。Apple Silicon M系列芯片的这个封装,无疑是把这个开销都降低到极致了!再优化,真的就得是片上缓存了。

简单来说,苹果这个UMA架构指的就是内存和SoC上的各个专用处理器通过Fabric实现互联,达到各个专用处理器都可以快速访问内存,甚至是访问同一块内存而设计的全新架构。
发现没,CPU、GPU、NPU、视频引擎等处理器的内存不再是物理层面独立的内存块,在这个架构下不同专用处理器可以访问同一块内存区域。
说的深入一点其实就是,传统PC的CPU和GPU还在通过总线互相拷贝数据呢?

显卡本身有着自己独立的内存,CPU处理的一些系统内存数据需要拷贝到显卡内存继续处理,整个处理过程存在各种数据同步。其实这个过程中,管理这些内存的使用就是一件很复杂很影响效率的事情。
比如像下面这样,在CPU、GPU处理过程中,不得不存在Copy gap这样的额外开销。

而M系列芯片这边已经可以做到内存地址传递了!

CPU和GPU有着一大块共享内存,这部分数据CPU和GPU随时都可以按需直接使用。当然,GPU也依然会有部分自己独占的内存。在这套架构下,CPU0处理完的数据交给GPU处理,GPU处理完交给CPU1处理,整个过程不需要任何内存数据拷贝。

而处理大量数据的情况下,这个过程就可以非常顺滑,CPU0可以一直在做逻辑处理,GPU一直可以及时拿到数据,处理完的数据总是可以无缝衔接给下一个处理器。

而以上这些,可不仅仅是集成显卡就能做到的。实际上,集成显卡往往也是有着自己独立的显存的,内存管理模式和独显没有什么区别。而只有配合UMA统一内存架构,才能实现以上这种高效的处理哇!

超大显存
说到CPU和GPU都能使用这个DRAM,肯定有人已经开始好奇了,那是不是意味着这些DRAM可以用作GPU的显存呢?答案是肯定的。
UMA架构下,GPU就是直接拿系统内存当显存用的。

而且一旦意识到这一点,其实基本也就不会吐槽苹果的金子内存了!
因为当你把它当显存用的时候,那可比给显卡加内存便宜太多了。而且更关键的是,对于Apple Silicon M系列芯片而言,DRAM可以做到拿出2/3以上当成显存使用。比如32GB版本的MacBook,可以拿出21GB当成显存,64GB则可以拿出48GB当显存。

想象一下,如今M3 Max支持128GB的大内存,显存预估能够达到85GB以上。而M2 Ultra已经支持到192GB内存,未来M3 Ultra那就是256GB,万一再整活个M3 Extreme四芯互联,内存直接搞到512GB,这些家伙的显存容量是不是就相当夸张了呢?

简单对比一下显存容量,个人显卡天花板的RTX 4090,也仅仅给到24GB显卡内存。

哪怕是RTX 6000 Ada,显存也就给到48GB,这等于是M1 Max就能给到的容量。

当然,我说这些不是要说Apple Silicon M系列芯片在显卡领域超越英伟达了,而是想说,UMA架构确实给个人用户带来了前所未有的大显存,尤其是碰上这个LLM流行的时代,超大显存的价值就不言而喻了吧!
超大带宽
M1 Pro和M2 Pro都做到了200GB/s的内存带宽,M1 Max和M2 Max则做到了400GB/s的内存带宽,M1 Ultra和M2 Ultra更是做到了800GB/s的内存带宽。
M3 Pro在使用LPDDR5-6400、192bit位宽内存的情况下,提供了6400 * 192 / 8 / 1024 GB/s = 150GB/s的内存带宽。相较于传统PC架构下,比较不错的双通道DDR5 4800,差不多也就是76GB/s的内存带宽。实际上,很多人用的还都是DDR4 3200呢!双通道也就50GB/s的内存带宽。

而M3 Max也不再是唯一的400GB/s内存带宽,M3 Max(10P + 4E)版本采用的是300GB/s内存带宽,M3 Max(12P + 4E)版本才是400GB/s内存带宽。
关于M3 Pro和M3 Max低配版本降低内存带宽的原因,可以参考M3 Pro规格倒吸那一个章节。
超高效ZRAM、SWAP
苹果的Mac至今依然是8GB起步,而且苹果甚至表示未来很长时间可能都不会改变这个起步规格,这也是很多人吐槽的点。
很多人之所以会本能的认为8GB内存不够用,其实和Android厂商、Windows笔记本厂商的内存策略有很大关系,另一方面则是因为依然没有真正理解UMA内存的优势,以及macOS下内存的管理和使用模式。这其实很像如今iPhone依然采用6GB/8GB内存,而Android都开始搞24GB了!

肯定有人听说过,Apple Silicon M系列芯片的8GB物理内存大致可以发挥Windows PC上16GB物理内存的效用。那么Apple Silicon M系列芯片的8GB物理内存,到底能不能高效的加载和处理需要占用16GB内存空间的数据?答案是肯定的,甚至还不止。

而且这个能力并不局限于Mac,同样适用于使用M1/M2芯片的iPad。
考虑到ZRAM和SWAP可以额外提供不止10GB的“虚拟内存”,其实整体效果是可以高于16GB的。比如这个MacBook Air M1 8GB,都加载18GB内存数据了,内存压力也就才标黄,远没有到变红卡顿的程度。

某些很懂计算机的人,张嘴就来ZRAM和SWAP是古老技术,那么问题来了,能够做到苹果目前硬件指令级别的内存压缩,以及多种压缩算法并用的,不带来CPU占用率明显提升的,还有其它产品吗?是不是都不知道早期PC处理器玩这种东西的时候,CPU占用率被自己玩的高得一塌糊涂呢?
而Apple Silicon M系列芯片下的SWAP效率也极高,不是传统PC那个虚拟内存可以碰瓷的!甚至肯定会有人建议你Windows PC下不要开SWAP虚拟内存,而macOS下则是默认很激进的SWAP虚拟内存。

还可以更高吗?当然可以。但是问题是,借助低速SSD做高速RAM的事情,不可能无限制的增加。
但是明明可以用廉价的SSD做一部分DRAM的事情,完全不用那也纯粹是浪费。其实稍微知道芯片L0/L1/L2/L3/SLC/DRAM多集缓存的设计机制,也不会总想着把什么数据时时刻刻都保留在更靠近CPU的缓存或者内存里面了,真当这些东西不要钱啊!
很简单的道理,合理利用SSD来提升系统加载程序和数据的能力,这就是最基础、最自然的设计理念。差别仅仅在于有的厂商玩的很Happy,而有的厂商却玩的很蹩脚罢了!
超高能效
这个就主要体现在产品设计上了,当然,我们这里重点只聊芯片本身的能效。
不过需要提醒一句,其实并不是很多人以为的,MacBook续航超长只是因为Apple Silicon M系列芯片能效远高于同类产品,实际上很多笔记本芯片以外的板载功耗可一点都不少。尤其是到了待机功耗这一块,很多笔记本端口空载都能有不小的功耗。
上周末拿着我的MacBook Air出去用,出门电量80%。连着iPhone的蜂窝网使用,用了三个小时电量还剩50%。也就是说,以我常规的使用强度来说,MacBook Air保底能有10个小时续航。关健是我使用MacBook Air一直都是500尼特亮度拉满,一堆经常用的app也都不关的呀!

简单用PowerMetric等工具监控过功耗,待机状态下MacBook可以做到0.02W功耗,差不多只有其它笔记本的1%~2%。是的,基本就是低了两个数量级。

Word这类码字场景和常规上网,功耗只有i7、R7的五分之一,B站看视频近乎只有十分之一。其实哪怕是M3相较于M1,无论是CPU还是GPU,也都已经可以做到一半功耗输出同等性能了!


所以这就不难理解MacBook在真实使用场景下,依然可以有着10个小时以上的长续航能力了吧!同场景下,x86这边依赖更大容量的电池和更厚重的机身也很难做到一半的续航能力。

媒体引擎的提升
M1和M2系列芯片对于H.264和HEVC加解码都有着硬件加速,但是M3和M2系列芯片的视频引擎对于ProRes和ProRes RAW同样有硬件加速。M3系列芯片更是加入了全新的AV1解码能力,可以让设备拥有更好的流媒体能力。

M3和M2系列芯片集成了更高带宽的视频解码器,可以支持8K H.264和HEVC视频。而ProRes视频引擎更是可以支持同时播放多条4K或8K视频流。

苹果特色的提升
M3 Pro的NPU算力达到了18TOPS,M2 Pro是15.8TOPS,而M1 Pro则是11TOPS。简单来说,M3 Pro比M2 Pro快了15%,比M1 Pro则快了60%。

苹果的MacBook、iPad以及iPhone,其实都有着无处不在的人工智能呀!比如相机、相册以及网页中的实况文本识别,最新一代的系统更是支持视频内的文本识别。再比如基于本地的Siri助手,以及非常好用的人脸识别哇!

此外还有苹果最新的安全隔区,可以为用户提供行业领先的安全性。而最新的图像信号处理器(ISP),也能够进一步减少图像噪点。
外接显示器的支持情况
简单来说,对于已经内置了屏幕的MacBook Pro来说,M1/M2/M3 Pro都可以直接外接最多两个显示器,不过分辨率可以高达6K,或者单个8K (60Hz) 显示器。
通过雷雳端口连接多达两台分辨率最高达 6K (60Hz) 的外接显示器;或通过雷雳端口连接一台分辨率最高达 6K (60Hz) 的外接显示器,同时通过 HDMI 端口连接一台分辨率最高达 4K (144Hz) 的外接显示器
通过 HDMI 端口连接一台分辨率最高达 8K (60Hz) 的外接显示器或一台分辨率最高达 4K (240Hz) 的外接显示器
而对于不带屏幕的Mac mini这样的产品,则可以外接三个显示器。
最多三台显示器:通过雷雳端口连接两台分辨率最高达 6K (60Hz) 的显示器,同时通过 HDMI 端口连接一台分辨率最高达 4K (60Hz) 的显示器
最多两台显示器:通过雷雳端口连接一台分辨率最高达 6K (60Hz) 的显示器,同时通过 HDMI 端口连接一台分辨率最高达 4K (144Hz) 的显示器
通过 HDMI 端口连接一台分辨率最高达 8K (60Hz) 或最高达 4K (240Hz) 的显示器
是不是很奇怪,为什么同样是Pro级芯片,Mac mini就可以多接一块屏幕呢?原因很简单,因为这几颗SoC的显示引擎就只支持3块屏幕,MacBook Pro本身内置了一块屏幕,占了一个规格,所以也就只能外接一块显示器了。
实际上,苹果这边采用的显示引擎在外接最大规格显示器以后,也不会明显提升功耗,对于芯片整体的性能损耗也极小。其原因就在于,苹果的这个显示引擎占用的芯片面积,是要比P-core还要大的啊!你说,同样的成本,你是愿意多要个P-core,还是多要个显示引擎呢?

我看不少人会吐槽M1/M2/M3外接扩展屏幕不给力的问题,也就是搭载这三颗芯片的MacBook Air/Pro,在内置显示屏以外,居然只能外接一块显示器。

不过我觉得这压根儿不算问题,首先M1/M2/M3这几颗芯片加持的产品,对应的用户群体甚至压根儿就不会拿着MacBook去外接显示器,而即便是Mac mini往往也只外接了一块显示器。这个时候,M1/M2/M3支持的高达6K 60Hz的显示器反而是很大的优势,Mac mini更是可以同时外接一块6K 60Hz和一块5K 60Hz的显示器啊!
比如我自己就是Mac mini外接5K屏的Studio Display。

其次则是M1/M2/M3变相外接多块显示器的方法也有很多,只要真有需求也不妨折腾一下。如何让MacBook Air扩展两个显示器?
Apple Silicon M系列芯片展望
Apple Silicon M系列芯片无疑是给原来一潭死水的PC市场注入了全新的活力,无论是每年芯片性能稳步提升,还是由此驱动全新设计的PC产品,对于消费者而言都是莫大的好事情。

尤其是Apple Silicon M系列芯片加持下,MacBook Air和Mac mini这样的产品,不仅仅是带来了更为强悍的性能,更是让这些原本价格很高的产品变得更加亲民了呀!其实熟悉这些产品的人都应该知道,从2020年开始,购买这些产品实际上价格是低很多了的。
更不用说,如今中高端iPad更是直接用上了M系列芯片,真的是性能比很多人的电脑还要强悍了啊!
下一篇,一起聊聊Apple Silicon M系列芯片的Max和Ultra版本。有兴趣不妨点赞关注一下吧! @红叶绮罗香
如何优惠购买MacBook?
优惠购买MacBook Pro的方式其实有很多种,但是也不要想着有什么巨额优惠,真遇上也大概率没有品质保证。
常见的优惠方式无外乎,官方渠道的商业折扣,官方渠道的员工优惠,官方提供的教育优惠,第三方电商平台的促销优惠,以及第三方平台的教育优惠叠加平台的促销优惠。前两种不适合大部分人,往往也需要承担一定的风险。这里主要介绍一下后三种优惠方式。

教育优惠有一定的门槛,也就是你得满足学生或者教职员工的身份要求。苹果官方需要支付宝实名认证,不是学生或者教职员工就不要折腾了。
而同样具备苹果教育优惠产品销售资格的京东,目前依然采用的是学信网的认证方式,学生群体可以轻松完成验证。

而像京东这样的电商平台,往往还会有额外的优惠券,教育优惠叠加额外促销优惠以后,价格基本可以完虐任何渠道的低价格,甚至是比老款的翻新产品还便宜。
而对于最常规的电商平台优惠来说,优惠力度最大的往往都是苹果官方的SKU,也就是各系列的入门款。比如对于14英寸来说,是这么几款比较容易有大的优惠。
以下提供的链接,一般还会有一些额外的优惠券,购买前别忘了活动页领取一下。
MacBook Pro M3 8GB + 512GB版本。
MacBook Pro M3 Pro 18GB + 512GB/1TB版本。
MacBook Pro M3 Max 36GB + 1TB版本。
而对于16英寸版本来说,则是这么几款。
MacBook Pro M3 Pro 18GB +512GB。
MacBook Pro M3 Max(14CPU + 30GPU) 36GB + 1TB版本。
MacBook Pro M3 Max(16CPU + 40GPU) 48GB + 1TB版本。
这里所说一句,其实任何促销优惠,都比不上一个理性、合适的选择。
比如对于你而言,M3就足以满足日常需求,但是非要考虑买M3 Pro,那么无论你找到何种优惠方式,最终的实际成本都要比买M3更高。同样的,18GB就是够用的内存,你非要升级36GB,结果即便给你教育优惠加额外的优惠券,实际的支付金额依然大于原价购买18GB版本!
重点是,超出自身需求的配置,真的不能给你带来任何体验提升呀!买任何数码产品,选配都要适可而止,不要让别人错误的认知影响到你自己的决策。
我是 @红叶绮罗香 ,觉得本文有帮助,不妨点赞关注哈!
Latest Answers
本站通过AI自动登载优质内容,本文来自于知乎作者:红叶绮罗香,仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除