我们的新款 Mac Studio,终于来啦,这次选的是 M2 Ultra 芯片。我还是觉得 Mac Studio 就得选 M2 Ultra 芯片,配置几乎都比 M2 Max 翻了一番,24 核 CPU + 60 核 GPU,再加 32 核神经网络引擎,这才是 Mac Studio 该有的价值,不过嘛,这价格也比 M2 Max 版翻了一小倍。除了 M2 Ultra 芯片,我们手里这台 Mac Studio 内存和硬盘都是次顶配的选择,128GB 内存和 4TB 的固态硬盘,官方售价 53999 元,往上其实还有 192GB 内存和 8TB 硬盘可选,但我觉得它各方面性能已经很够用了。一体式全铝金属机身,已经不是新设计了,但我还是觉得挺耐看的,果味还是很正。别看它个头大概就三台 Mac mini 叠一起大,亲自上手掂一掂,其实还挺沉的,特别是我们这个 M2 Ultra 的版本,七斤二两;这期视频搭景拍素材的小伙伴,提着它换了好几个景,也是会叨上两句。不过台式主机嘛,理论上平时就在桌面找个容身的位置,当个「摆件」,就不用怎么动了。但现实是,我平时要频繁接设备,重要和常用的接口基本都在机箱后面,每次都要转过来、移过去,后来嫌麻烦就干脆这样侧着放了,用得顺手对我来说更重要。聊到接口,这次这颗 HDMI 口,也终于升级到了 2.1,也就是说可以接 4K 240fps,或者 8K 60fps 的显示器跑了。除此以外,背面 3.5mm 音频口、USB-A、万兆网口,和雷雳 4 口,基本没有变化。正面,也还是 SD 卡槽,M2 Max 的这两枚 C 口还是 USB 3.1,M2 Ultra 才是雷雳 4,刀法依旧精准。今年的 Mac Studio 除了 SoC,它内部的供电、散热,结构堆叠等等,都几乎没改变,当然也包括它的外放扬声器。M2 Ultra,就是现在苹果性能最好的 M 系芯片,可以看作是两块 M2 Max 芯片用一种叫 Ultra Fusion 封装技术的「神奇胶水」组合成一块,理论上性能是 M2 Max 的两倍,各项性能也比上一代 M1 Ultra 提升了 20%~40%。我们也用了几款工具,对这台 Mac Studio 基础性能摸了个底,首先是 GeekBench 6,无论是单核心和多核心,M2 Ultra 的 CPU 部分就是现在苹果性能最好的,但放在整个 CPU 阵营,Intel 和 AMD 性能上都还是它的对手。测试图形渲染能力的 Cinebench,Mac Studio 单核心成绩是很不错的,多核心的渲染成绩也挺亮眼的。而专门考验 GPU 三维图像渲染的 3D Mark Wild Life Extreme,也几乎碰上了这项测试的天花板了。最后看这块 4TB 的固态硬盘,达芬奇的 BlackMagic 硬盘测试工具,5000 多的读取,和 6000 多的写入速度,可以说是相当快了。除了基础的读写速度,这个工具还做了不同视频规格和格式的解码测试,感兴趣的可以截图来看,总的来说它的视频解码覆盖还是挺广的。我们平时视频拍摄以 4K 60fps,10bit 色深,4 2 2 采样为主,这样的素材我们在达芬奇同时叠了 8 条视频轨,来回拖拽实时预览一点压力都没有。我们用达芬奇对比我们之前用的 M1 Max,导出同一个项目,M2 Studio 确实是更快了些,但差距其实也并没有想象中大。「性能」对于用了 M2 Ultra 的 Mac Studio 来说就是「信手拈来」的,但除了影视、音乐、图像等媒体创作领域,我们却很少在其它专业领域看到 Mac 的身影,原因还是「macOS 生态」这个老生常谈的问题。这么多年来苹果其实并没有坐以待毙,一直在引导开发者将自家的软件、甚至是游戏往 macOS 迁移,像前段时间 WWDC 推出的 Game Porting Toolkit 转译工具,开发者可以把 Windows 上的 DX 12 游戏转译到 macOS 平台上试运行。本意只是给开发者评估移植的成本,现在网上已经有不少用这套工具,把《赛博朋克 2077》、《霍格沃茨之遗》、《埃尔登法环》这些 Windows 平台 3A 大作移植到 macOS 运行的案例 —— 这对我们普通大众来说,成本还是太高,但已经大大降低了开发者的开发和移植的门槛,未来 macOS 的游戏和专业工具生态,还继续需要苹果和开发者们共同努力,现在我们还得让子弹再多飞一会。不过,苹果「飞」了好几年的 M 系列芯片架构优势,最近正好踩中了时下大热的赛道,那就是 AI 模型的训练。作为桌面级 SoC,苹果 M 系芯片除了 ARM 架构这一点跟 Intel、AMD 这些传统芯片不同以外,它的「统一内存」架构也是消费市场上独一家的存在。所谓的「统一内存」可以简单理解成,SoC 内的 CPU 和 GPU 共用同一套高速的内存,大内存对今天的 CPU 来说,已经有边界效应了;但 AI 赛道空前火热的今天,我们需要知道 AI 模型的训练是很吃 GPU 性能和显存的,而提高统一内存这条「长板」,就等于整体往 GPU 倾斜了;况且 M2 Ultra 的内存带宽有 800Gbps,隔壁英伟达市售的次旗舰显卡 RTX4080,带宽其实也就不到 800Gbps,最强显卡 RTX4090 虽然有 1.1Tbps 的带宽,但是显存也就 24GB,就这个角度比较的话,M2 Ultra 在 AI 训练领域有它优势 —— 而这次苹果把 Mac Studio 的内存提到了 192GB,我觉得有 AI 相关运用的考虑,而下一代 Mac Studio 也很有可能再进一步,把顶配内存推到 256GB,只是不知道明年 M3 Ultra 发布的时候我会不会被打脸。把 Mac Studio,当作本地 AI 模型训练机的案例已经越来越多了,跑大模型的能力我暂时还没有,但是我可以用模型来做本地的 AI 跑图啊。前段时间本地 AI 图片生成工具 Stable Diffusion 已经兼容苹果的 CoreML 机器学习架构,我这里就花了大半天时间来部署,来亲自看看 Mac Studio 这套硬件的跑图效率。我这里部署的 Stable Diffusion 是 1.5.1 的版本,模型是从网上随便找的,7.7GB 不算太大,因为生成图片的质量跟提供的模型、提供的文本或图片精细度,还有采样方法等都有关系,这里我们不看生成的图片效果,只看跑图速度。这里我先把参数设置成这样,只生成一张照片,把采样迭代步数拉到最高的 150,这里理论上采样迭代步数越多,生成的图片质量也就越高,接着输入关键句,1 分 02 秒就能生成一张 810 × 810 的图片 —— 这速度对于本地 AI 图片生成来说,已经是很快了。接着我们再加大难度,同样的参数,把生成的图片提到 10 批,每批同时产生 8 张图片,但把迭代步数降低到 20 步,最终耗时 21 分 08 秒,一共生成了 80 张质量不等的图片,这个速度在今天看来还是挺可观的。跑图过程打开了「活动监视器」,发现 Mac Studio 的大运存基本没啥压力,机身的发热虽然明显,但还是很安静的,靠近的时候才隐约听到机内风扇的散热声,如果是 Windows 平台,估计风扇已经在咆哮了 —— 这就是 ARM 简单指令集架构高能耗比的功劳了。我这方面能力实在是有限,这里的 Stable Diffusion 跑图测试,其实也就只是碰到皮毛而已,现在还在学习研究的过程,如果发现了测试的不严谨,还请各位看官指出、交流。用过 M2 Ultra 的 Mac Studio,再回看苹果 M 系芯片这棵树,短短几年,它已经越来越茂盛了,特别是这半年,AI 的枝头已经慢慢开了花 —— 如今的苹果在 AI 领域的生态还确实还远不如英伟达,但硬件的优势其实就在这摆着,潜力确实比较大,但生态这一步是需要花大很大精力补足的,所幸已经开始有越来越多的开发者,在为苹果 AI 开发生态,添砖加瓦。好,这期关于 M2 Ultra 版 2023 款 Mac Studio 的体验就是这些了,如果觉得对你有些帮助,欢迎关注点赞收藏转发,这里是 WHYLAB,咱们下期再见。