苹果刚刚推出了新款 Mac Studio

71 天前
 Unclev21x

可选配 512GB 统一内存,有人冲吗?

5681 次点击
所在节点    Apple
46 条回复
wy315700
71 天前
好家伙,512G 内存。800G/s 内存带宽
noahhhh
71 天前
@bytesfold 所有苹果芯片的机器都不支持,那么大内存没 ECC 半个月就会出点问题
chandlerbing9317
71 天前
@ShadowPower #1 本来还感觉不到到底有多贵,你那么一说我就发现是真的贵了,毕竟一个月的 cursor 我都不舍得开
ShadowPower
71 天前
@bytesfold 只支持所有 DDR5 都支持的片上 ECC ,不过那是因为 DDR5 没有这玩意无法稳定使用……
像 Intel 、AMD 那种 CPU 和内存之间的 ECC 确实没有。
alexcding
71 天前
@gxt92 流言是晚些时候出新的 Mac Pro
alexcding
71 天前
@srwxyz studio 应该是 Max 起步吧.

M5 系列芯片将采用台积电的 SoIC (系统级集成芯片)封装技术。这种高密度 3D 芯片堆叠技术允许多个芯片直接垂直堆叠,从而实现更高的集成度和性能。特别是,苹果计划在 M5 Pro 、M5 Max 和 M5 Ultra 等高端型号中采用 SoIC-MH (水平成型) 2.5D 封装方式,以优化散热性能和生产良率。
auta
71 天前
@loveshuyuan 国补限额 2000 ,只能相当于一张优惠券。
mkdirmushroom
71 天前
@shuimugan 有人测 192GB 的 M2 Ultra 1.5bit 量化后的 671b R1 速度是 14t/s
mkdirmushroom
71 天前
@shuimugan 在内存带宽基本上没怎么变的情况下,我个人猜测目前即使是 512GB 的统一内存,速度也不会超过 20t/s
bytesfold
71 天前
@noahhhh 这确实很让人担心,这还怎么生产力呢。。
bytesfold
71 天前
@ShadowPower 长时间使用感觉还是用得上,最大 512G 结果没 ECC 。。话说 Nvidia 专业卡和非专业卡主要区别就是 ECC ,显存了
loveshuyuan
70 天前
@auta 2000 也不少了,在想要等国补还是首发买
WuSiYu
70 天前
@icyalala 算了下,都 q6 量化的话,只考虑权重访存,70b dense 模型(如 qwen )的理论极限是 20+ token/s ,R1 671B 的 moe 模型,每次激活 37B 参数,理论极限 40+ token/s ,实际考虑计算和 context 大概折半,用 q6 等量化还要打折

不算不能用,但也不算快,100b+的模型只能推 moe 的,但 moe 模型恰恰就是大规模场景才能把成本降下来(冗余专家并行)。所以除非有涉密需求,不如与其 7w+买个这,还是租 API 比较划算
WuSiYu
70 天前
@WuSiYu 打错了,前面是 q4
YsHaNg
70 天前
@billytom R1 qwen 70b 不是 moe 模型
icyalala
70 天前
@WuSiYu 其实如果单纯考虑 LLM 调用性价比的话,无论如何本地部署都比不上在线 API ,毕竟本地部署用户量上不来,也用不上 batch ,总的吞吐量肯定不那么经济。。。

但是单纯说 Mac 的话,它不一定只用于 LLM ,所以性价比没法直接比较
jqknono
70 天前
@shuimugan 跑 R1 就未必是 45token/s 的输出了
noahhhh
70 天前
@bytesfold 4090 也可以开 ecc ,只是有 1.5G 显存用于校验,性能也会损失
dongfanga
70 天前
@shuimugan 现在 qwen 新出的 32B 跟 R1 接近,那么用新的 Mac Studio 是否更具可用性?
shuimugan
69 天前
@dongfanga 可行啊,我玩了一天了,6bit 量化下回答质量和 grok3 差不多

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1116184

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX