M3 Ultra 的 Mac studio 或许是本地部署大模型的最佳利器？

93 天前

unboy

144 总核心，512G 统一内存，819G/s 带宽，超越 M1 Ultra16.9 倍的 LLM 令牌生成速度，看起来是本地部署 LLM 的最佳利器？双机 EXO 或单机 INT4 即可部署 Deepseek 671B 全量模型？

1677 次点击

所在节点

8 条回复

Donaldo

93 天前

exo 会让速度变慢很多。

mumbler

93 天前

只是为了能跑的话，阿里云租一台 512G 内存 ECS ，一个小时几元钱而已，但慢得完全不可用

其实不用追求 671B ，按目前发展速度，明年 70B 或者 32B 就能达到现在 671B 的水平

ajaxfunction

93 天前

@mumbler 阿里云的 512g 内存，和 mac 的 512g 内存不是一回事吧。
mac 是内存=显存，

mayli

93 天前

最佳指的是体积最小？

whileFalse

93 天前

我来发表暴论：需要自己研究怎么部署 671B 的人，99%不需要本地 671B 。

mandex

92 天前

怎么不是 M4 Ultra 啊？

idblife

92 天前

@Donaldo
实际测试过？

Donaldo

92 天前

@idblife #7 是啊，它传输靠的是网络。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.