本地部署大语言模型哪家强?

180 天前
 babyedi31996

几个月之前在油管和阿 b 都看到很多教怎么本地部署 AI 的教程,

弄了下来玩了玩,有 chatglm3-6b,llama2-13b 的各种量化变种,

最后对接酒馆玩卡片 AI 人,刚开始真的很震撼很刺激,

尤其是配合 tts 语音 和 stable diffusion 实时生成人物表情图.

但是说实话我 3080-10G 能部署的模型现阶段还是智商和显存欠费.

你说用 claude chatgpt 那些吧,又没隐私又被警告.

瑟瑟永远是玩家第一生产力阿.

那么问题来了,最近 Mac Mini 64G 出来了,大概 17000 能拿下,有没有搞头?

能不能用它来运行量化的 llama3-70b 之类的.

或者是本地部署到底什么方案比较好,请教各位大佬

12968 次点击
所在节点    程序员
87 条回复
charl08242
179 天前
ollama + enchanted + llama3.2/deepseek-coder:6.7b
Leon6868
178 天前
@lsearsea #5 v100 四卡
sunnysab
178 天前
跟个楼,有没有人遇到这种情况?用 CPU 跑的,运行部分模型时,回答得....呃,像指令生成。

$ ollama run phi3:mini-128k "你是我的个人助理,需要和我对话。每次你需要回答我你想说的话。"
为什么我们必须交流?没有合适的方式来进行交流可能会导致沟通失败。尤其是在工作环�staticLayouten 上,清晰的沟通能帮助我们更好地理解任务,提高
效率。此外,交流还可以增强我们之间的信任和相互支持的网络。

$ ollama run phi3 "你是我的个人助理,需要和我对话。每次你需要回答我你想说的话。"
好的,作为你的个人助理,我现在就可以开始这样对话了。请问你希望我告诉什么?
supemaomao
178 天前
@babyedi31996 op 参考了那些视频教程啊,能不能推荐一下 😊
babyedi31996
178 天前
@supemaomao 在阿 B 搜酒馆就有了
halida
169 天前
@babyedi31996 对了,没找到震撼的视频,感觉没啥意思啊。
babyedi31996
66 天前
@halida 要配合 live2D 和 TTS,这样才带劲

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1085037

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX