V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lemonTreeTop
V2EX  ›  Local LLM

目前性价比最高的跑本地大模型显卡是?

  •  
  •   lemonTreeTop · 1 天前 · 1000 次点击
    16 条回复    2025-06-05 20:13:53 +08:00
    ihainan
        1
    ihainan  
       1 天前
    多大的模型。
    atom42
        2
    atom42  
       1 天前
    mac mini ?
    lemonTreeTop
        3
    lemonTreeTop  
    OP
       1 天前
    @ihainan 效果比较好的
    lemonTreeTop
        4
    lemonTreeTop  
    OP
       1 天前
    @ihainan 比如可以跑 gemma3 27b
    coefuqin
        5
    coefuqin  
       1 天前
    在线 api 。
    Greendays
        6
    Greendays  
       1 天前   ❤️ 1
    不考虑改装显卡的话,4060ti 16G ?或者 3060 12G ?不过这些都跑不了 32B 模型,撑死了 14B 。Mac mini 用 36G 统一内存能跑 32B 模型,但是速度据说很慢的。
    xziar
        7
    xziar  
       1 天前
    来两张 16G 的卡开 TP 跑呗,4bit 能开很长的上下文了
    chen1210
        8
    chen1210  
       1 天前   ❤️ 1
    gemma3 27b 啊。M4Pro 吧
    defaqman
        9
    defaqman  
       1 天前
    4080 我感觉挺不错的,显存以及性能都不错
    murmur
        10
    murmur  
       1 天前
    本地大模型纯玩具啊,量化模型效果差的 1b ,不如去买 api ,还是画画涩图,处理下音乐提取个伴奏靠谱点

    但是人家也是 NV+win 就是一键包,什么环境不需要双击就用,mac 对不起自己折腾代码去吧
    lemonTreeTop
        11
    lemonTreeTop  
    OP
       1 天前
    好家伙🤭,标签给推荐了 3090 ,查了下是 24G 显存,能跑 gemma3 27b 量化版本
    woojanelook
        12
    woojanelook  
       1 天前   ❤️ 1
    魔改的 2080ti 22g 2000 多,应该是最便宜的单张显存,刚好够跑 flux 模型
    YsHaNg
        13
    YsHaNg  
       1 天前 via iPhone
    @murmur 公司禁止使用 public provider 并且个人文档经常需要召回护照号之类的还是算了 ollama run 一下也没啥难的 发现中美真的非常喜欢调 api
    irrigate2554
        14
    irrigate2554  
       1 天前   ❤️ 1
    @lemonTreeTop 2080ti 22G 不仅可以跑,还快,上下文还多
    mumbler
        15
    mumbler  
       1 天前
    2080 ti 22G 没有之一,2500 元左右,支持 nvlink 两块并联 44G
    mumbler
        16
    mumbler  
       1 天前
    @murmur #10 这个观点已经非常落后了,本地有本地的场景,比如合同审核,本地用 qwen3 30B 都做得非常好了,纯 CPU 就能流畅运行,哪个公司的合同敢传云端 API 去处理
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2844 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 04:02 · PVG 12:02 · LAX 21:02 · JFK 00:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.