V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jdz
V2EX  ›  程序员

O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序

  •  1
     
  •   jdz · 5 天前 via Android · 3008 次点击
    28 条回复    2025-05-06 12:24:24 +08:00
    jdz
        1
    jdz  
    OP
       5 天前 via Android
    编程能力
    crackidz
        2
    crackidz  
       5 天前   ❤️ 1
    laogui
        3
    laogui  
       5 天前   ❤️ 1
    事实上 o3 效果最好,用过就知道,但价格太贵,都不在考虑范围之内,都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet
    dbg
        4
    dbg  
       5 天前
    大模型 前端编程 排行榜
    https://web.lmarena.ai/leaderboard
    icyalala
        5
    icyalala  
       5 天前
    Cursor 官方统计: https://x.com/cursor_ai/status/1917982557070868739
    现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ,但是 o3/o4-mini 增长很快
    Numeron
        6
    Numeron  
       5 天前
    https://aider.chat/docs/leaderboards/
    Leoking222
        7
    Leoking222  
       5 天前
    编程无脑 Claude 3.7 就对了,目前没对手
    lneoi
        8
    lneoi  
       5 天前
    Gemini2.5 pro 很厉害,加上上下文足够大
    murmurkerman
        9
    murmurkerman  
       5 天前 via iPhone
    genimi 2.5 pro
    huluhulu
        10
    huluhulu  
       5 天前
    genimi 2.5 pro ,尤其是大段代码重构的时候,简直无敌。
    nanjoyoshino
        11
    nanjoyoshino  
       5 天前
    我投 Claude 一票,有一次一个关于 redis memory usage 命令的东西,全部问了一遍,只有 Claude 第一次就回答了正确答案,其它的始终都没有给出正确答案
    Zhoukker
        12
    Zhoukker  
       5 天前
    o3 非常强。就是门槛和价格,综合考虑还是 2.5pro
    yibie
        13
    yibie  
       5 天前
    已转 gemini
    ShadowPower
        14
    ShadowPower  
       5 天前
    写前端或者新写独立的代码的时候,claude 3.7 强
    对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强
    godqueue
        15
    godqueue  
       5 天前
    gemini 感觉最新的内容会比较好,比如最新的 springboot3 以上的版本,他就能给出正确的答案;其他的会差一些
    但是编程整体应该是 Claude 最强
    yueyingky
        16
    yueyingky  
       5 天前
    以前用 3.7 ,现在觉得 genimi 2.5 pro 更好用
    ooops
        17
    ooops  
       5 天前
    个人实测 3.7 3.5 > 2.5pro
    aarontian
        18
    aarontian  
       5 天前
    平时用 cursor 写 go 和 python 多些,经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档,但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强(实际写代码时候不那么准确)

    以及 claude 在多轮对话和中断重启的时候容易丢失上下文,我有时候会让 gemini 总结一下我的要求,列计划,然后切换到 claude 3.7 去执行

    o3/o4-mini 没怎么试过
    yulon
        19
    yulon  
       5 天前
    Claude 原生很积极使用 tool ,别的模型估计提示词写多一点也行,但是为什么要写呢
    azraeljack
        20
    azraeljack  
       4 天前
    cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7
    Derek0310
        21
    Derek0310  
       4 天前
    怎么选 Gemini 的大多数都把这个单词打错了?
    anivie
        22
    anivie  
       4 天前
    gemini ,断崖领先不是吹的
    morewe
        23
    morewe  
       4 天前
    @Derek0310 你不说我都没注意,然后仔细一看,还真是,没数错的话看到了 4 个,怀疑是不是后面几个人懒得打字,直接复制前面的人的了。结果都抄错了。
    chanChristin
        24
    chanChristin  
       4 天前 via Android
    gemini2.5 吧,主要是能白嫖,claude 没有白嫖到
    godqueue
        25
    godqueue  
       3 天前
    试了下 cursor 里的 gemini2.5-pro 发现真不错;
    代码上下文能力强很多。。比 claude 3.7 好。。claude 3.7 的上下文太小。。经常忘记东西
    godqueue
        26
    godqueue  
       2 天前
    只能用 gemini2.5-pro 做总结,然后写代码细节还是 claude 3.7 好
    solider245
        27
    solider245  
       2 天前   ❤️ 1
    穷人套餐+deepseekv3+geminipro2.5
    jdz
        28
    jdz  
    OP
       2 天前 via Android
    @solider245 关键问题是穷人套餐还很强
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5364 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 06:00 · PVG 14:00 · LAX 23:00 · JFK 02:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.