O3， O4mini-high， claude3.7， Gemini2.5pro 编程能力该怎么排序

28 条回复 • 2025-05-06 12:24:24 +08:00

1

jdz

OP

5 天前 via Android

编程能力

2

crackidz

5 天前

1

没有最好，选择合适的 https://composio.dev/blog/gemini-2-5-pro-vs-claude-3-7-sonnet-coding-comparison/

3

laogui

5 天前

1

事实上 o3 效果最好，用过就知道，但价格太贵，都不在考虑范围之内，都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet

4

dbg

5 天前

大模型前端编程排行榜
https://web.lmarena.ai/leaderboard

5

icyalala

5 天前

Cursor 官方统计： https://x.com/cursor_ai/status/1917982557070868739
现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ，但是 o3/o4-mini 增长很快

6

Numeron

5 天前

https://aider.chat/docs/leaderboards/

7

Leoking222

5 天前

编程无脑 Claude 3.7 就对了，目前没对手

8

lneoi

5 天前

Gemini2.5 pro 很厉害，加上上下文足够大

9

murmurkerman

5 天前 via iPhone

genimi 2.5 pro

10

huluhulu

5 天前

genimi 2.5 pro ，尤其是大段代码重构的时候，简直无敌。

11

nanjoyoshino

5 天前

我投 Claude 一票，有一次一个关于 redis memory usage 命令的东西，全部问了一遍，只有 Claude 第一次就回答了正确答案，其它的始终都没有给出正确答案

12

Zhoukker

5 天前

o3 非常强。就是门槛和价格，综合考虑还是 2.5pro

13

yibie

5 天前

已转 gemini

14

ShadowPower

5 天前

写前端或者新写独立的代码的时候，claude 3.7 强
对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强

15

godqueue

5 天前

gemini 感觉最新的内容会比较好，比如最新的 springboot3 以上的版本，他就能给出正确的答案；其他的会差一些
但是编程整体应该是 Claude 最强

16

yueyingky

5 天前

以前用 3.7 ，现在觉得 genimi 2.5 pro 更好用

17

ooops

5 天前

个人实测 3.7 3.5 > 2.5pro

18

aarontian

5 天前

平时用 cursor 写 go 和 python 多些，经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档，但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强（实际写代码时候不那么准确）

以及 claude 在多轮对话和中断重启的时候容易丢失上下文，我有时候会让 gemini 总结一下我的要求，列计划，然后切换到 claude 3.7 去执行

o3/o4-mini 没怎么试过

19

yulon

5 天前

Claude 原生很积极使用 tool ，别的模型估计提示词写多一点也行，但是为什么要写呢

20

azraeljack

4 天前

cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7

21

Derek0310

4 天前

怎么选 Gemini 的大多数都把这个单词打错了？

22

anivie

4 天前

gemini ，断崖领先不是吹的

23

morewe

4 天前

@Derek0310 你不说我都没注意，然后仔细一看，还真是，没数错的话看到了 4 个，怀疑是不是后面几个人懒得打字，直接复制前面的人的了。结果都抄错了。

24

chanChristin

4 天前 via Android

gemini2.5 吧，主要是能白嫖，claude 没有白嫖到

25

godqueue

3 天前

试了下 cursor 里的 gemini2.5-pro 发现真不错;
代码上下文能力强很多。。比 claude 3.7 好。。claude 3.7 的上下文太小。。经常忘记东西

26

godqueue

2 天前

只能用 gemini2.5-pro 做总结，然后写代码细节还是 claude 3.7 好

27

solider245

2 天前

1

穷人套餐+deepseekv3+geminipro2.5

28

jdz

OP

2 天前 via Android

@solider245 关键问题是穷人套餐还很强