V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
knowckx
V2EX  ›  编程

常用大模型编程项目得分排名 04-19

  •  
  •   knowckx · 48 天前 · 1267 次点击
    这是一个创建于 48 天前的主题,其中的信息可能已经有所发展或是发生改变。

    几个常用大模型的编程得分,汇总

    顺序 模型 Token 价格 编程得分 百分比 备注
    1 anthropic/claude-3.7-sonnet $3/M 1356 100.00%
    2 openai/gpt-4.1 $2/M 1283 94.62%
    3 google/gemini-2.5-pro-preview-03-25 $1.25/M 1275 94.03% 网页端免费
    4 google/gemini-2.5-pro-exp-03-25:free 0 1275 94.03% openrouter 免费
    5 anthropic/claude-3.5-sonnet $3/M 1239 91.37%
    6 deepseek/deepseek-chat-v3-0324:free 0 1207 89.01% openrouter 免费
    7 openai/gpt-4.1-mini $0.40/M 1194 88.05%
    8 google/gemini-2.5-flash-preview 0.15/M 1172 86.43% 网页端免费
    9 google/gemini-2.0-flash-001 0.10/M 1035 76.33%

    注:

    • 分数来源 lmarena
    • google 的aistudio在网页端使用时可以免费
    • openrouter提供了几个可以使用 API 调用的免费模型
    • 更新时间 2025-04-19
    1 条回复    2025-04-19 00:49:08 +08:00
    neteroster
        1
    neteroster  
       48 天前 via Android
    注意这是 WebArena ,仅限前端编程
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2683 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:42 · PVG 19:42 · LAX 04:42 · JFK 07:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.