parad

parad

🏢  16x Eval
V2EX 第 466908 号会员,加入于 2020-01-27 21:30:24 +08:00
今日活跃度排名 20683
parad 最近回复了
7 天前
回复了 wind1986 创建的主题 程序员 怎么通过人工智能玩游戏
@wind1986 想快速上手的话直接跑 stablebaseline3 ,调参数。

要系统学习的话从 reinforcement learning 的最开始学。MDP ,DQN ,PPO 。youtube 上应该很多。

要练手的话参加 kaggle simulation 类别的比赛,比如 lux challenge ,还有 MIT battlecode 。
7 天前
回复了 wind1986 创建的主题 程序员 怎么通过人工智能玩游戏
TypeScript 的话可以看看这个 lib ,里面有 DQN 和 PPO 。目前我在维护:

https://github.com/StoneT2000/rl-ts
7 天前
回复了 wind1986 创建的主题 程序员 怎么通过人工智能玩游戏
我之前写过 3 个 AI 玩游戏的 mobile app ,欢迎参考

https://ai-simulator.com/
Cursor 最新版本 0.49 好像开始限制 context 了,我手动 @的文件还要 agent 再 100 行,100 行的读。

如果是多文件,大 context ,可以试试我开发的 16x Prompt 工具,比较手动但是更可控,没有奇怪的 context 算法,能发挥模型原本的 100 %的能力。
12 天前
回复了 llej 创建的主题 程序员 基于 Effect 的后端 api 设计
看来来有点像 Ramda https://ramdajs.com/
Polar.sh 好像最近比较流行。可以试试。
@frankies 数据分析是 Data Analytics 或者 Business Analytics ,和数据科学 Data Science 有很大区别。Data science 现在和 AI 基本一个意思。
在国外生活多年,这两个专业对我来说没有任何区别。
26 天前
回复了 csfreshman 创建的主题 投资 美股 20%仓位亏了 10 个,心痛的无法呼吸
@zhy91 从公开的 trade deficit 数据来看是美国进口中国的大于中国进口美国的。跟你说的是正好反的。这也是美国增加关税最根本的理由。
@paranoiagu 也算是正常的。Ollama 内部是有些自己的逻辑的。

Reddit r/LocalLLaMA 和 Hacker News 我记得有人反馈同样的问题。

你也可以在那里 post 你的测试结果。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3790 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 10:24 · PVG 18:24 · LAX 03:24 · JFK 06:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.