RAG 的主流用法似乎是客服机器人 & 公司文档库。这套用法可以用来“这是我喜欢的文风，你帮我按这种文风情节写小说”吗？

55 天前

BraveXaiver

另外我本地用 ollama 装了 embding 和 postgresql 用作向量数据库，但 chat API 仍然是用的在线的 API ，有点好奇到底发生了什么线上的那个 API 知道了我本地的向量数据。

谢谢

1040 次点击

所在节点

6 条回复

akira

55 天前

1. 先去知识库（向量数据库）获取你要的信息
2. 把获取到的信息和你的问题一起丢给 LLM

akira

55 天前

抱歉回车按错了。
3. 所以 llm 那边不管是在哪，自然都能获得你本地向量数据库的信息了。

BraveXaiver

55 天前

@akira #2 那合着每次调用 chat AI 时都程序都有大量上下文跟过去呗。。

mumbler

55 天前

是你的客户端把向量库检索结果和问题一起发给在线 API 的

ZeroClover

55 天前

RAG 并不适合创造性的工作，相反大部分 RAG 是在试图严格限制 AI 的创造性来避免产生幻觉。

而且，丢过去一堆内容并不能让 AI 真正理解你希望的「文风」到底是什么，用 RAG 的手段更是会让 AI 直接偷懒从知识库里面复制粘贴

要让 AI 的输出贴近某种风格正确的方法是微调

lisxour

54 天前

最近也在研究这玩意，就不能自己用一堆的小说炼出一个专门的 ai ？网上搜一堆资料也没这方面的知识

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.