RAG 的主流用法似乎是客服机器人 & 公司文档库。这套用法可以用来“这是我喜欢的文风,你帮我按这种文风情节写小说”吗?

55 天前
 BraveXaiver
另外我本地用 ollama 装了 embding 和 postgresql 用作向量数据库,但 chat API 仍然是用的在线的 API ,有点好奇到底发生了什么线上的那个 API 知道了我本地的向量数据。

谢谢
1040 次点击
所在节点    问与答
6 条回复
akira
55 天前
1. 先去知识库(向量数据库)获取你要的信息
2. 把获取到的信息和你的问题 一起丢给 LLM
akira
55 天前
抱歉回车按错了。
3. 所以 llm 那边不管是在哪,自然都能获得你本地向量数据库的信息了。
BraveXaiver
55 天前
@akira #2 那合着每次调用 chat AI 时都程序都有大量上下文跟过去呗。。
mumbler
55 天前
是你的客户端把向量库检索结果和问题一起发给在线 API 的
ZeroClover
55 天前
RAG 并不适合创造性的工作,相反大部分 RAG 是在试图严格限制 AI 的创造性来避免产生幻觉。

而且,丢过去一堆内容并不能让 AI 真正理解你希望的「文风」到底是什么,用 RAG 的手段更是会让 AI 直接偷懒从知识库里面复制粘贴

要让 AI 的输出贴近某种风格正确的方法是微调
lisxour
54 天前
最近也在研究这玩意,就不能自己用一堆的小说炼出一个专门的 ai ?网上搜一堆资料也没这方面的知识

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1125120

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX