V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
BraveXaiver
V2EX  ›  问与答

RAG 的主流用法似乎是客服机器人 & 公司文档库。这套用法可以用来“这是我喜欢的文风,你帮我按这种文风情节写小说”吗?

  •  
  •   BraveXaiver · 54 天前 · 1039 次点击
    这是一个创建于 54 天前的主题,其中的信息可能已经有所发展或是发生改变。
    另外我本地用 ollama 装了 embding 和 postgresql 用作向量数据库,但 chat API 仍然是用的在线的 API ,有点好奇到底发生了什么线上的那个 API 知道了我本地的向量数据。

    谢谢
    6 条回复    2025-04-14 12:04:03 +08:00
    akira
        1
    akira  
       54 天前
    1. 先去知识库(向量数据库)获取你要的信息
    2. 把获取到的信息和你的问题 一起丢给 LLM
    akira
        2
    akira  
       54 天前   ❤️ 1
    抱歉回车按错了。
    3. 所以 llm 那边不管是在哪,自然都能获得你本地向量数据库的信息了。
    BraveXaiver
        3
    BraveXaiver  
    OP
       54 天前
    @akira #2 那合着每次调用 chat AI 时都程序都有大量上下文跟过去呗。。
    mumbler
        4
    mumbler  
       54 天前
    是你的客户端把向量库检索结果和问题一起发给在线 API 的
    ZeroClover
        5
    ZeroClover  
       54 天前   ❤️ 2
    RAG 并不适合创造性的工作,相反大部分 RAG 是在试图严格限制 AI 的创造性来避免产生幻觉。

    而且,丢过去一堆内容并不能让 AI 真正理解你希望的「文风」到底是什么,用 RAG 的手段更是会让 AI 直接偷懒从知识库里面复制粘贴

    要让 AI 的输出贴近某种风格正确的方法是微调
    lisxour
        6
    lisxour  
       54 天前
    最近也在研究这玩意,就不能自己用一堆的小说炼出一个专门的 ai ?网上搜一堆资料也没这方面的知识
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2803 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 06:03 · PVG 14:03 · LAX 23:03 · JFK 02:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.