1
concernedz 50 天前
dify ?
|
![]() |
2
jiangbingo 50 天前
文档需要预处理,并且使用嵌入模型进行 indexing 啊,不然如何根据问题去查询?
|
![]() |
3
YJi 50 天前
RAG 的主要流程是你上传文件后解析进行向量化,然后通过你的提问从向量数据里找到相关数据做重排序再作为补充资料 让大模型分析输出给用户。 你说的不想上传如果是不想暴露私有数据,那你本地部署模型做这一套东西就好了。
|
5
iOTOi OP @jiangbingo 做本地大模型它也需要上传的动作么?
|
6
iOTOi OP @concernedz 不太懂各家的模型搭建
|
![]() |
7
jiangbingo 50 天前 ![]() 大模型跟嵌入模型不是同一个东西,嵌入模型是实现文档 indexing 和 query 。大模型是重写 query ,根据提示词,查询嵌入模型召回的 embedding 来组织回答。
|
![]() |
8
YJi 50 天前 ![]() @iOTOi #4 上传这个动作是为了把数据向量化,然后做向量检索找到自家内部知识里与问题相关的信息。所以你不用纠结上传这个动作,如果你自己的数据已经向量化好了,只需要在回答问题前先从向量库检索数据作为辅助内容问大模型就好了, 这是之前在论坛看到 V 友分享的链接,你可以看看有助于你理解 RAG https://www.bestblogs.dev/feeds?collection=rag
|