Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于RAG自建知识库检索问题 #328

Open
457775987 opened this issue Feb 8, 2025 · 4 comments
Open

关于RAG自建知识库检索问题 #328

457775987 opened this issue Feb 8, 2025 · 4 comments

Comments

@457775987
Copy link

我本地部署了deepseek-r1:32b,用的开源模型bge-m3把pdf导入到知识库,发现问出打答案很不准确,明明文档中有明确的问题答案,回答的对不上号,是哪里的问题?

@michaelhan1208
Copy link

我本地用的14b,+bge-m3,同你有差不多的疑问

@deepsicker
Copy link

看看你的代码

@deepsicker
Copy link

你的知识库是用什么数据库存的, chroma-db es 还是milvus? 结果不准确有很多中可能

1. 你的数据库并没有正确的结果

2. 你的提示词并不准确

3. 你的知识库 查询本来就不准确

@457775987
Copy link
Author

你的知识库是用什么数据库存的, chroma-db es 还是milvus? 结果不准确有很多中可能

1. 你的数据库并没有正确的结果(我用的AnythingLLM 自带的向量数据库LanceDB,整个操作也都在AnythingLLM上面)

2. 你的提示词并不准确

3. 你的知识库 查询本来就不准确

知识库的内容我是从一大段文本里面摘了一小部分,核心内容如下:
国家医疗保障疾病诊断相关分组(CHS-DRG)分组方案
一、主要诊断大类(MDC)目录
CHS-DRG 共分为 26 个主要诊断大类(MDC),如表 1-1 所示。
表 1-1 CHS-DRG 主要诊断大类(MDC)
序号 MDC 编码 MDC 名称
MDCA 先期分组疾病及相关操作
MDCB 神经系统疾病及功能障碍
MDCC 眼疾病及功能障碍
MDCD 头颈、耳、鼻、口、咽疾病及功能障碍
MDCE 呼吸系统疾病及功能障碍
MDCF 循环系统疾病及功能障碍
MDCG 消化系统疾病及功能障碍
MDCH 肝、胆、胰疾病及功能障碍
MDCI 肌肉、骨骼疾病及功能障碍
MDCJ 皮肤、皮下组织及乳腺疾病及功能障碍
...
共计26个大类,提示词为:CHS-DRG 共分为 几个主要诊断大类?分别是什么?

deepseek出来的结果是:

Image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants