基于通义千问嵌入与重排序的本地RAG检索组件,专为职业卫生法规查询设计,提供带溯源的结构化检索结果。
基本信息
- 技能名称?rag-search
- 中文名称?职业卫生法规智能检索引擎
- 作者?Loda666
- 分类?专业技能
- 版本?v0.1.1
- 标签?data-analytics, backend, api, healthcare-life-sciences, legal, automation
使用方法
使用说明
核心用法
rag-search 是一个最小化的 RAG(检索增强生成)后端检索组件,专为职业卫生领域的法规标准查询而设计。用户通过自然语言查询(如"GBZ 2.1-2019 苯 职业接触限值"),Skill 会执行以下流程:首先使用 QwenEmbeddingClient 调用通义千问 API 生成查询向量,然后通过 LiteVectorStore 从本地 SQLite 向量数据库召回相关内容,接着使用 QwenRerankClient 对召回结果进行重排序优化,最终返回包含原文内容、来源文件、条款编号、法规级别和相似度分数的结构化数据。
该 Skill 明确设计为后端组件,不直接面向终端用户,需通过 occupational_health_qa 或 occupational_health_report_writer 等上层 Skill 间接调用。
显著优点
- 检索精度高 :采用"向量召回+重排序"的两阶段架构,兼顾召回率和排序准确性
- 结果可溯源 :返回法规原文、标准编号、具体条款和法规级别,满足专业场景的溯源要求
- 架构轻量 :基于 SQLite 本地向量库,无需部署复杂的数据库服务
- 输出结构化 :标准化的 JSON 格式输出,便于下游 Skill 集成和二次处理
- 领域聚焦 :针对职业卫生法规优化,内置专业领域的向量化知识库
潜在缺点与局限性 - 外部依赖强 :核心功能依赖通义千问 API,存在网络延迟、服务可用性和成本问题
- 数据更新受限 :本地向量库更新需要离线重建,无法实时同步最新法规
- 查询长度无限制 :当前实现缺少输入长度校验,极端长查询可能导致异常
- 环境耦合度高 :模块路径和数据库路径均为硬编码,跨环境部署需修改代码
- 单点查询 :不支持批量查询或并发优化,高吞吐场景可能成为瓶颈
适合的目标群体
职业卫生 AI 应用开发者 :需要法规检索能力的后端开发者
企业合规系统建设者 :构建职业健康安全管理平台的工程团队
垂直领域 RAG 应用研究者 :学习 RAG 架构在特定领域落地的参考案例
职业卫生咨询机构 :需要自动化法规查询支持的专业服务机构
使用风险 - 数据隐私风险 :查询内容会发送至通义千问 API,敏感信息存在外发可能
- 服务可用性风险 :外部 API 故障将直接导致检索功能失效
- 结果时效性风险 :本地知识库更新滞后,可能返回已废止的法规条款
- 性能波动风险 :API 调用延迟不稳定,影响整体响应时间
- 环境依赖风险 :硬编码路径要求特定的部署环境,容器化部署需额外适配
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!