概要
企业 AI 问答平台:覆盖多源知识接入、三路混合检索、LangGraph 可恢复运行时、Agent 自主决策、推理优化与平台生态。
业务价值
将企业分散资料沉淀为可持续同步、可追溯引用、可配置 Agent 能力的 AI 问答平台,降低检索、答复、治理和后续集成成本。
工程深度
覆盖三路混合检索、LangGraph 编排、Agent 自主决策、工具生态、三层缓存、模型健康、分层指令、幻觉检测、Python SDK 与评测回归体系。
证据来源
本地仓库 README / AI_HIGHLIGHTS / docs/reference / core modules / tests / recent commits
仓库 · 置信度 高 · 验证时间 2026-06-10
- 证据级别:严格复核(核心区仅展示可复核指标)
- 来源类型:仓库/代码记录
- 来源链接:已提供公开链接,可独立复核
- 验证时间:2026-06-10(距今 7 天,时效性高)
判定原因:判定为高置信度:按严格口径整理,可回溯到仓库或代码记录,包含可访问来源链接,验证时间距今 7 天。
查看证据背景
企业资料分散在本地目录、Notion 等多源,业务希望把制度、FAQ、项目文档沉淀为可检索、可引用、可持续同步,并能支持多步 Agent 问答的知识平台。
挑战
传统单路检索难以同时覆盖标题、关键词与语义混合场景;Agent 模式如果缺少工具边界、反思、自主拆解、缓存治理和安全检测,也容易变成不可解释的高成本黑盒。
行动与成果
解决方案
- 搭建混合检索:结构、全文、向量三路召回配合 query rewrite、加权 RRF 与 rerank,提升复杂问题场景下的证据命中率。
- 重构 Agent 运行时:在 Gateway 与检索层引入 LangGraph,支持 checkpoint、interrupt/resume、
step_events、工具注册中心、任务拆解 DAG、反思闭环与三层记忆。 - 补齐平台治理:建设多知识库、多源连接器、batch dry-run/jobs、token-aware chunk、retrieve/debug、人工接管队列、五层指令合并、6 类场景模板、RAG 幻觉检测、企业聊天 v2 与 Python SDK。
- 强化推理与评测闭环:引入三层语义缓存、模型健康熔断、复杂度驱动路由、请求合并和 readyz/trace 诊断,并通过 retrieval fixture、local ingest fixture、22 个后端测试文件、9 个前端测试文件和 400+ 测试项约束回归。
成果
形成面向中文企业场景的 AI 问答平台,支持 grounded answer、引用溯源、多源同步、可解释检索调试、可恢复执行、Agent 自主决策、人工接管、推理治理和最小评测回归闭环。
关键指标
设计结构检索、全文检索、向量检索三路召回链路,结合加权 RRF 融合与 rerank,支持 `citations`、`grounding_score` 与 `trace_id` 返回。 将 Gateway 问答链路与 KB 检索链路改造为 LangGraph 可恢复运行时,并扩展工具注册中心、任务拆解 DAG、反思闭环与三层记忆。 建设 ingest 与知识治理工作台,支持多知识库、多源连接器、chunk 治理、retrieve/debug、五层指令合并、场景模板与 RAG 幻觉检测。 落地三层语义缓存、模型健康熔断、复杂度驱动路由、请求合并、人工接管队列、readyz/trace 诊断与 Python SDK,并用 22 个后端测试文件、9 个前端测试文件和 400+ 测试项覆盖 Agent 能力、推理优化和平台生态。 技术栈
FastAPILangGraphVue 3PostgreSQLQdrantRAGFastEmbedDockerLangChainAgent RuntimePython SDK