CVS 技术 — 混合 RAG、5 路并行检索、RRF 融合与诚实弃权

摄入

五阶段摄入流水线，将一份文档变成可检索的证据。

CVS 直接对接您知识所在之处——SharePoint、Google Drive、Confluence、S3 以及本地文件服务器——随后通过三重 OCR 与视觉识别解析各种格式：PDF、扫描件、DOCX、PPTX、XLSX 和图片。表格、图形和页面锚点在解析中完整保留，因此原始证据日后可以被原样返回，而不是被转述抹平。

智能分块产出语义连贯的片段，而非盲目的固定宽度切分。每个分块都用实体、元数据、文档差异和时间事实加以富化，随后同时写入多层索引：用于语义召回的 pgvector 存储、用于精确词项的 BM25F 全文索引、用于关系的 Neo4j 时间知识图谱，外加元数据索引与时间索引。一次处理，五个检索面。

连接 SharePoint、Google Drive、Confluence、S3 和本地文件共享——无需复制粘贴式迁移
三重 OCR 加视觉富化，覆盖 PDF、扫描版 PDF、DOCX、PPTX、XLSX 和图片
语义分块，将表格、图形和页面锚点保留为一等证据
多层索引写入 pgvector、BM25F、Neo4j 时间知识图谱、元数据与时间存储

**五阶段摄入流水线，将一份文档变成可检索的证据。.** CVS 直接对接您知识所在之处——SharePoint、Google Drive、Confluence、S3 以及本地文件服务器——随后通过三重 OCR 与视觉识别解析各种格式：PDF、扫描件、DOCX、PPTX、XLSX 和图片。表格、图形和页面锚点在解析中完整保留，因此原始证据日后可以被原样返回，而不是被转述抹平。

路由

意图路由器将每条查询导向能够回答它的最低成本路径。

并非每个问题都值得跑一次完整的推理。中央意图路由器对每条查询进行分类，并将其分派到四条通道之一：即时的零 Token 缓存命中；标准的快速混合搜索；深度的多文档综合；或者将问题分解为子查询有向无环图 (DAG) 的超深推理路径。

这种节省 Token 的级联机制意味着简单问题永远不会唤醒昂贵的 LLM，而真正困难的多文档问题则会获得完整的分解处理。其结果是可预期的延迟、可预期的成本，以及没有每条查询的 Token 意外开销——仅级联机制本身，相比朴素 RAG 就能削减 85–95% 的 LLM 开销。

即时通道：面向重复和可轻易回答查询的零 Token 缓存
标准通道：面向大多数日常问题的快速混合搜索
深度通道：当单一来源不足时进行多文档综合
超深通道：将复杂问题拆解为可审计子步骤的分解 DAG

**意图路由器将每条查询导向能够回答它的最低成本路径。.** 并非每个问题都值得跑一次完整的推理。中央意图路由器对每条查询进行分类，并将其分派到四条通道之一：即时的零 Token 缓存命中；标准的快速混合搜索；深度的多文档综合；或者将问题分解为子查询有向无环图 (DAG) 的超深推理路径。

检索

5 路并行检索器，经 RRF 融合，由交叉编码器重排序。

CVS 同时运行五个检索器——向量搜索、知识图谱遍历、BM25F 全文、时间检索和元数据过滤。每个检索器以不同方式看待语料，因此能捕获不同的证据：语义、关系、精确词项、时间有效性和结构化属性。没有任何单一检索器需要做到完美。

它们的排序结果通过倒数排名融合 (RRF, k=60) 合并，随后交叉编码器对融合后的候选进行重排序，为答案构建器组装出一个精炼的证据集。这正是 CVS 能达到 94.7% 答案准确率的原因，而基础 RAG 或 Copilot 等单检索器系统通常只有 67–73%。

向量 (pgvector) + Neo4j 知识图谱 + BM25F + 时间 + 元数据，全部并行
倒数排名融合 (RRF, k=60) 将五个独立排序合并为一个共识排序
交叉编码器重排序在生成答案前精炼最终证据集
94.7% 答案准确率，对比单检索器系统的 67–73%

**5 路并行检索器，经 RRF 融合，由交叉编码器重排序。.** CVS 同时运行五个检索器——向量搜索、知识图谱遍历、BM25F 全文、时间检索和元数据过滤。每个检索器以不同方式看待语料，因此能捕获不同的证据：语义、关系、精确词项、时间有效性和结构化属性。没有任何单一检索器需要做到完美。

弃权

对抗性弃权：系统知道自己什么时候不知道。

检索之后，CVS 在回答之前会先问一个问题：证据是否充分？若充分，它会给出带行内引用的答案，并将这次交互写入防篡改的审计日志。若不充分，它会坦率地弃权，而不是编造一个听起来合理的回应——而正是「编造」这一行为，葬送了大多数企业 RAG 试点项目。

弃权并非死胡同。未被回答的问题会路由给指定的领域专家，他们经过验证的答案被捕获下来，知识库随之得到修补，从而让下一个人获得即时回应。在生产环境中，这将幻觉率压低至 2% 以下，而普通 RAG 约为 19%。

置信门控在生成任何答案之前评估证据是否充分
证据充分 → 带引用的答案加上一条完整的审计日志记录
证据不足 → 明确弃权，随后升级给专家
捕获的专家答案修补知识库——幻觉率低于 2%，而普通 RAG 约为 19%

**对抗性弃权：系统知道自己什么时候不知道。.** 检索之后，CVS 在回答之前会先问一个问题：证据是否充分？若充分，它会给出带行内引用的答案，并将这次交互写入防篡改的审计日志。若不充分，它会坦率地弃权，而不是编造一个听起来合理的回应——而正是「编造」这一行为，葬送了大多数企业 RAG 试点项目。

一份文档如何变成经过验证、可引用的答案。

五阶段摄入流水线，将一份文档变成可检索的证据。

意图路由器将每条查询导向能够回答它的最低成本路径。

5 路并行检索器，经 RRF 融合，由交叉编码器重排序。

对抗性弃权：系统知道自己什么时候不知道。

用您最棘手的问题来检验 CVS。