首页 / 一份文档如何变成经过验证、可引用的答案。
技术

一份文档如何变成经过验证、可引用的答案。

CVS 是一款专为无法容忍「自信错误答案」的企业打造的混合 RAG 引擎。摄入、路由、检索和弃权的每一个环节,都旨在产出可供审计的证据,而非只能凭信任接受的文字。

摄入

五阶段摄入流水线,将一份文档变成可检索的证据。

CVS 直接对接您知识所在之处——SharePoint、Google Drive、Confluence、S3 以及本地文件服务器——随后通过三重 OCR 与视觉识别解析各种格式:PDF、扫描件、DOCX、PPTX、XLSX 和图片。表格、图形和页面锚点在解析中完整保留,因此原始证据日后可以被原样返回,而不是被转述抹平。

智能分块产出语义连贯的片段,而非盲目的固定宽度切分。每个分块都用实体、元数据、文档差异和时间事实加以富化,随后同时写入多层索引:用于语义召回的 pgvector 存储、用于精确词项的 BM25F 全文索引、用于关系的 Neo4j 时间知识图谱,外加元数据索引与时间索引。一次处理,五个检索面。

  • 连接 SharePoint、Google Drive、Confluence、S3 和本地文件共享——无需复制粘贴式迁移
  • 三重 OCR 加视觉富化,覆盖 PDF、扫描版 PDF、DOCX、PPTX、XLSX 和图片
  • 语义分块,将表格、图形和页面锚点保留为一等证据
  • 多层索引写入 pgvector、BM25F、Neo4j 时间知识图谱、元数据与时间存储
五阶段摄入流水线,将一份文档变成可检索的证据。. CVS 直接对接您知识所在之处——SharePoint、Google Drive、Confluence、S3 以及本地文件服务器——随后通过三重 OCR 与视觉识别解析各种格式:PDF、扫描件、DOCX、PPTX、XLSX 和图片。表格、图形和页面锚点在解析中完整保留,因此原始证据日后可以被原样返回,而不是被转述抹平。
路由

意图路由器将每条查询导向能够回答它的最低成本路径。

并非每个问题都值得跑一次完整的推理。中央意图路由器对每条查询进行分类,并将其分派到四条通道之一:即时的零 Token 缓存命中;标准的快速混合搜索;深度的多文档综合;或者将问题分解为子查询有向无环图 (DAG) 的超深推理路径。

这种节省 Token 的级联机制意味着简单问题永远不会唤醒昂贵的 LLM,而真正困难的多文档问题则会获得完整的分解处理。其结果是可预期的延迟、可预期的成本,以及没有每条查询的 Token 意外开销——仅级联机制本身,相比朴素 RAG 就能削减 85–95% 的 LLM 开销。

  • 即时通道:面向重复和可轻易回答查询的零 Token 缓存
  • 标准通道:面向大多数日常问题的快速混合搜索
  • 深度通道:当单一来源不足时进行多文档综合
  • 超深通道:将复杂问题拆解为可审计子步骤的分解 DAG
意图路由器将每条查询导向能够回答它的最低成本路径。. 并非每个问题都值得跑一次完整的推理。中央意图路由器对每条查询进行分类,并将其分派到四条通道之一:即时的零 Token 缓存命中;标准的快速混合搜索;深度的多文档综合;或者将问题分解为子查询有向无环图 (DAG) 的超深推理路径。
检索

5 路并行检索器,经 RRF 融合,由交叉编码器重排序。

CVS 同时运行五个检索器——向量搜索、知识图谱遍历、BM25F 全文、时间检索和元数据过滤。每个检索器以不同方式看待语料,因此能捕获不同的证据:语义、关系、精确词项、时间有效性和结构化属性。没有任何单一检索器需要做到完美。

它们的排序结果通过倒数排名融合 (RRF, k=60) 合并,随后交叉编码器对融合后的候选进行重排序,为答案构建器组装出一个精炼的证据集。这正是 CVS 能达到 94.7% 答案准确率的原因,而基础 RAG 或 Copilot 等单检索器系统通常只有 67–73%。

  • 向量 (pgvector) + Neo4j 知识图谱 + BM25F + 时间 + 元数据,全部并行
  • 倒数排名融合 (RRF, k=60) 将五个独立排序合并为一个共识排序
  • 交叉编码器重排序在生成答案前精炼最终证据集
  • 94.7% 答案准确率,对比单检索器系统的 67–73%
5 路并行检索器,经 RRF 融合,由交叉编码器重排序。. CVS 同时运行五个检索器——向量搜索、知识图谱遍历、BM25F 全文、时间检索和元数据过滤。每个检索器以不同方式看待语料,因此能捕获不同的证据:语义、关系、精确词项、时间有效性和结构化属性。没有任何单一检索器需要做到完美。
弃权

对抗性弃权:系统知道自己什么时候不知道。

检索之后,CVS 在回答之前会先问一个问题:证据是否充分?若充分,它会给出带行内引用的答案,并将这次交互写入防篡改的审计日志。若不充分,它会坦率地弃权,而不是编造一个听起来合理的回应——而正是「编造」这一行为,葬送了大多数企业 RAG 试点项目。

弃权并非死胡同。未被回答的问题会路由给指定的领域专家,他们经过验证的答案被捕获下来,知识库随之得到修补,从而让下一个人获得即时回应。在生产环境中,这将幻觉率压低至 2% 以下,而普通 RAG 约为 19%。

  • 置信门控在生成任何答案之前评估证据是否充分
  • 证据充分 → 带引用的答案加上一条完整的审计日志记录
  • 证据不足 → 明确弃权,随后升级给专家
  • 捕获的专家答案修补知识库——幻觉率低于 2%,而普通 RAG 约为 19%
对抗性弃权:系统知道自己什么时候不知道。. 检索之后,CVS 在回答之前会先问一个问题:证据是否充分?若充分,它会给出带行内引用的答案,并将这次交互写入防篡改的审计日志。若不充分,它会坦率地弃权,而不是编造一个听起来合理的回应——而正是「编造」这一行为,葬送了大多数企业 RAG 试点项目。

用您最棘手的问题来检验 CVS。

带上您最冷僻的规范,或者最频繁被升级的查询。我们将向您端到端展示证据路径——以及当知识库不知道答案时,究竟会发生什么。