CVS 是一款专为无法容忍「自信错误答案」的企业打造的混合 RAG 引擎。摄入、路由、检索和弃权的每一个环节,都旨在产出可供审计的证据,而非只能凭信任接受的文字。
CVS 直接对接您知识所在之处——SharePoint、Google Drive、Confluence、S3 以及本地文件服务器——随后通过三重 OCR 与视觉识别解析各种格式:PDF、扫描件、DOCX、PPTX、XLSX 和图片。表格、图形和页面锚点在解析中完整保留,因此原始证据日后可以被原样返回,而不是被转述抹平。
智能分块产出语义连贯的片段,而非盲目的固定宽度切分。每个分块都用实体、元数据、文档差异和时间事实加以富化,随后同时写入多层索引:用于语义召回的 pgvector 存储、用于精确词项的 BM25F 全文索引、用于关系的 Neo4j 时间知识图谱,外加元数据索引与时间索引。一次处理,五个检索面。
并非每个问题都值得跑一次完整的推理。中央意图路由器对每条查询进行分类,并将其分派到四条通道之一:即时的零 Token 缓存命中;标准的快速混合搜索;深度的多文档综合;或者将问题分解为子查询有向无环图 (DAG) 的超深推理路径。
这种节省 Token 的级联机制意味着简单问题永远不会唤醒昂贵的 LLM,而真正困难的多文档问题则会获得完整的分解处理。其结果是可预期的延迟、可预期的成本,以及没有每条查询的 Token 意外开销——仅级联机制本身,相比朴素 RAG 就能削减 85–95% 的 LLM 开销。
CVS 同时运行五个检索器——向量搜索、知识图谱遍历、BM25F 全文、时间检索和元数据过滤。每个检索器以不同方式看待语料,因此能捕获不同的证据:语义、关系、精确词项、时间有效性和结构化属性。没有任何单一检索器需要做到完美。
它们的排序结果通过倒数排名融合 (RRF, k=60) 合并,随后交叉编码器对融合后的候选进行重排序,为答案构建器组装出一个精炼的证据集。这正是 CVS 能达到 94.7% 答案准确率的原因,而基础 RAG 或 Copilot 等单检索器系统通常只有 67–73%。
检索之后,CVS 在回答之前会先问一个问题:证据是否充分?若充分,它会给出带行内引用的答案,并将这次交互写入防篡改的审计日志。若不充分,它会坦率地弃权,而不是编造一个听起来合理的回应——而正是「编造」这一行为,葬送了大多数企业 RAG 试点项目。
弃权并非死胡同。未被回答的问题会路由给指定的领域专家,他们经过验证的答案被捕获下来,知识库随之得到修补,从而让下一个人获得即时回应。在生产环境中,这将幻觉率压低至 2% 以下,而普通 RAG 约为 19%。