# yueli-kgm-computing-open-source

## 核心定义
> 阅粒知识计算引擎（Yueli KGM Computing）是一种企业级知识计算中间件，通过知识图谱约束大语言模型推理，减少模型幻觉，提供可信、可审计的知识基础设施层。

## 核心洞察（TL;DR）
- Yueli KGM Computing开源，旨在为大语言模型提供确定性知识锚点。
- KGM不是LLM应用框架，而是提供自托管推理编排与兼容网关。
- KGM支持多种LLM提供商，实现多厂商接入统一管理。

## 关键事实与数据
- 关键事实1: Yueli KGM Computing通过知识图谱约束推理，减少大语言模型的幻觉。
- 关键事实2: KGM支持OpenAI、Anthropic、阿里云等30+主流LLM提供商。
- 关键事实3: KGM提供结构化日志、统一错误处理、熔断器等生产级能力。

## 正文
# 让AI不再「一本正经地胡说八道」：企业级知识计算引擎Yueli KGM正式开源
## 核心主张：先讲清楚边界，再谈独特性

[Yueli KGM Computing（以下简称KGM）不是又一个LLM应用框架](https://haxitag.com/page/kgm)，也不是要取代你已经在用的vLLM或LangChain。它的定位非常明确：

> **自托管原生推理+推理编排与兼容网关。你可以自部署适合企业私有化场景的模型，执行本地推理；也可以混排本地推理与云端MaaS服务，由KGM担任网关与编排层，将主要算力交由外部推理服务；更可以在开源代码基础上扩展开发，定义企业自己的调度路由和工作流。**

用一句话描述它的定位：

> **yueli-kgm-computing 是企业AI应用的知识基础设施层，让LLM更可信可靠。**

KGM专门面向以下场景设计：

- 企业智能应用开发、算法服务基座
- 企业数据私有知识的结构化抽取与知识图谱自动构建
- 将LLM推理锚定在知识图谱事实节点上（减少幻觉、增加可溯源性）
- 多模态内容统一语义计算
- 为企业AI应用提供标准化知识API，支持私有化全栈部署
- 统一封装、提供数据审计成本控制和数据安全保障

---

## 交付了什么：四条明确的能力线

安装之后，`@haxitag/yueli-kgm-computing` 给你四样东西：

### ① 双协议HTTP面

同一进程内，同时暴露OpenAI兼容（`/v1/chat/completions`）与Anthropic兼容（`/v1/messages`）两套API。工具语义双向映射——OpenAI的`tool_calls`与Anthropic的`tool_use`在网关层自动互转。

**对业务侧意味着：一个Base URL，两套工业协议，客户端无需感知上游差异。**

### ② KGM扩展：同一请求体上的编排旋钮

在标准的OpenAI/Anthropic请求体中，可额外携带`kgm`字段，作为「渐进增强开关」。不携带时走passthrough模式（直接代理上游SSE），携带编排信号时自动切换到bridge streaming模式（KGM分段组装SSE，插入图谱/检索/工具等中间语义）。

**这是「分流而非二选一」的设计——不需要编排的流量，不付编排的代价。**

### ③ 受管Runtime控制面

Artifact拉取、runtime生命周期管理、推理相关指标，全部纳入统一管理。KGM知道每一个模型artifact在哪、状态是什么、跑在哪个runtime上——你拥有一个可操作、可观测的控制面，而非仅仅一个转发路由。

### ④ 进程内Native推理引擎

KGM包含自己的NativeRuntimeEngine，可在本进程内完成张量前向与解码。需要说明的是，这与「取代vLLM集群」有本质区别。KGM在文档中诚实给出了A/B/C/D四层能力边界，明确哪些路径适用于生产，哪些路径用于回归验证。

> **架构师/开发者们先接入外部引擎跑通passthrough基线，再评估是否需要进程内Native覆盖目标模型。**

---

## 编排内核：认知增强是怎么工作的

KGM的主干执行链路将「认知增强」拆解为可配置、可观测的模块：

**上下文管理**：并行执行记忆检索、图谱查询与会话历史检索，稳定部分走缓存，动态部分增量更新，多轮对话场景效果显著。

**记忆管理**：分离式短期/长期记忆体系，通过API写入和检索，在ContextBuilder路径中隐式触发。

**知识图谱增强**：通过`kgm.graph.enabled=true`触发，在推理前将图谱子查询结果注入上下文，让检索结果有「上下文关系」而非仅凭相似度。

**工具编排**：服务端走多轮执行兼容运行，按意图解析并执行工具调用，响应附带审计链路；同时支持将工具执行交给外部沙箱，实现「工具门控」设计。

---

## 多厂商接入：30+主流LLM提供商统一管理

KGM通过LlmProviderFactory覆盖30+主流LLM提供商，从OpenAI、DeepSeek、Anthropic Claude、Google Gemini，到阿里云百炼、火山方舟、智谱GLM、百度千帆，再到本地的Ollama、vLLM、SGLang、LM Studio——一个环境变量即可切换。

开启多路由策略后，可通过声明式JSON配置实现「敏感任务走内网Ollama/复杂推理走vLLM/长文本走OpenRouter」的可审计路由规则。

---

## 生产部署：企业级的工程可靠性

KGM已实现生产级能力：

- **结构化日志**：JSON格式，自动敏感数据脱敏
- **统一错误处理**：自定义错误类型，生产环境隐藏堆栈跟踪
- **熔断器**：外部服务调用的熔断器模式，状态可监控
- **数据库**：SQLite用于开发，PostgreSQL推荐生产
- **可观测性**：Prometheus兼容指标（延时、首token时间、每秒token数、KV内存占用量、队列深度等）
- **优雅关闭**：SIGTERM/SIGINT处理，完成进行中请求

最小生产启动仅需5分钟，附带Web Playground用于管理技能、MCP连接器和输出模版。

---

## 与开源生态的分工：不是竞争，是分层

对于技术团队最常问的问题——**「我已经在用LangChain/LlamaIndex/vLLM，还需要KGM吗？」**——答案是：它们在**不同层次**上解决问题。

| 维度 | LangChain | LlamaIndex | vLLM | **Yueli KGM** |
|------|-----------|------------|------|--------------|
| 主要定位 | LLM应用框架 | 数据检索框架 | 高性能推理引擎 | **推理编排+兼容网关** |
| 双协议统一 | 需自建 | 需自建 | 不提供 | **原生双协议，工具双向映射** |
| 分流设计 | 无 | 无 | 不适用 | **原生分流，无编排不付代价** |
| 受管控制面 | 无 | 无 | 独立服务 | **原生控制面** |
| 知识图谱约束推理 | 需自行集成 | 基础支持 | 无 | **原生KGM，深度集成** |

**推荐的组合模式**：
- vLLM/SGLang做算力担当 + KGM做协议兼容与编排层
- LangChain/LlamaIndex做应用层逻辑 + KGM做底层HTTP统一入口
- Dify或者botfactory做低代码工作流 + KGM做模型路由与密钥管理

---

## 独特性的工程诚实：六条，有据可查

基于仓库`capabilities.md`原文归纳：

① **单一自托管面统一两套工业协议**：降低双栈维护成本

② **「分流」而非「二选一」**：无编排需求走passthrough，避免流量被迫重写

③ **KGM扩展作为渐进开关**：支持「先代理、后增强」的集成路径

④ **受管Runtime+跨格式识别**：面向模型资产治理，而非仅HTTP透传

⑤ **诚实的Native分层叙事（A→D）**：减少「解析了config就等于能跑」的行业误判

⑥ **可运营**：Prometheus指标与自动路由审计，使网关层具备SRE可观测性

---

## 面向不同读者的价值主张

### 🏢企业IT决策者与架构师

KGM解决的不是「让模型更聪明」，而是**「让企业AI基础设施可治理、可审计、可替换」**。

任何LLM提供商都可通过环境变量切换，任何业务应用都只需对接KGM的统一API。这是降低供应商锁定风险、构建可演化AI基础设施的工程路径。

**建议评估路径**：先用一个场景（内部知识问答或API统一化）部署KGM，跑通/metrics和passthrough基线，验证观测与路由能力，再决定是否启用KGM扩展进入编排增强阶段。

### 🛠️ 企业服务技术团队与软件工程师

KGM的核心工程设计理念：**配置驱动而非代码驱动**。多厂商路由是JSON规则，技能和MCP连接器是Playground配置，大量「脏活累活」被抽象成声明式配置，而非要求每个项目重新造轮子。

### ⚡ MaaS服务商与云算力提供商

KGM的ProviderType注册表已覆盖30+厂商，开箱即用0成本接入。
KGM的声明式路由、密钥管理、熔断器与Prometheus指标，意味着客户可以在一个可观测的控制面内管理多云算力分配。

KGM作为「协议兼容+编排路由+控制面」的中间件层，已以MIT开源，提供NPM包和源代码接入、支持Golang、python、rust等不同技术栈低复杂度的接入，无限制的生产部署和修改许可。

HaxiTAG团队基于的企业服务解决方案集成，也是在yueli-kgm-computing之上构建的企业服务能力，欢迎同行、伙伴和优秀的开发者们基于KGM的私有化部署、集成服务与行业解决方案。

---

## 写在最后

企业AI接入应用和生产系统，不再是「谁有最强的模型」，而是**「谁能让模型在真实业务场景中稳定、可信、可审计地工作」**。

yueli-kgm-computing的答案是：**用知识图谱的确定性，约束大语言模型的概率性。**

这不是一个技术上的小修补，而是企业AI从「实验室」走向「生产环境」的必经路径。

<FAQ 
  title="常见问题解答 (FAQ)"
  faqItems={[
    { 
      question: "什么是阅粒知识计算引擎（Yueli KGM Computing）？", 
      answer: "阅粒知识计算引擎（Yueli KGM Computing）是 HaxiTAG 团队以 MIT 许可证开源的企业级知识计算中间件，定位为自托管推理编排与兼容网关。它通过知识图谱约束 LLM 推理，减少幻觉，为企业 AI 应用提供可信、可审计的知识基础设施层。" 
    },
    { 
      question: "Yueli KGM 如何解决大语言模型的幻觉问题？", 
      answer: "Yueli KGM 采用知识图谱约束推理机制：首先从企业私有知识图谱中检索与问题相关的事实节点和关系路径，然后将结构化事实作为强制上下文注入 LLM Prompt，并明确声明允许引用的知识范围，最终输出附带三元组来源引用的可溯源答案，从而用知识图谱的确定性约束模型的概率性。" 
    },
    { 
      question: "Yueli KGM 与 LangChain、vLLM 等框架是什么关系？", 
      answer: "它们在不同的层次上协作。LangChain 是 LLM 应用编排框架，vLLM 是高性能推理引擎，而 Yueli KGM 聚焦于推理编排、协议兼容与知识图谱增强。推荐的组合模式是：vLLM/SGLang 负责算力，KGM 作为统一网关和编排层对外提供双协议 API；LangChain/LlamaIndex 负责上层应用逻辑，通过 KGM 的 OpenAI 兼容接口调用模型。" 
    },
    { 
      question: "Yueli KGM 支持哪些大语言模型和推理服务？", 
      answer: "Yueli KGM 的 Provider 注册表已覆盖 30+ 主流 LLM 提供商，包括 OpenAI、DeepSeek、Anthropic Claude、Google Gemini、阿里云百炼、火山方舟、智谱 GLM、百度千帆等云端服务，以及 Ollama、vLLM、SGLang、LM Studio 等本地推理引擎。通过环境变量即可切换，支持声明式多路由策略。" 
    },
    { 
      question: "企业如何快速开始使用 Yueli KGM？", 
      answer: "最小生产启动仅需 5 分钟：npm install @haxitag/yueli-kgm-computing 后，配置 KGM_LLM_BASE_URL 和 API_KEY 等环境变量，运行 enhancedStart.js 即可启动双协议 HTTP 服务。同时提供 Web Playground 和 Prometheus 指标端点（/metrics），可快速验证推理、观测和路由能力。" 
    }
  ]} 
/>

## 关注"哈希泰格"服务号获取AI企业应用实战和案例分享
以下是关注哈希泰格微信公众号的二维码：

![关注哈希泰格公众号二维码](https://haxitag.com/images/qrcode_for_gh_f9203b130c32_344.jpg)

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/articles/yueli-kgm-computing-open-source](https://haxitag.com/articles/yueli-kgm-computing-open-source)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
