epznmv API 技术文档

统一接口，调用全球 50+ 顶级大模型。完全兼容 OpenAI Chat API 规范，零改造迁移。

概述

epznmv 提供了一个统一的 API 网关，通过单一端点即可访问 DeepSeek、Qwen、GLM、Kimi、GPT、Claude、Gemini 等 50+ 款主流大模型。平台自动处理模型路由、负载均衡、容灾降级与边缘加速，让开发者专注于业务逻辑而非基础设施。

核心能力：

统一接入：一个 API Key 调用所有模型，无需切换账号或 SDK
智能路由：根据成本、延迟、任务类型自动选择最优模型
自动容灾：当某渠道异常时毫秒级切换至备选节点
边缘加速：全球 50+ 节点，首字响应优化至 10ms 内
零改造兼容：完全兼容 OpenAI Chat API 规范

✦ 快速开始： 只需三步 —— 注册账号 → 获取 API Key → 修改 baseURL 为 https://api.epznmv.cn/v1，即可开始调用。

认证与鉴权

epznmv 使用 API Key 进行身份认证。所有请求都需在 HTTP Header 中携带 Authorization 字段。

Authorization: Bearer your-api-key-here

API Key 可在 epznmv 控制台的「API Keys」页面创建和管理。请妥善保管，避免泄露。

聊天补全 (Chat Completions)

epznmv 的聊天补全接口与 OpenAI 完全兼容，支持 messages、model、temperature、max_tokens 等标准参数。

端点： POST https://api.epznmv.cn/v1/chat/completions

import OpenAI from 'openai'
 
const client = new OpenAI({
  baseURL: 'https://api.epznmv.cn/v1',
  apiKey: 'your-api-key'
});
 
const response = await client.chat.completions.create({
  model: 'deepseek-v4',
  messages: [
    { role: 'system', content: '你是一个专业的AI助手' },
    { role: 'user', content: '介绍一下epznmv平台' }
  ],
  temperature: 0.7,
  max_tokens: 1024
});
 
console.log(response.choices[0].message.content);

流式输出 (Streaming)

启用流式输出可实时接收模型生成的 Token，大幅提升用户体验。只需在请求中设置 stream: true。

const stream = await client.chat.completions.create({
  model: 'qwen-3.5-max',
  messages: [{ role: 'user', content: '写一首关于AI的诗' }],
  stream: true
});
 
for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || '');
}

模型路由

epznmv 支持智能模型路由。您可以通过 model 参数指定具体模型，也可以让平台根据任务特征自动选择最优模型。

指定模型： model: 'deepseek-v4'
自动路由： 不指定 model 参数，平台将根据请求内容智能选择
会话粘性： 使用 session_id 参数可让同一会话的所有请求路由到同一提供商，最大化缓存命中

// 指定模型
{ model: 'claude-4', messages: [...] }
 
// 自动路由（不指定 model）
{ messages: [...], session_id: 'user-123' }

插件系统

epznmv 支持插件扩展，可为模型赋予联网搜索、PDF 解析、JSON 修复等增强能力。

web — 实时联网搜索
file-parser — PDF/文档解析
response-healing — 自动修复 JSON 格式错误
context-compression — 上下文压缩

{
  model: 'gpt-5-nano',
  messages: [{ role: 'user', content: '今天有什么新闻？' }],
  plugins: ['web']
}

端点列表

端点	方法	说明
`/v1/chat/completions`	POST	聊天补全（核心接口）
`/v1/models`	GET	获取可用模型列表
`/v1/embeddings`	POST	文本向量化
`/v1/completions`	POST	文本补全（传统接口）

请求参数

参数	类型	必填	说明
`model`	string	否	模型 ID，不指定则自动路由
`messages`	array	是	对话消息列表
`temperature`	number	否	0~2，默认 1.0
`max_tokens`	integer	否	最大生成 Token 数
`stream`	boolean	否	是否启用流式输出
`session_id`	string	否	会话 ID，用于粘性路由
`plugins`	array	否	启用的插件列表
`response_format`	object	否	结构化输出配置

响应格式

epznmv 的响应格式与 OpenAI 完全一致，choices 始终为数组。

{
  "id": "chatcmpl-xxxx",
  "object": "chat.completion",
  "created": 1700000000,
  "model": "deepseek-v4",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "epznmv 是一个..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 42,
    "completion_tokens": 128,
    "total_tokens": 170
  }
}

错误码

HTTP 状态码	说明
200	请求成功
400	请求参数错误
401	API Key 无效或缺失
402	账户余额不足
429	请求频率超限
500	服务器内部错误
503	模型暂时不可用（自动重试）

Python SDK

from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.epznmv.cn/v1",
    api_key="your-api-key"
)
 
response = client.chat.completions.create(
    model="qwen-3.5-max",
    messages=[{"role": "user", "content": "你好"}]
)
 
print(response.choices[0].message.content)

Node.js SDK

import OpenAI from 'openai';
 
const client = new OpenAI({
  baseURL: 'https://api.epznmv.cn/v1',
  apiKey: 'your-api-key'
});
 
const response = await client.chat.completions.create({
  model: 'deepseek-v4',
  messages: [{ role: 'user', content: 'Hello' }]
});

📘 完整 API 规范： epznmv 提供 OpenAPI 3.0 规范文件，支持 Swagger UI、Postman 等工具导入。可在控制台「开发者工具」中下载。