epznmv API 技术文档
统一接口,调用全球 50+ 顶级大模型。完全兼容 OpenAI Chat API 规范,零改造迁移。
概述
epznmv 提供了一个统一的 API 网关,通过单一端点即可访问 DeepSeek、Qwen、GLM、Kimi、GPT、Claude、Gemini 等 50+ 款主流大模型。 平台自动处理模型路由、负载均衡、容灾降级与边缘加速,让开发者专注于业务逻辑而非基础设施。
核心能力:
- 统一接入:一个 API Key 调用所有模型,无需切换账号或 SDK
- 智能路由:根据成本、延迟、任务类型自动选择最优模型
- 自动容灾:当某渠道异常时毫秒级切换至备选节点
- 边缘加速:全球 50+ 节点,首字响应优化至 10ms 内
- 零改造兼容:完全兼容 OpenAI Chat API 规范
✦ 快速开始: 只需三步 —— 注册账号 → 获取 API Key → 修改 baseURL 为 https://api.epznmv.cn/v1,即可开始调用。
认证与鉴权
epznmv 使用 API Key 进行身份认证。所有请求都需在 HTTP Header 中携带 Authorization 字段。
API Key 可在 epznmv 控制台的「API Keys」页面创建和管理。请妥善保管,避免泄露。
聊天补全 (Chat Completions)
epznmv 的聊天补全接口与 OpenAI 完全兼容,支持 messages、model、temperature、max_tokens 等标准参数。
端点: POST https://api.epznmv.cn/v1/chat/completions
流式输出 (Streaming)
启用流式输出可实时接收模型生成的 Token,大幅提升用户体验。只需在请求中设置 stream: true。
模型路由
epznmv 支持智能模型路由。您可以通过 model 参数指定具体模型,也可以让平台根据任务特征自动选择最优模型。
- 指定模型:
model: 'deepseek-v4' - 自动路由: 不指定
model参数,平台将根据请求内容智能选择 - 会话粘性: 使用
session_id参数可让同一会话的所有请求路由到同一提供商,最大化缓存命中
插件系统
epznmv 支持插件扩展,可为模型赋予联网搜索、PDF 解析、JSON 修复等增强能力。
web— 实时联网搜索file-parser— PDF/文档解析response-healing— 自动修复 JSON 格式错误context-compression— 上下文压缩
端点列表
| 端点 | 方法 | 说明 |
|---|---|---|
/v1/chat/completions | POST | 聊天补全(核心接口) |
/v1/models | GET | 获取可用模型列表 |
/v1/embeddings | POST | 文本向量化 |
/v1/completions | POST | 文本补全(传统接口) |
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 否 | 模型 ID,不指定则自动路由 |
messages | array | 是 | 对话消息列表 |
temperature | number | 否 | 0~2,默认 1.0 |
max_tokens | integer | 否 | 最大生成 Token 数 |
stream | boolean | 否 | 是否启用流式输出 |
session_id | string | 否 | 会话 ID,用于粘性路由 |
plugins | array | 否 | 启用的插件列表 |
response_format | object | 否 | 结构化输出配置 |
响应格式
epznmv 的响应格式与 OpenAI 完全一致,choices 始终为数组。
错误码
| HTTP 状态码 | 说明 |
|---|---|
| 200 | 请求成功 |
| 400 | 请求参数错误 |
| 401 | API Key 无效或缺失 |
| 402 | 账户余额不足 |
| 429 | 请求频率超限 |
| 500 | 服务器内部错误 |
| 503 | 模型暂时不可用(自动重试) |
Python SDK
Node.js SDK
📘 完整 API 规范: epznmv 提供 OpenAPI 3.0 规范文件,支持 Swagger UI、Postman 等工具导入。可在控制台「开发者工具」中下载。