聊天补全
创建聊天补全
POST
/v1/chat/completions使用 OpenAI 兼容格式调用 GPT 系列模型,支持非流式、流式、多轮对话、工具调用和结构化输出。
认证
通过 Bearer Token 认证。
API Key,格式为 Bearer YOUR_API_KEY。
默认值:-请求体格式。
默认值:application/json客户侧生成的唯一请求标识,用于追踪和排查。
默认值:-请求
请求体使用 OpenAI Chat Completions 兼容格式。
模型 ID,参考模型与能力页面。
默认值:-对话消息列表。
默认值:-消息角色:system、user、assistant 或 tool。
默认值:-消息内容。多模态输入使用数组内容块。
默认值:-是否启用 SSE 流式输出。
默认值:false采样温度,取值通常为 0 到 2。
默认值:1核采样参数。
默认值:1限制本次响应最多生成的 Token 数。
默认值:4096停止序列,模型生成到指定序列时停止。
默认值:-Function Calling 工具定义列表。
默认值:-工具调用策略。
默认值:-输出格式控制,例如 JSON 模式。
默认值:-用于提高采样结果相似度的随机种子。
默认值:-终端用户唯一标识。
默认值:-响应
非流式请求返回完整 chat.completion 对象;流式请求返回 chat.completion.chunk SSE 事件。
本次补全唯一标识。
默认值:-对象类型。
默认值:chat.completion创建时间,Unix 时间戳。
默认值:-实际执行请求的模型。
默认值:-补全结果列表。
默认值:-非流式响应中的模型消息。
默认值:-流式响应中的增量内容。
默认值:-停止原因,例如 stop、length 或 tool_calls。
默认值:-Token 用量统计。
默认值:-平台追踪 ID,用于问题排查。
默认值:-流式响应
data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","choices":[{"delta":{"content":"你"},"finish_reason":null}]}
data: {"id":"chatcmpl-xxx","object":"chat.completion.chunk","choices":[{"delta":{},"finish_reason":"stop"}]}
data: [DONE]
错误
| 状态码 | 说明 |
|---|---|
400 | 请求体字段错误、消息格式错误或模型不支持指定参数 |
401 | API Key 缺失或无效 |
403 | 当前账户无权调用该模型 |
429 | 请求超过速率限制 |
500 / 503 | 平台或上游模型服务异常 |