Path: /v1/chat/completions
Method: POST
调用说明:
curl --location 'https://api.atomecho.cn/v1/chat/completions' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer ${API-Sercet}' \
--data '{
"model": "Atom-7B-Chat",
"messages": [{
"role": "user",
"content": "介绍一下Llama社区"
}],
"temperature": 0.3,
"stream": true
}'
stream 为true时流式返回如下
data: {"id":"Atom-sZZCBhOLuK","object":"chat.completion.chunk","created":1710497120245,"model":"Atom-7B-Chat","choices":[{"index":0,"delta":{"role":"assistant","content":"在闰年的二月,"}}],"usage":{"prompt_tokens":74,"completion_tokens":5,"total_tokens":79}}
data: {"id":"Atom-sZZCBhOLuK","object":"chat.completion.chunk","created":1710497120330,"model":"Atom-7B-Chat","choices":[{"index":0,"delta":{"role":"assistant","content":"你的月薪是80元。"},"finish_reason":"stop"}],"usage":{"prompt_tokens":74,"completion_tokens":14,"total_tokens":88}}
data: [DONE]
stream 为false时流式返回如下
{"id":"Atom-ISSbmGVKwh","created":1710497244256,"choices":[{"index":0,"finish_reason":"stop","message":{"role":"assistant","content":"假设您是2023年2月的月薪,那么在闰年的二月,您的月薪应该是8块钱乘以21天,即168元。"}}],"model":"Atom-7B-Chat","object":"chat.completion","usage":{"prompt_tokens":74,"completion_tokens":39,"total_tokens":113}}
Headers
参数名称 | 参数值 | 是否必须 | 示例 | 备注 |
---|---|---|---|---|
Content-Type | application/json | 是 |
Body
名称 | 类型 | 是否必须 | 默认值 | 备注 | 其他信息 |
---|---|---|---|---|---|
model | string | 非必须 | "Atom-13B-Chat","Atom-7B-Chat","Atom-1B-Chat","Llama3-Chinese-8B-Instruct" | ||
messages | object [] | 非必须 | item 类型: object | ||
├─ role | string | 非必须 | 支持 "system","user","assistant" | ||
├─ content | string | 非必须 | |||
temperature | number | 非必须 | 默认0.3,介于 0 和 1 之间。较高的值(如 0.7)将使输出更加随机,而较低的值(如 0.2)将使其更加集中和确定性。 | ||
top_p | number | 非必须 | 默认0.95,建议temperature和top_p只修改其中一种 | ||
repetition_penalty | number | 非必须 | 默认为 0。介于 -2.0 和 2.0 之间的数字。正值会根据新标记在迄今为止的文本中出现的频率惩罚新标记,增加模型谈论新话题的可能性。 | ||
stream | boolean | 非必须 | 是否开启流式 |
名称 | 类型 | 是否必须 | 默认值 | 备注 | 其他信息 |
---|---|---|---|---|---|
id | string | 非必须 | |||
created | number | 非必须 | 对话完成时间 | ||
choices | object [] | 非必须 | item 类型: object | ||
├─ index | number | 非必须 | |||
├─ finish_reason | string | 非必须 | 完成原因 | ||
├─ message | object | 非必须 | |||
├─ role | string | 非必须 | |||
├─ content | string | 非必须 | |||
model | string | 非必须 | 对话使用的模型 | ||
object | string | 非必须 | |||
usage | object | 非必须 | 消耗的tokens | ||
├─ prompt_tokens | number | 非必须 | |||
├─ completion_tokens | number | 非必须 | |||
├─ total_tokens | number | 非必须 |