青栀AI文档
🧐 AI 模型计费
青栀AI 有两种计费方式。一种是随用随付的弹性计费,一种是订阅计划。其他站点请参阅其站点的信息,与官方站计费无关。
下面是弹性计费方式的详细价格表。请到chatnio官方站查看订阅计划的详细信息。
1 CNY = 10 Nio 点数。 (如模型请求 1 次计费 0.05 点数,即计费 0.005 元)
订阅的按次配额在 API 中转中无法适用,中转仅支持弹性计费。
OpenAI / Azure OpenAI
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
gpt-3.5-turbo (0301, 0613) | 1 元 1 刀 (官网 7 分之一) | 0.015 | 0.02 |
gpt-3.5-turbo-1106 | 1 元 1 刀 (官网 7 分之一) | 0.01 | 0.02 |
gpt-3.5-turbo-0125 | 1 元 1 刀 (官网 7 分之一) | 0.005 | 0.015 |
gpt-3.5-turbo-16k | 1 元 1 刀 (官网 7 分之一) | 0.03 | 0.04 |
gpt-4 (0314, 0613) | 1 元 1 刀 (官网 7 分之一) | 0.3 | 0.6 |
gpt-4-1106-preview, gpt-4-0125-preview, gpt-4-turbo-preview, gpt-4-vision-preview | 1 元 1 刀 (官网 7 分之一) | 0.1 | 0.3 |
gpt-4-32k (0314, 0613) | 1 元 1 刀 (官网 7 分之一) | 0.6 | 1.2 |
azure-gpt-3.5-turbo | 0.4 元 1 刀 (官网 17 分之一) | 0.006 | 0.008 |
azure-gpt-3.5-turbo-16k | 0.4 元 1 刀 (官网 17 分之一) | 0.012 | 0.016 |
azure-gpt-4 | 0.8 元 1 刀 (官网 9 分之一) | 0.240 | 0.480 |
azure-gpt-4-32k | 0.8 元 1 刀 (官网 9 分之一) | 0.480 | 0.960 |
dalle, dall-e-2, dall-e-3 | 请参见下方 AI 绘图 | - | - |
DALLE-2, DALLE-3, GPT-4 Vision Preview 已做好格式兼容,按照通用格式调用即可(在任何地方输入 url 即可),无需再适配进行格式。
AI 绘图
模型 | 费率 | 价格(点数) | 信息 |
---|---|---|---|
dalle, dall-e-2 | 1 元 1 刀 (官网 7 分之一) | 0.18 | 512x512 |
dall-e-3 | 官网 6折 | 3 | HD 1024x1024 |
midjourney | 官网平均计费 | 1 | Relax 模式 |
midjourney-fast | 官网平均计费 | 2 | Fast 模式 |
midjourney-turbo | 官网平均计费 | 5 | Turbo 模式 |
Claude
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
claude-1-100k,claude-1,claude-1.3 | 对齐官网计费 | 0.08 | 0.27 |
claude-2, claude-2.1 | 对齐官网计费 | 0.8 | 2.7 |
claude-3-opus-20240229 | 价格同 gpt-4-32k | ||
claude-3-sonnet-20240229 | 价格同 gpt-4 |
Claude 3 与 Claude 2.1 为 200k 上下文,Claude 2 为 100k 上下文,Claude 全系并发较低,出现 403, 503 等报错为正常速率限制情况。
SparkDesk 讯飞星火
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
spark-desk-v1.5 | 对齐官网计费 | 0.15 | 0.15 |
spark-desk-v2 | 对齐官网计费 | 0.3 | 0.3 |
spark-desk-v3 | 对齐官网计费 | 0.3 | 0.3 |
ChatGLM 智谱清言
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
zhipu-chatglm-turbo | 对齐官网计费 | 0.05 | 0.05 |
zhipu-chatglm-pro(废弃) | 对齐官网计费 | 0.1 | 0.1 |
zhipu-chatglm-std(废弃) | 对齐官网计费 | 0.05 | 0.05 |
zhipu-chatglm-lite(废弃) | 对齐官网计费 | 0.05 | 0.05 |
DashScope 通义千问
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
qwen-plus | 对齐官网计费 | 0.2 | 0.2 |
qwen-plus-net | 对齐官网计费 | 0.2 | 0.2 |
qwen-turbo | 对齐官网计费 | 0.08 | 0.08 |
qwen-turbo-net | 对齐官网计费 | 0.08 | 0.08 |
Google Gemini / PaLM2
模型 | 回答 Token (点数 / 次数) |
---|---|
gemini-pro, gemini-pro-vision | 0.05 / 次 |
New Bing
New Bing 为逆向模型,不保证并发,出现错误为正常现象。
模型 | 回答 Token (点数 / 次数) |
---|---|
bing-creative | 0.1 / 次 |
bing-balanced | 0.1 / 次 |
bing-precise | 0.1 / 次 |
腾讯混元
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
hunyuan | 对齐官网计费 | 1 | 1 |
360 智脑
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
360-gpt-v9 | 对齐官网计费 | 0.12 | 0.12 |
百川 AI
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
baichuan-53b | 对齐官网计费 | 0.2 | 0.2 |
火山方舟(抖音豆包)
模型 | 费率 | 问题 Token (点数 / 1k token) | 回答 Token (点数 / 1k token) |
---|---|---|---|
skylark-lite-public | 对齐官网计费 | 0.04 | 0.04 |
skylark-plus-public | 对齐官网计费 | 0.08 | 0.08 |
skylark-pro-public | 对齐官网计费 | 0.11 | 0.11 |
skylark-chat | 对齐官网计费 | 0.11 | 0.11 |
最低余额限制
为了防止超出余额的部分过多,同时为了防止滥用,Chat Nio 设定了特定模型的最低余额预检,当小于该余额时,不可发起请求。
对于按照次数计费模型,最低余额为单次调用费用。(如:模型 0.1 点数 / 次, 最低可调用点数余额为 0.1)
对于按照 Token 计费模型,最低余额为 1K 输入 Token 费用 + 1K 输出 Token 费用。(如:模型输入输出均为 0.1 点数 / 1k tokens, 最低可调用点数余额为 0.1 + 0.1 = 0.2)
对于不计费模型,无最低余额限制。
常见问题解答❓
🍀 AI 模型相关
问 GPT-4, GPT-4V, GPT-4 DALLE, GPT-4 ALL, GPT-4 32k 都有什么区别?
- GPT-4 和 GPT-4 32k 为纯文字模型, 对接官方 API,普通 GPT-4 上下文长度为 8K Tokens,32K 上下文长度顾名思义为 32K Tokens, 32K 不常用,价格约为 GPT-4 的两倍,仅作为大数据分析情况使用,正常使用 GPT-4 即可。
- GPT-4V, GPT-4 DALLE 为多模态模型,由 Plus 逆向而成, 4V可以识别图片,DALLE3 可生成图片。因其为 Plus 逆向,有时会有额度不足的情况,出现 500 为正常现象,等 Plus 账号池额度恢复即可(三小时以内)。
- GPT-4 ALL 为 Alpha 号逆向而成,同时兼顾 DALLE3 绘图功能和识别图片能力,上下文长度可达 128k
问 Claude 100k 是什么?
Claude 100k 支持 100k 上下文,支持大文本解析等功能,从大文章理解能力考虑来看是不错的选择。
问 为什么我选 GPT-4 模型,但是他说是基于 GPT-3 架构?
此为正常现象,GPT-4会回答自己为“基于 GPT-3 架构开发(还不是回答 GPT3.5架构)”, 您可以提问诸如“_鲁迅为什么暴打周树人, 打鸟问题,Tile T2 Project_” 等问题综合辨别市面上的真假 GPT-4 模型。3.5 会开始胡编模式说为两个人,4 会正常回答。(此问题已过时)
问 如何计算 Token 消耗
询问模型自己用了多少 token 是不可行的,模型只会得出错误答案。Token 计算方法请前往 OpenAI 官方 Token 计算器 https://platform.openai.com/tokenizer 进行计算,并乘以权重 TokensPerMessage 参数(一般为 _3_)。
在一次请求中,输入 token 即为携带的历史的上下文(默认最多携带 8 轮上下文对话),输出token即为模型的回复。
Tokenizer 的计算方法请查看 OpenAI Cookbox,青栀AI 的 Token 计费方式完全参照 OpenAI 官方进行,后端使用 Tiktoken Go 库进行计算。
🔨 常见报错原因列表
- 504 Gateway Timeout:网关超时,服务异常(常发生于服务器满负载运行时或者 CDN 网关超过最大 Timeout),请联系网站相关人员解决。
- 503 Service Unavailable:服务暂时不可用。常发生于上游流量过大无法提供服务(如 Poe 逆向)。
- 500 Internal Server Error:上游服务端异常 (如 OpenAI 受到的流量过大时拒绝服务)。
- 404 Not Found: 出现于逆向模型。如上文所述,会有逆向账户鉴权失败或者逆向库失效的情况,为正常现象,等恢复即可。
- 403 Forbidden:拒绝服务。速率限制,或者会有逆向账户额度不足的情况,等账号池额度恢复即可。
- 402 Payment Required:账号池轮询到了余额不足的账户,请刷新重试。
- 401 Unauthorized:账号池轮询到了被封禁 / 不存在的账户,请刷新重试。
- 400 Bad Request:错误请求。参数设置不正确,或者上下文 Token 大小超过该模型的最大上下文。