Article

⚠️ 本文最后更新于2024年03月30日，已经过了235天没有更新，若内容或图片失效，请留言反馈

青栀AI文档

🧐 AI 模型计费

青栀AI 有两种计费方式。一种是随用随付的弹性计费，一种是订阅计划。其他站点请参阅其站点的信息，与官方站计费无关。

下面是弹性计费方式的详细价格表。请到chatnio官方站查看订阅计划的详细信息。

1 CNY = 10 Nio 点数。 (如模型请求 1 次计费 0.05 点数，即计费 0.005 元)

订阅的按次配额在 API 中转中无法适用，中转仅支持弹性计费。

OpenAI / Azure OpenAI

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
gpt-3.5-turbo (0301, 0613)	1 元 1 刀 (官网 7 分之一)	0.015	0.02
gpt-3.5-turbo-1106	1 元 1 刀 (官网 7 分之一)	0.01	0.02
gpt-3.5-turbo-0125	1 元 1 刀 (官网 7 分之一)	0.005	0.015
gpt-3.5-turbo-16k	1 元 1 刀 (官网 7 分之一)	0.03	0.04
gpt-4 (0314, 0613)	1 元 1 刀 (官网 7 分之一)	0.3	0.6
gpt-4-1106-preview, gpt-4-0125-preview, gpt-4-turbo-preview, gpt-4-vision-preview	1 元 1 刀 (官网 7 分之一)	0.1	0.3
gpt-4-32k (0314, 0613)	1 元 1 刀 (官网 7 分之一)	0.6	1.2
azure-gpt-3.5-turbo	0.4 元 1 刀 (官网 17 分之一)	0.006	0.008
azure-gpt-3.5-turbo-16k	0.4 元 1 刀 (官网 17 分之一)	0.012	0.016
azure-gpt-4	0.8 元 1 刀 (官网 9 分之一)	0.240	0.480
azure-gpt-4-32k	0.8 元 1 刀 (官网 9 分之一)	0.480	0.960
dalle, dall-e-2, dall-e-3	请参见下方 AI 绘图	-	-

DALLE-2, DALLE-3, GPT-4 Vision Preview 已做好格式兼容，按照通用格式调用即可（在任何地方输入 url 即可），无需再适配进行格式。

AI 绘图

模型	费率	价格（点数）	信息
dalle, dall-e-2	1 元 1 刀 (官网 7 分之一)	0.18	512x512
dall-e-3	官网 6折	3	HD 1024x1024
midjourney	官网平均计费	1	Relax 模式
midjourney-fast	官网平均计费	2	Fast 模式
midjourney-turbo	官网平均计费	5	Turbo 模式

Claude

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
claude-1-100k,claude-1,claude-1.3	对齐官网计费	0.08	0.27
claude-2, claude-2.1	对齐官网计费	0.8	2.7
claude-3-opus-20240229	价格同 gpt-4-32k
claude-3-sonnet-20240229	价格同 gpt-4

Claude 3 与 Claude 2.1 为 200k 上下文，Claude 2 为 100k 上下文，Claude 全系并发较低，出现 403, 503 等报错为正常速率限制情况。

SparkDesk 讯飞星火

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
spark-desk-v1.5	对齐官网计费	0.15	0.15
spark-desk-v2	对齐官网计费	0.3	0.3
spark-desk-v3	对齐官网计费	0.3	0.3

ChatGLM 智谱清言

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
zhipu-chatglm-turbo	对齐官网计费	0.05	0.05
zhipu-chatglm-pro（废弃）	对齐官网计费	0.1	0.1
zhipu-chatglm-std（废弃）	对齐官网计费	0.05	0.05
zhipu-chatglm-lite（废弃）	对齐官网计费	0.05	0.05

DashScope 通义千问

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
qwen-plus	对齐官网计费	0.2	0.2
qwen-plus-net	对齐官网计费	0.2	0.2
qwen-turbo	对齐官网计费	0.08	0.08
qwen-turbo-net	对齐官网计费	0.08	0.08

Google Gemini / PaLM2

模型	回答 Token (点数 / 次数)
gemini-pro, gemini-pro-vision	0.05 / 次

New Bing

New Bing 为逆向模型，不保证并发，出现错误为正常现象。

模型	回答 Token (点数 / 次数)
bing-creative	0.1 / 次
bing-balanced	0.1 / 次
bing-precise	0.1 / 次

腾讯混元

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
hunyuan	对齐官网计费	1	1

360 智脑

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
360-gpt-v9	对齐官网计费	0.12	0.12

百川 AI

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
baichuan-53b	对齐官网计费	0.2	0.2

火山方舟（抖音豆包）

模型	费率	问题 Token (点数 / 1k token)	回答 Token (点数 / 1k token)
skylark-lite-public	对齐官网计费	0.04	0.04
skylark-plus-public	对齐官网计费	0.08	0.08
skylark-pro-public	对齐官网计费	0.11	0.11
skylark-chat	对齐官网计费	0.11	0.11

最低余额限制

为了防止超出余额的部分过多，同时为了防止滥用，Chat Nio 设定了特定模型的最低余额预检，当小于该余额时，不可发起请求。

对于按照次数计费模型，最低余额为单次调用费用。（如：模型 0.1 点数 / 次, 最低可调用点数余额为 0.1）
对于按照 Token 计费模型，最低余额为 1K 输入 Token 费用 + 1K 输出 Token 费用。（如：模型输入输出均为 0.1 点数 / 1k tokens, 最低可调用点数余额为 0.1 + 0.1 = 0.2）
对于不计费模型，无最低余额限制。

常见问题解答❓

🍀 AI 模型相关

问 GPT-4, GPT-4V, GPT-4 DALLE, GPT-4 ALL, GPT-4 32k 都有什么区别？

GPT-4 和 GPT-4 32k 为纯文字模型, 对接官方 API，普通 GPT-4 上下文长度为 8K Tokens，32K 上下文长度顾名思义为 32K Tokens, 32K 不常用，价格约为 GPT-4 的两倍，仅作为大数据分析情况使用，正常使用 GPT-4 即可。
GPT-4V, GPT-4 DALLE 为多模态模型,由 Plus 逆向而成, 4V可以识别图片，DALLE3 可生成图片。因其为 Plus 逆向，有时会有额度不足的情况，出现 500 为正常现象，等 Plus 账号池额度恢复即可（三小时以内）。
GPT-4 ALL 为 Alpha 号逆向而成，同时兼顾 DALLE3 绘图功能和识别图片能力，上下文长度可达 128k

问 Claude 100k 是什么？

Claude 100k 支持 100k 上下文，支持大文本解析等功能，从大文章理解能力考虑来看是不错的选择。

问为什么我选 GPT-4 模型，但是他说是基于 GPT-3 架构？

此为正常现象，GPT-4会回答自己为“基于 GPT-3 架构开发（还不是回答 GPT3.5架构）”，您可以提问诸如“_鲁迅为什么暴打周树人, 打鸟问题，Tile T2 Project_” 等问题综合辨别市面上的真假 GPT-4 模型。3.5 会开始胡编模式说为两个人，4 会正常回答。(此问题已过时）

问如何计算 Token 消耗

询问模型自己用了多少 token 是不可行的，模型只会得出错误答案。Token 计算方法请前往 OpenAI 官方 Token 计算器 https://platform.openai.com/tokenizer 进行计算，并乘以权重 TokensPerMessage 参数（一般为 _3_）。

在一次请求中，输入 token 即为携带的历史的上下文（默认最多携带 8 轮上下文对话），输出token即为模型的回复。

Tokenizer 的计算方法请查看 OpenAI Cookbox，青栀AI 的 Token 计费方式完全参照 OpenAI 官方进行，后端使用 Tiktoken Go 库进行计算。

OpenAI Cookbox

Tiktoken Go

🔨 常见报错原因列表

504 Gateway Timeout：网关超时，服务异常（常发生于服务器满负载运行时或者 CDN 网关超过最大 Timeout），请联系网站相关人员解决。
503 Service Unavailable：服务暂时不可用。常发生于上游流量过大无法提供服务（如 Poe 逆向）。
500 Internal Server Error：上游服务端异常（如 OpenAI 受到的流量过大时拒绝服务）。
404 Not Found：出现于逆向模型。如上文所述，会有逆向账户鉴权失败或者逆向库失效的情况，为正常现象，等恢复即可。
403 Forbidden：拒绝服务。速率限制，或者会有逆向账户额度不足的情况，等账号池额度恢复即可。
402 Payment Required：账号池轮询到了余额不足的账户，请刷新重试。
401 Unauthorized：账号池轮询到了被封禁 / 不存在的账户，请刷新重试。
400 Bad Request：错误请求。参数设置不正确，或者上下文 Token 大小超过该模型的最大上下文。

现在已有 0 条评论，11 人点赞

日	一	二	三	四	五	六
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

青栀AI文档

青栀AI文档

🧐 AI 模型计费

OpenAI / Azure OpenAI

AI 绘图

Claude

SparkDesk 讯飞星火

ChatGLM 智谱清言

DashScope 通义千问

Google Gemini / PaLM2

New Bing

腾讯混元

360 智脑

百川 AI

火山方舟（抖音豆包）

最低余额限制

常见问题解答❓

🍀 AI 模型相关

问 GPT-4, GPT-4V, GPT-4 DALLE, GPT-4 ALL, GPT-4 32k 都有什么区别？

问 Claude 100k 是什么？

问 为什么我选 GPT-4 模型，但是他说是基于 GPT-3 架构？

问 如何计算 Token 消耗

🔨 常见报错原因列表

问为什么我选 GPT-4 模型，但是他说是基于 GPT-3 架构？

问如何计算 Token 消耗