云边日落 秦时明月汉时关,万里长征人未还。 (唐·王昌龄·出塞)
博主 云边日落
渝ICP备2021002886号-1渝公网安备50022502000591号博主 11月5日 在线自豪地使用 Typecho 建站搭配使用 🌻Sunny 主题当前在线 4 人
歌曲封面 未知作品
  • 歌曲封面“魔女の宅急便”~ルージュの伝言松任谷由実

渝ICP备2021002886号-1

渝公网安备50022502000591号

网站已运行 4 年 152 天 17 小时 38 分

Powered by Typecho & Sunny

5 online · 42 ms

Title

青栀AI文档

酒笙

·

·

289次阅读
笔记留存
Article
⚠️ 本文最后更新于2024年03月30日,已经过了235天没有更新,若内容或图片失效,请留言反馈

青栀AI文档

🧐 AI 模型计费

青栀AI 有两种计费方式。一种是随用随付的弹性计费,一种是订阅计划。其他站点请参阅其站点的信息,与官方站计费无关。

下面是弹性计费方式的详细价格表。请到chatnio官方站查看订阅计划的详细信息。

1 CNY = 10 Nio 点数。 (如模型请求 1 次计费 0.05 点数,即计费 0.005 元)

订阅的按次配额在 API 中转中无法适用,中转仅支持弹性计费。

OpenAI / Azure OpenAI

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
gpt-3.5-turbo (0301, 0613)1 元 1 刀 (官网 7 分之一)0.0150.02
gpt-3.5-turbo-11061 元 1 刀 (官网 7 分之一)0.010.02
gpt-3.5-turbo-01251 元 1 刀 (官网 7 分之一)0.0050.015
gpt-3.5-turbo-16k1 元 1 刀 (官网 7 分之一)0.030.04
gpt-4 (0314, 0613)1 元 1 刀 (官网 7 分之一)0.30.6
gpt-4-1106-preview,
gpt-4-0125-preview,
gpt-4-turbo-preview,
gpt-4-vision-preview
1 元 1 刀 (官网 7 分之一)0.10.3
gpt-4-32k (0314, 0613)1 元 1 刀 (官网 7 分之一)0.61.2
azure-gpt-3.5-turbo0.4 元 1 刀 (官网 17 分之一)0.0060.008
azure-gpt-3.5-turbo-16k0.4 元 1 刀 (官网 17 分之一)0.0120.016
azure-gpt-40.8 元 1 刀 (官网 9 分之一)0.2400.480
azure-gpt-4-32k0.8 元 1 刀 (官网 9 分之一)0.4800.960
dalle, dall-e-2, dall-e-3请参见下方 AI 绘图--
DALLE-2, DALLE-3, GPT-4 Vision Preview 已做好格式兼容,按照通用格式调用即可(在任何地方输入 url 即可),无需再适配进行格式。

AI 绘图

模型费率价格(点数)信息
dalle, dall-e-21 元 1 刀 (官网 7 分之一)0.18512x512
dall-e-3官网 6折3HD 1024x1024
midjourney官网平均计费1Relax 模式
midjourney-fast官网平均计费2Fast 模式
midjourney-turbo官网平均计费5Turbo 模式

Claude

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
claude-1-100k,claude-1,claude-1.3对齐官网计费0.080.27
claude-2, claude-2.1对齐官网计费0.82.7
claude-3-opus-20240229价格同 gpt-4-32k
claude-3-sonnet-20240229价格同 gpt-4
Claude 3 与 Claude 2.1 为 200k 上下文,Claude 2 为 100k 上下文,Claude 全系并发较低,出现 403, 503 等报错为正常速率限制情况。

SparkDesk 讯飞星火

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
spark-desk-v1.5对齐官网计费0.150.15
spark-desk-v2对齐官网计费0.30.3
spark-desk-v3对齐官网计费0.30.3

ChatGLM 智谱清言

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
zhipu-chatglm-turbo对齐官网计费0.050.05
zhipu-chatglm-pro(废弃)对齐官网计费0.10.1
zhipu-chatglm-std(废弃)对齐官网计费0.050.05
zhipu-chatglm-lite(废弃)对齐官网计费0.050.05

DashScope 通义千问

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
qwen-plus对齐官网计费0.20.2
qwen-plus-net对齐官网计费0.20.2
qwen-turbo对齐官网计费0.080.08
qwen-turbo-net对齐官网计费0.080.08

Google Gemini / PaLM2

模型回答 Token (点数 / 次数)
gemini-pro, gemini-pro-vision0.05 / 次

New Bing

New Bing 为逆向模型,不保证并发,出现错误为正常现象。
模型回答 Token (点数 / 次数)
bing-creative0.1 / 次
bing-balanced0.1 / 次
bing-precise0.1 / 次

腾讯混元

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
hunyuan对齐官网计费11

360 智脑

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
360-gpt-v9对齐官网计费0.120.12

百川 AI

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
baichuan-53b对齐官网计费0.20.2

火山方舟(抖音豆包)

模型费率问题 Token (点数 / 1k token)回答 Token (点数 / 1k token)
skylark-lite-public对齐官网计费0.040.04
skylark-plus-public对齐官网计费0.080.08
skylark-pro-public对齐官网计费0.110.11
skylark-chat对齐官网计费0.110.11

最低余额限制

为了防止超出余额的部分过多,同时为了防止滥用,Chat Nio 设定了特定模型的最低余额预检,当小于该余额时,不可发起请求。

对于按照次数计费模型,最低余额为单次调用费用。(如:模型 0.1 点数 / 次, 最低可调用点数余额为 0.1)

对于按照 Token 计费模型,最低余额为 1K 输入 Token 费用 + 1K 输出 Token 费用。(如:模型输入输出均为 0.1 点数 / 1k tokens, 最低可调用点数余额为 0.1 + 0.1 = 0.2)

对于不计费模型,无最低余额限制。


常见问题解答❓

🍀 AI 模型相关

问 GPT-4, GPT-4V, GPT-4 DALLE, GPT-4 ALL, GPT-4 32k 都有什么区别?

  1. GPT-4GPT-4 32k 为纯文字模型, 对接官方 API,普通 GPT-4 上下文长度为 8K Tokens,32K 上下文长度顾名思义为 32K Tokens, 32K 不常用,价格约为 GPT-4 的两倍,仅作为大数据分析情况使用,正常使用 GPT-4 即可。
  2. GPT-4V, GPT-4 DALLE 为多模态模型,由 Plus 逆向而成, 4V可以识别图片,DALLE3 可生成图片。因其为 Plus 逆向,有时会有额度不足的情况,出现 500 为正常现象,等 Plus 账号池额度恢复即可(三小时以内)。
  3. GPT-4 ALL 为 Alpha 号逆向而成,同时兼顾 DALLE3 绘图功能和识别图片能力,上下文长度可达 128k

问 Claude 100k 是什么?

Claude 100k 支持 100k 上下文,支持大文本解析等功能,从大文章理解能力考虑来看是不错的选择。

问 为什么我选 GPT-4 模型,但是他说是基于 GPT-3 架构?

此为正常现象,GPT-4会回答自己为“基于 GPT-3 架构开发(还不是回答 GPT3.5架构)”, 您可以提问诸如“_鲁迅为什么暴打周树人, 打鸟问题,Tile T2 Project_” 等问题综合辨别市面上的真假 GPT-4 模型。3.5 会开始胡编模式说为两个人,4 会正常回答。(此问题已过时)

问 如何计算 Token 消耗

询问模型自己用了多少 token 是不可行的,模型只会得出错误答案。Token 计算方法请前往 OpenAI 官方 Token 计算器 https://platform.openai.com/tokenizer 进行计算,并乘以权重 TokensPerMessage 参数(一般为 _3_)。

在一次请求中,输入 token 即为携带的历史的上下文(默认最多携带 8 轮上下文对话),输出token即为模型的回复。

Tokenizer 的计算方法请查看 OpenAI Cookbox,青栀AI 的 Token 计费方式完全参照 OpenAI 官方进行,后端使用 Tiktoken Go 库进行计算。

OpenAI Cookbox

Tiktoken Go

🔨 常见报错原因列表

  • 504 Gateway Timeout:网关超时,服务异常(常发生于服务器满负载运行时或者 CDN 网关超过最大 Timeout),请联系网站相关人员解决。
  • 503 Service Unavailable:服务暂时不可用。常发生于上游流量过大无法提供服务(如 Poe 逆向)。
  • 500 Internal Server Error:上游服务端异常 (如 OpenAI 受到的流量过大时拒绝服务)。
  • 404 Not Found: 出现于逆向模型。如上文所述,会有逆向账户鉴权失败或者逆向库失效的情况,为正常现象,等恢复即可。
  • 403 Forbidden:拒绝服务。速率限制,或者会有逆向账户额度不足的情况,等账号池额度恢复即可。
  • 402 Payment Required:账号池轮询到了余额不足的账户,请刷新重试。
  • 401 Unauthorized:账号池轮询到了被封禁 / 不存在的账户,请刷新重试。
  • 400 Bad Request:错误请求。参数设置不正确,或者上下文 Token 大小超过该模型的最大上下文。
现在已有 0 条评论,11 人点赞
Comment:共0条
发表
搜 索 消 息 足 迹
你还不曾留言过..
你还不曾留下足迹..
博主 不再显示
博主