费用标准及模型列表
模型(Model) | 请求(Input) | 回答(Output) | 是否支持 | 特点 |
---|---|---|---|---|
o3 | 0.08 / 1K Tokens | 0.32 / 1K Tokens | 支持 | 为数学、科学、编码、视觉推理任务和技术写作设定了新的标准。 指向o3-2025-04-16 |
o3-2025-04-16 | 0.08 / 1K Tokens | 0.32 / 1K Tokens | 支持 | 为数学、科学、编码、视觉推理任务和技术写作设定了新的标准。 |
o4-mini | 0.0088 / 1K Tokens | 0.0352 / 1K Tokens | 支持 | 为数学、科学、编码、视觉推理任务和技术写作设定了新的标准。 指向o4-mini-2025-04-16 |
o4-mini-2025-04-16 | 0.0088 / 1K Tokens | 0.0352 / 1K Tokens | 支持 | 为数学、科学、编码、视觉推理任务和技术写作设定了新的标准。 |
gpt-4.1 | 0.014 / 1K Tokens | 0.056 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 指向gpt-4.1-2025-04-14 |
gpt-4.1-2025-04-14 | 0.014 / 1K Tokens | 0.056 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 |
gpt-4.1-mini | 0.0028 / 1K Tokens | 0.0112 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 指向gpt-4.1-mini-2025-04-14 |
gpt-4.1-mini-2025-04-14 | 0.0028 / 1K Tokens | 0.0112 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 |
gpt-4.1-nano | 0.0007 / 1K Tokens | 0.0028 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 指向gpt-4.1-nano-2025-04-14 |
gpt-4.1-nano-2025-04-14 | 0.0007 / 1K Tokens | 0.0028 / 1K Tokens | 支持 | OpenAI最新推出的模型 在编码、指令跟踪和长上下文方面都有重大改进1M输入32k输出 |
gpt-3.5-turbo | 0.0035 / 1K Tokens | 0.0105 / 1K Tokens | 支持 | 默认模型,等于gpt-3.5-turbo-0125 |
gpt-3.5-turbo-1106 | 0.007 / 1K Tokens | 0.014 / 1K Tokens | 支持 | 2023年11月6日更新的模型 |
gpt-3.5-turbo-0125 | 0.0035 / 1K Tokens | 0.0105 / 1K Tokens | 支持 | 2024年1月25日最新模型,数据最新,价格更更低,速度更快,修复了一些1106的bug。 |
gpt-3.5-turbo-16k | 0.021 / 1K Tokens | 0.028 / 1K Tokens | 支持 | 适合快速回答简单问题,字数更多 |
gpt-3.5-turbo-instruct | 0.0105 / 1K Tokens | 0.014 / 1K Tokens | 支持 | Completions模型 用于文本生成,提供准确的自然语言处理模型一般人用不上 |
gpt-4.5-preview | 0.525 / 1K Tokens | 1.05 / 1K Tokens | 支持 | openai最新模型,gpt-4.5 |
gpt-4.5-preview-2025-02-27 | 0.525 / 1K Tokens | 1.05 / 1K Tokens | 支持 | openai最新模型,gpt-4.5 |
o1-mini | 0.021 / 1K Tokens | 0.084 / 1K Tokens | 支持 | 针对复杂任务的推理模型 |
o1-preview | 0.105 / 1K Tokens | 0.42 / 1K Tokens | 支持 | 针对复杂任务的推理模型 |
o3-mini [5] | 0.0088 / 1K Tokens | 0.0352 / 1K Tokens | 支持 | 针对复杂任务的推理模型 |
o1 [5] | 0.12 / 1K Tokens | 0.48 / 1K Tokens | 支持 | 针对复杂任务的推理模型,迄今为止最牛的模型 |
gpt-4o-search-preview | 0.02125/1K Tokens | 0.085/1K Tokens | 支持 | Openai 出的搜索模型,支持网络搜索,指向最新的4o的搜索模型 |
gpt-4o-search-preview-2025-03-11 | 0.02125/1K Tokens | 0.085/1K Tokens | 支持 | Openai 出的搜索模型,支持网络搜索 |
gpt-4o-mini-search-preview | 0.001275/1K Tokens | 0.0051 /1K Tokens | 支持 | Openai 出的搜索模型,支持网络搜索,指向最新的4o-mini的搜索模型 |
gpt-4o-mini-search-preview-2025-03-11 | 0.001275/1K Tokens | 0.0051 /1K Tokens | 支持 | Openai 出的搜索模型,支持网络搜索 |
gpt-4 | 0.21 / 1K Tokens | 0.42 / 1K Tokens | 支持 | 默认模型,等于gpt-4-0613 |
gpt-4o | 0.0175/1K Tokens + 图片费用[2] | 0.07/1K Tokens | 支持 | Openai 价格更低, 速度更快更聪明,指向最新版的4o版本 |
gpt-4o-2024-05-13 | 0.035/1K Tokens + 图片费用[2] | 0.105/1K Tokens | 支持 | Openai 2024-05-13出的gpt-4o模型 |
gpt-4o-2024-08-06 | 0.0175/1K Tokens + 图片费用[2] | 0.07/1K Tokens | 支持 | Openai 2024-08-06出的gpt-4o模型 支持128k输入,16k输出 |
gpt-4o-2024-11-20 | 0.0175/1K Tokens + 图片费用[2] | 0.07/1K Tokens | 支持 | Openai 2024-11-20出的gpt-4o模型, 该模型的创意写作能力得到了提升一更自然 、更有吸引力、更有针对性的写作 |
chatgpt-4o-latest | 0.035/1K Tokens + 图片费用[2] | 0.105/1K Tokens | 支持 | 动态更新的版本,持续集成OpenAI最新的研究成果[4] |
gpt-4o-mini | 0.00105/1K Tokens + 图片费用[2] | 0.0042/1K Tokens | 支持 | Openai 最新模型, 价格更低, 输出质量在3.5之上4o之下, 并且支持读图 |
gpt-4-0613 | 0.21 / 1K Tokens | 0.42 / 1K Tokens | 支持 | 2023年6月13日更新的模型 |
gpt-4-turbo-preview | 0.07 / 1K Tokens | 0.21 / 1K Tokens | 支持 | 最新模型,输入128K,输出最大4K,知识库最新2023年4月, 此模型始终指向最新的4的preview模型 |
gpt-4-0125-preview | 0.07 / 1K Tokens | 0.21 / 1K Tokens | 支持 | 2024年1月25日更新的模型,输入128K,输出最大4K,知识库最新2023年4月, 修复了一些1106的bug |
gpt-4-1106-preview | 0.07 / 1K Tokens | 0.21 / 1K Tokens | 支持 | 2023年11月6日更新的模型,输入128K,输出最大4K,知识库最新2023年4月 |
gpt-4-vision-preview | 0.07 / 1K Tokens + 图片费用[2] | 0.21 / 1K Tokens | 支持 | 多模态,支持图片识别 |
gpt-4-turbo | 0.07 / 1K Tokens + 图片费用[2] | 0.21 / 1K Tokens | 支持 | Openai 最新模型多模态,支持图片识别,支持函数tools |
gpt-4-turbo-2024-04-09 | 0.07 / 1K Tokens + 0.10115*图片个数[2] | 0.21 / 1K Tokens | 支持 | Openai 最新模型多模态,支持图片识别,支持函数tools |
gpt-3.5-turbo-ca | 0.001 / 1K Tokens | 0.003 / 1K Tokens | 支持 | Azure openai中转(也属于官方模型的一种)价格便宜, 但是回复的慢一些 |
gpt-4-ca | 0.12 / 1K Tokens | 0.24 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
gpt-4-turbo-ca | 0.04 / 1K Tokens + 0.0578*图片个数[3] | 0.12 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
gpt-4o-ca | 0.01 / 1K Tokens + 0.0289*图片个数[3] | 0.04 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
gpt-4o-mini-ca | 0.00075 / 1K Tokens | 0.003 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
chatgpt-4o-latest-ca | 0.02 / 1K Tokens | 0.06 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
o1-mini-ca | 0.012 / 1K Tokens | 0.048 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
o1-preview-ca | 0.06 / 1K Tokens | 0.24 / 1K Tokens | 支持 | 第三方优质提供商提供的服务,优点价格便宜,但是稳定性没有非-ca的好, 模型返回和能力都是一样的 |
deepseek-reasoner | 0.0036 / 1K Tokens | 0.0144 / 1K Tokens | 支持 | deepseek的思考R1模型, 此模型由第三方供应商自己部署提供,有小概率可能会出现响应速度较慢或报错的情况。 |
deepseek-r1 | 0.0024 / 1K Tokens | 0.0096 / 1K Tokens | 支持 | deepseek的思考R1模型, 此模型由第三方(火山引擎)供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
deepseek-v3 | 0.0012 / 1K Tokens | 0.0048 / 1K Tokens | 支持 | deepseek的聊天模型, 此模型由第三方(火山引擎)供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
claude-3-7-sonnet-20250219 | 0.015 / 1K Tokens | 0.075 / 1K Tokens | 支持 | claude的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
claude-3-5-sonnet-20240620 | 0.015 / 1K Tokens | 0.075 / 1K Tokens | 支持 | claude的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
claude-3-5-sonnet-20241022 | 0.015 / 1K Tokens | 0.075 / 1K Tokens | 支持 | claude的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
claude-3-5-haiku-20241022 | 0.005 / 1K Tokens | 0.025 / 1K Tokens | 支持 | claude的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-1.5-flash-latest | 0.0006 / 1K Tokens | 0.0024 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-1.5-pro-latest | 0.01 / 1K Tokens | 0.04 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情 况。 |
gemini-exp-1206 | 0.01 / 1K Tokens | 0.04 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-2.0-flash-exp | 0.01 / 1K Tokens | 0.04 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-2.0-pro-exp-02-05 | 0.01 / 1K Tokens | 0.04 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-2.0-flash | 0.005 / 1K Tokens | 0.02 / 1K Tokens | 支持 | Google Gemini 的模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-2.5-pro-exp-03-25 | 0.01 / 1K Tokens | 0.04 / 1K Tokens | 支持 | 是gemini 最新的旗舰模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
gemini-2.5-flash-preview-04-17 | 0.0006 / 1K Tokens | 0.014 / 1K Tokens | 支持 | 是gemini 最新的旗舰模型, 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
grok-3 | 0.016 / 1K Tokens | 0.08 / 1K Tokens | 支持 | grok基础模型(网页逆向版), 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
grok-3-reasoner | 0.016 / 1K Tokens | 0.08 / 1K Tokens | 支持 | 推理增强模型(网页逆向版), 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的 情况。 |
grok-3-deepsearch | 0.016 / 1K Tokens | 0.08 / 1K Tokens | 支持 | 深度联网搜索模型(网页逆向版), 此模型由第三方供应商提供,有小概率可能会出现响应速度较慢或报错的情况。 |
模型(Model) | 价格 | 是否支持 |
---|---|---|
gpt-image-1 | 文字输入: 0.04CA/1K Tokens, 图片输入: 0.08CA/1K Tokens, 图片输入:0.32 CA/1K Tokens | 支持 |
dall-e-3 1024×1024 | 0.280 / image | 支持 |
dall-e-3 1024×1792 | 0.560 / image | 支持 |
dall-e-3-hd 1024×1024 | 0.560 / image | 支持 |
dall-e-3-hd 1024×1792 | 0.840 / image | 支持 |
dall-e-2 1024×1024 | 0.14 / image | 支持 |
dall-e-2 512x512 | 0.126 / image | 支持 |
dall-e-2 256x256 | 0.112 / image | 支持 |
tts-1 | 0.105 / 1K characters | 支持 |
tts-1-hd | 0.21 / 1K characters | 支持 |
gpt-4o-mini-tts | (0.12 / minute) + (0.012 / 1kToken) | 支持 |
Whisper | 0.042 / minute | 支持 |
gpt-4o-mini-transcribe | 0.024 / minute | 支持 |
gpt-4o-transcribe | 0.048 / minute | 支持 |
text-embedding-ada-002 | 0.0007 / 1K Tokens | 支持 |
text-embedding-3-small | 0.00014 / 1K Tokens | 支持 |
text-embedding-3-large | 0.00091 / 1K Tokens | 支持 |
[2] 多模态模型图片如何计算占用tokens请参考OpenAI官方 https://openai.com/api/pricing 。分辨率越高,tokens占用越多,但最高不会超过1445tokens。
以下以1000x150分辨率的图片为例,计算图片占用Tokens数为425。
[3] CA系列多模态模型在计算图片价格时,如果使用流式传输(参数stream=true),则按照0.10115每张图计费;如果使用非流式传输(参数stream=false),这时按照OpenAI返回的实际消耗量计费,如果你的图片分辨率较低,通常低于0.10115。因此,我们建议在使用gpt-4-turbo分析图片时,使用非流式传输(参数stream=false)。
[4] 动态更新的版本,持续集成OpenAI最新的研究成果。它为开发人员和研究人员提供了探索最前沿技术的机会。请注意,尽管该模型展示 了最新的能力,但对于生产环境的使用,我们仍然建议选择经过优化的旧版GPT模型,以确保更高的稳定性和性能
[5] o1和o3-mini由于这两种模型的可用账号数量较少,资源稳定性可能存在波动,即可能出现时可用、时不可用的情况。建议如在生产环境中使用时做好相应的容错处理。
修改于 2025-05-06 10:08:19