模型
OpenAI API 由具有不同功能和价格点的多种模型提供支持。您还可以通过微调对我们的模型进行自定义,以满足您的特定使用案例。
模型描述
模型 | 模型描述 |
---|---|
GPT-4 | 改进自 GPT-3.5,可以理解和生成自然语言或代码 |
GPT-3.5 | 改进自 GPT-3,可以理解和生成自然语言或代码 |
GPT 基础 | 可以理解和生成自然语言或代码的一系列模型,不含遵循指示功能 |
DALL·E | 根据自然语言提示可以生成和编辑图像的模型 |
Whisper | 可以将音频转换为文本的模型 |
嵌入式 | 可以将文本转换为数值形式的一系列模型 |
内容审核 | 经微调可以检测文本是否敏感或不安全的模型 |
我们还发布了开源模型,包括 Point-E、Whisper、Jukebox 和 CLIP。
请访问我们为研究人员准备的模型索引,以了解更多有关哪些模型在我们的研究论文中得到展示以及不同模型系列(如 InstructGPT 和 GPT-3.5)之间的区别的信息。
持续模型升级
根据开发者反馈,我们将在 OpenAI API 中继续支持 gpt-3.5-turbo-0301 和 gpt-4-0314 模型,直至 2024 年 6 月 13 日。我们已经在 6 月 13 日的博文中提供了更多细节。
随着 gpt-3.5-turbo 的发布,我们的一些模型现在采用持续更新。gpt-3.5-turbo、gpt-4 和 gpt-4-32k 指向最新模型版本。您可以通过查看 ChatCompletion 请求后的响应对象来验证这一点。响应将包括使用的特定模型版本(例如 gpt-3.5-turbo-0613)。
我们还提供开发者可以在推出更新模型后至少使用 3 个月的静态模型版本。随着模型更新节奏的加快,我们也让人们有机会贡献评估,以帮助我们根据不同的用例改进模型。如果您有兴趣,请查看 OpenAI Evals 存储库。
以下模型是临时快照,我们将在更新版本可用时宣布其弃用日期。如果您想使用最新模型版本,请使用 gpt-4 或 gpt-3.5-turbo 等标准模型名称。
以下模型是临时快照,我们将在更新版本可用时宣布其弃用日期。如果您想使用最新模型版本,请使用 gpt-4 或 gpt-3.5-turbo 等标准模型名称。
模型名称 | 弃用日期 | 替代模型 |
---|---|---|
gpt-3.5-turbo-0301 | 最早 2024-06-13 | gpt-3.5-turbo-0613 |
gpt-4-0314 | 最早 2024-06-13 | gpt-4-0613 |
gpt-4-32k-0314 | 最早 2024-06-13 | gpt-4-32k-0613 |
GPT-4
目前,通过我们的开发者平台成功付款至少一次的用户可以访问 GPT-4。
GPT-4 是一个大型多模态模型(今天接受文本输入并发出文本输出,未来将接受图像输入),由于其更广泛的一般知识和高级推理能力,它可以比我们以前的任何模型都能更准确地解决困难问题。与 gpt-3.5-turbo 一样,GPT-4 经过了针对聊天的优化,但也适用于使用 Chat 完成 API 的传统完成任务。请参阅我们的 GPT 指南以了解如何使用 GPT-4。
最新模型 | 描述 | 最大 token 数 | 训练数据量 |
---|---|---|---|
gpt-4 | 比任何 GPT-3.5 模型都更强大,能够完成更复杂的任务,并针对聊天进行了优化。将在最新模型迭代版本发布后 2 周内进行更新。 | 8,192 个 token | 2021 年 9 月之前 |
gpt-4-0613 | 2023 年 6 月 13 日gpt-4 快照,具有函数调用数据。与gpt-4 不同,此模型不会接收更新,并会在新版本发布 3 个月后弃用。 |
8,192 个 token | 2021 年 9 月之前 |
gpt-4-32k | 与标准gpt-4 模型具有相同功能,但上下文长度是其 4 倍。将随最新模型迭代版本一起更新。 |
32,768 个 token | 2021 年 9 月之前 |
gpt-4-32k-0613 | 2023 年 6 月 13 日gpt-4-32k 的快照。与gpt-4-32k 不同,此模型不会接收更新,并会在新版本发布 3 个月后弃用。 |
32,768 个 token | 2021 年 9 月之前 |
gpt-4-0314(旧版) | 2023 年 3 月 14 日gpt-4 的快照,具有函数调用数据。与gpt-4 不同,此模型不会接收更新,并将最早在 2024 年 6 月 13 日停用。 |
8,192 个 token | 2021 年 9 月之前 |
gpt-4-32k-0314(旧版) | 2023 年 3 月 14 日gpt-4-32k 的快照。与gpt-4-32k 不同,此模型不会接收更新,并将最早在 2024 年 6 月 13 日停用。 |
32,768 个 token | 2021 年 9 月之前 |
GPT-3.5
GPT-3.5 模型可以理解和生成自然语言或代码。GPT-3.5 家族中最强大且性价比最高的模型是gpt-3.5-turbo
,它通过 Chat 完成 API 进行了针对聊天的优化,但也适用于传统的完成任务。
最新模型 | 描述 | 最大 token 数 | 训练数据量 |
---|---|---|---|
gpt-3.5-turbo | 最强大的 GPT-3.5 模型,优化了聊天,成本仅为`text-davinci-003`的 1/10。将在最新模型迭代版本发布后 2 周内进行更新。 | 4,097 个 token | 2021 年 9 月之前 |
gpt-3.5-turbo-16k | 与标准`gpt-3.5-turbo`模型具有相同功能,但上下文是其 4 倍。 | 16,385 个 token | 2021 年 9 月之前 |
gpt-3.5-turbo-instruct | 与`text-davinci-003`具有相似功能,但兼容旧的 Completions 端点,而不是 Chat Completions。 | 4,097 个 token | 2021 年 9 月之前 |
gpt-3.5-turbo-0613 | 2023 年 6 月 13 日`gpt-3.5-turbo`的快照,具有函数调用数据。与`gpt-3.5-turbo`不同,此模型不会接收更新,并会在新版本发布 3 个月后弃用。 | 4,097 个 token | 2021 年 9 月之前 |
gpt-3.5-turbo-16k-0613 | 2023 年 6 月 13 日`gpt-3.5-turbo-16k`的快照。与`gpt-3.5-turbo-16k`不同,此模型不会接收更新,并会在新版本发布 3 个月后弃用。 | 16,385 个 token | 2021 年 9 月之前 |
gpt-3.5-turbo-0301(旧版) | 2023 年 3 月 1 日`gpt-3.5-turbo`的快照。与`gpt-3.5-turbo`不同,此模型不会接收更新,并将最早在 2024 年 6 月 13 日停用。 | 4,097 个 token | 2021 年 9 月之前 |
text-davinci-003(旧版) | 相比 curie、babbage 或 ada 模型,可以以更高质量、更长输出和一致的指令遵循来执行任何语言任务。还支持一些附加功能,如插入文本。 | 4,097 个 token | 2021 年 6 月之前 |
text-davinci-002(旧版) | 与`text-davinci-003`具有相似功能,但使用监督微调而不是强化学习进行训练 | 4,097 个 token | 2021 年 6 月之前 |
code-davinci-002(旧版) | 针对代码完成任务进行了优化 | 8,001 个 token | 2021 年 6 月之前 |
我们建议使用 gpt-3.5-turbo
而不是其他 GPT-3.5 模型,因为它的成本更低,性能更好。
OpenAI 的模型是不确定定的,这意味着相同的输入可能产生不同的输出。将温度设置为 0 将使输出基本确定,但可能仍会保留很小的变异。
GPT 基础
GPT 基础模型可以理解和生成自然语言或代码,但未进行指令遵循训练。这些模型是为替代我们原有的 GPT-3 基础模型而设计的,并使用传统的 Completions API。大多数客户应该使用 GPT-3.5 或 GPT-4。
最新模型 | 描述 | 最大 token 数 | 训练数据量 |
---|---|---|---|
babbage-002 | GPT-3 ada 和 babbage 基础模型的替代品。 |
16,384 个 token | 2021 年 9 月之前 |
davinci-002 | GPT-3 curie 和 davinci 基础模型的替代品。 |
16,384 个 token | 2021 年 9 月之前 |
DALL·E
DALL·E 是一个 AI 系统,可以从自然语言描述中创建逼真的图像和艺术作品。我们目前支持根据提示创建新图像(具有特定大小)、编辑现有图像或创建用户提供图像的变体的功能。
目前通过我们的 API 提供的 DALL·E 模型是 DALL·E 的第二代迭代版本,其图像比原始模型更逼真、准确,分辨率提高了 4 倍。您可以通过我们的实验室界面或 API 尝试它。
Whisper
Whisper 是一个通用语音识别模型。它使用大量不同音频进行训练,也是一个多任务模型,可执行多语言语音识别以及语音翻译和语言识别。目前可以通过我们的 API 使用whisper-1
模型名称访问 Whisper v2-large 模型。
目前,Whisper 的开源版本与我们 API 提供的版本之间没有区别。但是,通过我们的 API,我们提供了优化的推理流程,这使得通过我们的 API 运行 Whisper 比其他方式快得多。有关 Whisper 的更多技术细节,您可以阅读该论文。
嵌入式
嵌入式是文本的数值表示,可用于测量两段文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002
旨在以更低的成本取代之前的 16 个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博文中了解有关我们最新嵌入式模型的更多信息。
内容审核
内容审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供分类功能,查找以下类别的内容:仇恨、仇恨/威胁、自残、性、性/未成年、暴力和暴力/图形。您可以在我们的内容审核指南中了解更多信息。
内容审核模型以任意大小的输入作为输入,该输入会自动分成 4096 个 token 的块。在输入超过 8k 个 token 的罕见情况下,可能会使用截断从审核中省略少量 token。
每个对内容审核端点的请求的最终结果以每个类别的最大值显示。例如,如果一个 4K 个 token 的块的类别得分为 0.9901,另一个块的得分为 0.1901,则结果将显示 0.9901,因为它更高。
模型 | 描述 | 最大 token 数 |
---|---|---|
text-moderation-latest | 最强大的审核模型。精度将比稳定模型略高。 | 不适用 |
text-moderation-stable | 几乎与最新模型一样强大,但稍微旧一些。 | 不适用 |
GPT-3
旧版
GPT-3 模型可以理解和生成自然语言。这些模型已被更强大的 GPT-3.5 代模型所取代。但是,原始的 GPT-3 基础模型(davinci
、curie
、ada
和babbage
)目前是唯一可用于微调的模型。
最新模型 | 描述 | 最大 token 数 | 训练数据量 |
---|---|---|---|
text-curie-001 | 非常强大,比 Davinci 更快更省钱。 | 2,049 个 token | 2019 年 10 月之前 |
text-babbage-001 | 能够执行简单的任务,非常快速且低成本。 | 2,049 个 token | 2019 年 10 月之前 |
text-ada-001 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的模型,成本也最低。 | 2,049 个 token | 2019 年 10 月之前 |
davinci | 最强大的 GPT-3 模型。可以执行其他模型能执行的任何任务,通常质量更高。 | 2,049 个 token | 2019 年 10 月之前 |
curie | 非常强大,但比 Davinci 更快更省钱。 | 2,049 个 token | 2019 年 10 月之前 |
babbage | 能够执行简单的任务,非常快速且低成本。 | 2,049 个 token | 2019 年 10 月之前 |
ada | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的模型,成本也最低。 | 2,049 个 token | 2019 年 10 月之前 |
我们如何使用您的数据
您的数据属于您。
从 2023 年 3 月 1 日起,发送到 OpenAI API 的数据将不会被用来训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的一个优点是随着时间的推移,模型可能会在您的使用案例上有所改进。
为了帮助识别滥用行为,API 数据可能会保留长达 30 天,之后将被删除(法律另有规定除外)。对于拥有敏感应用程序的可信客户,可以提供零数据保留。采用零数据保留意味着请求和响应正文不会被持久化到任何日志机制中,并仅存在于内存中以服务请求。
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·E 实验室。
各端点的默认使用政策
端点 | 数据是否用于训练 | 默认保留 | 是否有资格获得零保留 |
---|---|---|---|
/v1/completions |
否 | 30 天 | 是 |
/v1/chat/completions |
否 | 30 天 | 是 |
/v1/edits |
否 | 30 天 | 是 |
/v1/images/generations |
否 | 30 天 | 否 |
/v1/images/edits |
否 | 30 天 | 否 |
/v1/images/variations |
否 | 30 天 | 否 |
/v1/embeddings |
否 | 30 天 | 是 |
/v1/audio/transcriptions |
否 | 零数据保留 | 不适用 |
/v1/audio/translations |
否 | 零数据保留 | 不适用 |
/v1/files |
否 | 客户删除之前 | 否 |
/v1/fine_tuning/jobs |
否 | 客户删除之前 | 否 |
/v1/fine-tunes |
否 | 客户删除之前 | 否 |
/v1/moderations |
否 | 零数据保留 | 不适用 |
详细信息请参阅我们的 API 数据使用政策。要了解关于零保留的更多信息,请联系我们的销售团队。
模型端点兼容性
端点 | 最新模型 |
---|---|
/v1/audio/transcriptions |
whisper-1 |
/v1/audio/translations |
whisper-1 |
/v1/chat/completions |
gpt-4 , gpt-4-0613 , gpt-4-32k , gpt-4-32k-0613 , gpt-3.5-turbo , gpt-3.5-turbo-0613 , gpt-3.5-turbo-16k , gpt-3.5-turbo-16k-0613 |
/v1/completions (旧版) |
gpt-3.5-turbo-instruct , babbage-002 , davinci-002 |
/v1/embeddings |
text-embedding-ada-002 |
/v1/fine_tuning/jobs |
gpt-3.5-turbo , babbage-002 , davinci-002 |
/v1/moderations |
text-moderation-stable , text-moderation-latest |
此列表不包含我们的所有 DALL·E 模型和已弃用模型。