GPT-4o API 使用指南,实现快速调用

OpenAI 新版本 GPT-4o 来了!这次的强大人工智能可以处理文本、视觉和代码,比其前身提供更快的速度和更低的成本。让我们探索它的功能,将它与 OpenAI API 一起使用!

用 Apifox,节省研发团队的每一分钟

GPT-4o API 使用指南,实现快速调用

免费使用 Apifox

相关推荐

最新文章

API

一体化协作平台

API 设计

API 文档

API 调试

自动化测试

API Mock

API Hub

立即体验 Apifox
目录

5 月 13 日,一款名为 GPT-4o 的新 ChatGPT 模型发布了。与之前的版本相比,GPT-4o 的响应时间提高了一倍,能理解文本、图像、音频和视频。在本文中,我们将全面讲解 OpenAI 最新模型 GPT-4o 的基本信息,并介绍如何将 GPT-4o API 集成到自己的服务中。

🦊
如果你想在自己的项目中实现 GPT-4o 或使用它来开发新项目,我们建议使用 Apifox,一个全能的 API 管理工具。 Apifox 提供对 OpenAI API 项目的便捷访问,以便在你自己的项目中立即使用、测试和实施 GPT-4o API。

Apifox 也是一个完全免费的工具,可以点击按钮了解详情。

什么是 GPT-4o?

GPT-4o 是 OpenAI 于 5 月 13 日宣布的最新 AI 模型。 “4o”中的“o”代表“omni”,意思是“全方位的”。与 ChatGPT 基于文本和图像的交互不同,GPT-4o 允许使用文本、音频、图像和视频的组合与其进行交互。

什么是 GPT-4o?

更多详情可以访问官网https://openai.com/index/hello-gpt-4o/

GPT-4o 的特点

那么,OpenAI 的最新模型 GPT-4o 与之前的模型相比有哪些特点呢?

响应时间缩短

根据 OpenAI 的说法,GPT-4 与人类对话需要三个步骤:

  1. 将语音转换为文本
  2. 生成响应文本
  3. 将文本转换为语音

在之前的模型中,GPT-3.5 平均延迟为 2.8 秒,GPT-4 平均延迟为 5.4 秒。然而,最新的 GPT-4o 可以在短短 2.32 秒内做出响应,平均响应时间为 3.20 秒,几乎与人类的反应速度相同。也就是说,使用最新的 GPT-4o 模型与 AI 实现近乎实时的交互。

理解音频情感标记

以前的 GPT 模型无法识别说话者的语气或背景噪音,导致对话时常常丢失一些信息。然而随着 GPT-4o 的推出,它现在可以理解说话者的音频标记,或者说是情感,使其更加像人类。

GPT-4o 的特点

Token 花费减少

此外,GPT-4o 压缩了日语等 20 种语言使用的标记数量。比如日语,意味着在日语中使用 ChatGPT 时,将使用更少的 Tokens。

比如,交互“你好,我叫 GPT-4o,我是一种新型语言模型,很高兴认识你”,使用的 Tokens 数量从 37 个减少到 24 个。

使用 ChatGPT 时,将使用更少的 Tokens

基本免费

GPT-4o 发布后,之前付费的服务(例如 GPT、GPT Store 和 GPT-4)将免费提供。

提供桌面客户端

ChatGPT 迄今为止仅在线提供,但在 GPT-4o 模型公告中发布了新的 macOS ChatGPT 桌面应用程序。 Windows 应用程序预计也将在今年下半年发布。

GPT-4o API 的使用

在开发 Web 应用程序时,使用 API 将 AI 功能集成到自己的服务中非常方便。随着 GPT-4o 模型的发布,我们也可以使用 API 将 GPT-4o 模型的出色功能引入到自己的服务中。那么我们需要知道,GPT-4o API 可以用吗?它要多少钱?

GPT-4o API 可用吗?

根据 OpenAI 的最新信息,GPT-4o 模型 API 已经在 Chat Completions API、Assistants API 和 Batch API 中作为文本和视觉模型提供。

GPT-4o API 升级

与之前的 ChatGPT 模型 API 相比,GPT-4o API 具有以下优势:

  • 更智能:在文本分析、推理、编程能力上,提供 GPT-4 Turbo 级别的性能,在多语言、音频和视觉能力上设立了新的高标准。
  • 响应速度提升:与 GPT-4 Turbo 相比,响应速度提升 2 倍。
  • 价格减半:无论是输入还是输出标记,价格都比 GPT-4 Turbo 便宜 50%。
  • 速率限制值提高: 速度限制比 GPT-4 Turbo 高出 5 倍,最高可达每分钟 1000 万个 Tokens。
  • 视觉能力优化:视觉能力全面优化。
  • 非英语语言处理能力提升:优化了对非英语语言的处理,在标记化非英语文本时更为高效。

GPT-4o API 定价

那么,使用这个最新的 GPT-4o API 模型需要花多少钱呢?

根据 OpenAI API 官方网站的信息,GPT-4o 比 GPT-4 Turbo 更快且更具性价比,同时具备更强大的视觉能力。它具有 128K 的上下文,涵盖截至 2023 年 10 月的知识。而且它的价格只有 GPT-4 Turbo 的一半。

具体定价方案如下:

根据 OpenAI API 定价页面,GPT-4o 文本输入和输出的成本为:

  • 输入:5 美元 / 1M tokens
  • 输出:15 美元 / 1M tokens

视觉处理的成本是基于图像的宽度和高度计算的。

下图的示例中,处理一张 1150px × 150px 的图像成本为 0.001275 美元,而且还可以选择低分辨率选项。

GPT-4o 文本输入和输出的成本

所以,无论是输入、输出还是图像生成,使用 GPT-4o API 的成本都是 GPT-4 Turbo 的一半。

使用 GPT-4o API 的注意事项

使用 GPT-4o API 或从其他版本切换到 GPT-4o API 时,需要注意以下几点:

  1. GPT-4o API可以通过感知能力理解没有音频的视频。也就是说,需要将视频转换成帧(每秒2-4帧,可以均匀采样或者使用关键帧选择算法),然后将这些帧输入到模型中。
  2. 截至 2024 年 5 月 14 日,GPT-4o API 暂不支持音频模式。但 OpenAI 预计在未来几周内会向内测人员提供音频模式。
  3. 截至 2024 年 5 月 14 日,GPT-4o API 暂不支持图像生成,因此图像生成目前还是建议使用 DALL-E 3 API。
  4. OpenAI 官方建议使用 GPT-4 或 GPT-4 Turbo 的所有用户考虑切换到 GPT-4o。GPT-4o 不一定比 GPT-4 或 GPT-4 Turbo 更强大,所以 OpenAI 建议在考虑切换之前比较输出并尝试 GPT-4o 来评估其功能。

使用 Apifox 管理 GPT-4o API

使用 GPT-4o API 时,API 调试和管理等任务就非常重要。

通过使用超便捷的 API 管理工具 Apifox,你可以更方便、更高效地管理任何 API。由于 GPT-4o API 已经可用,你可以访问 Apifox 上的 API Hub 并轻松访问 OpenAI API 项目,将 GPT-4o API 项目克隆到自己的项目中,查看和调试 GPT-4o API,并使用 Apifox 方便地进行管理。

使用 Apifox 管理 GPT-4o API

获取 OpenAI API 密钥使用 GPT-4o API

要开始使用 GPT-4o API,你首先需要获取 OpenAI API 密钥。让我们按照下面的教程获取你的 OpenAI API 密钥。

1. 注册 OpenAI 账户

首先需要创建一个 OpenAI 帐户。访问 OpenAI 官网,点击右上角“Get Started”按钮创建账户。

获取 OpenAI API 密钥使用 GPT-4o API

2.获取 OpenAI API 密钥

创建 OpenAI 帐户后,你需要获取用于身份验证的 API 密钥,有了它才能使用 GPT-4o API 。

  1. 访问 OpenAI 上的 API 密钥页面并使用你的帐户登录(如果没有帐户,则创建一个新帐户)。
  2. 点击“Create new secret key”按钮生成新的 API 密钥。
获取 OpenAI API 密钥使用 GPT-4o API

生成 API 密钥后,会立即显示在屏幕上,你一定要记录并安全存储它,因为后面你将无法再次查看它

方便地测试和管理 GPT-4o API

对于想调用 GPT-4o API 的用户来说,Apifox 是一个非常方便的工具。 Apifox 有一个 OpenAI API 项目,涵盖了 OpenAI 提供的所有 API。从 OpenAI API 项目的左侧菜单中选择聊天(Chat),在请求 Body 里面将模型指定为“gpt-4o”,例如 "model":"gpt-4o" ,这样就可以开始使用 GPT-4o API。

从 OpenAI API 项目使用 GPT-4o API

实战演示:将 GPT-4o API 与 Apifox 结合使用

在 Apifox 上访问 OpenAI API 项目时,你可以按照以下步骤轻松测试 OpenAI API,了解如何将 GPT-4o 与聊天完成 API 结合使用。

访问 Apifox 上的 OpenAI API 项目,从左侧菜单中选择 Chat Completions API ,然后根据 ChatGPT 规范输入 HTTP 方法和端点 URL。

在“Body”选项卡中,以 JSON 格式写入要发送到 ChatGPT 的消息。需要注意的是,使用 GPT-4o,需要通过包含 "model":"gpt-4o" 将模型指定为“gpt-4o”。

将模型指定为“gpt-4o”

切换到“Headers”选项卡,添加授权参数以使用 ChatGPT API 进行身份验证,输入你获得的 ChatGPT API 密钥,然后单击“发送”按钮。

将 GPT-4o API 与 Apifox 结合使用

需要注意的是,在 Apifox 中,你可以将 OpenAI API 密钥存储为环境变量。将 OpenAI API 密钥存储为环境变量,以后就可以直接引用环境,无需重复重新输入,非常方便。

将 OpenAI GPT-4o API 密钥存储为环境变量

总结

在本文中,我们详细介绍了 OpenAI 的最新模型 GPT-4o。

  • GPT-4o 的响应时间比之前的版本快一倍
  • 可以理解文本、图像、音频和视频。
  • 使用 Tokens 数量减少
  • GPT-4o API 具有更高的智能
  • 响应速度加快 2 倍
  • 定价便宜 50%
  • 速率限制提高 5 倍
  • 改进的视觉功能
  • 非英语语言处理能力提升

要使用 GPT-4o API,你需要创建 OpenAI 帐户并获取 API 密钥。使用 Apifox,你可以轻松测试和管理 GPT-4o API。 Apifox 有一个涵盖 GPT-4o API 规范的 OpenAI API 项目,你可以将 API 密钥存储为环境变量以避免重新输入。

将来,GPT-4o API 中将添加音频支持。通过利用 GPT-4o 的优秀功能并将其融入到你的服务中,你可以提供更好的 AI 体验。