API调用文档
  1. 音频模型(Audio)
API调用文档
  • 前言(必读)
  • 常见错误代码及其含义
  • 聊天模型(chat)
    • 聊天接口(通用)
      POST
    • 列出可用模型
      GET
    • 聊天接口(o1系列模型)
      POST
    • 聊天补全
      POST
    • Claude3+(Openai格式调用)
      POST
    • Gemini1.5+(全系列)
      POST
    • GPTs
      POST
    • gpt-4-all 文件分析
      POST
    • gpt-4o-all 文件分析
      POST
    • 聊天接口(图片分析)
      POST
  • 创建嵌入
    • 创建嵌入
      POST
  • 音频模型(Audio)
    • 文字转语音 TTS
      POST
    • 语音转文字 whisper-1
      POST
    • 创建翻译
      POST
  • 绘画模型(Painting)
    • Dalle
      • 图像生成
      • 图像编辑
    • MidJourney
      • 提交模式与状态码说明
  • 常用调用代码整理
    • Python 示例1-1: 普通Post文本对话
    • Python 示例1-2: Openai官方库使用示例
    • Python 示例1-3: 流式输出 复制代码
    • Python 示例2:Json固定格式输出 代码展示 复制代码
    • Python 示例3:embedding代码例子 复制代码
    • Python 示例4:O1系列模型代码例子
  1. 音频模型(Audio)

创建翻译

POST
/v1/audio/translations

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数multipart/form-data
file
file 
必需
音频文件:要转录的音频文件File对象(不是文件名),采用以下格式之一:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。
model
string 
必需
模型名称:必填模型 whisper-1。
示例值:
whisper-1
prompt
string 
可选
提示:一个可选文本,用于引导模型的样式或继续上一个音频片段。提示 必须是英文。
response_format
string 
可选
生成格式:默认值为 'json',脚本输出的格式,可选值为:json、text、srt、verbose_json 或 vtt。
temperature
number 
可选
采样温度:默认为 0 采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使其更加集中和确定。
示例值:
0
timestamp_granularities
array[string]
可选
要为此转录填充的时间戳粒度。 必须设置为使用时间戳粒度。支持以下任一或两个选项: response_format、verbose_json、word、segment。注意:时间戳没有额外的延迟,但生成单词时间戳会产生额外的延迟。
language
string 
可选
音频语言:参数为转录音频的语言。以 ISO-639-1 格式提供输入语言将提高提取准确性。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/audio/translations' \
--form 'file=@""' \
--form 'model="whisper-1"'

返回响应

🟢200成功
application/json
Body
object {0}
示例
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}
上一页
语音转文字 whisper-1
下一页
图像生成
Built with