NO.1 API
  1. 音频模型(Audio)
NO.1 API
  • 前言(必读)
  • OpenAI官方库使用教程
  • 聊天模型(Chat)
    • 聊天接口(通用)
      POST
    • 列出可用模型
      GET
    • 聊天接口(o1系列模型)
      POST
    • 聊天补全
      POST
    • Claude3+(全系列)
      POST
    • Gemini1.5+(全系列)
      POST
    • GPTs
      POST
    • gpt-4-all 文件分析
      POST
    • gpt-4o-all 文件分析
      POST
    • 聊天接口(图片分析)
      POST
  • 向量嵌入
    • 创建嵌入
      POST
  • 音频模型(Audio)
    • 文字转语音 TTS
      POST
    • 语音转文字 whisper-1
      POST
    • 创建翻译
      POST
  • 绘画模型(Painting)
    • MidJourney
      • 提交模式与状态码说明
      • 任务:换脸 swap_face
      • 任务:图生图 Blend
      • 任务:文生图、文图生图 Imagine
      • 任务:提示词缩短 Shorten
      • 上传:上传图片到Discord
      • 任务:局部重绘 Modal
      • 任务:绘图变化
      • 任务:执行动作
      • 任务:绘图变化-simple
      • 任务:图生文 Describe
      • 查询:根据ID列表查任务
      • 查询:根据ID查询任务
      • 查询:根据ID获取图片
      • 查询:根据ID获取图片 Seed
    • Dalle
      • 图像生成
      • 图像编辑
    • stable-diffusion
      POST
    • Flux Ai
      POST
  • 音乐创作(suno)
    • 接口介绍
    • 任务:生成歌曲
      POST
    • 聊天方式:生成歌曲
      POST
    • 任务:生成歌词
      POST
    • 查询:批量查询任务
      POST
    • 查询:单个任务
      GET
  • 视频模型(Video)
    • 视频模型说明
    • 快手可灵AI
      • 查询:单个任务
      • 任务:图像生成
      • 任务:文生视频
      • 任务:图生视频
    • luma视频
      • 任务:生成视频
      • 任务:拓展视频
      • 获取:无水印视频
      • 查询:单个任务
      • 查询:批量查询任务
    • runway视频
      • 任务:生成视频.gen2
      • 任务:生成视频.gen3
      • 查询:单个任务
      • 上传:参考图 A认证
      • 上传:参考图 C 获取
      • 任务:拓展视频
  • 更多接口开发中...
  1. 音频模型(Audio)

创建翻译

POST
/v1/audio/translations

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数multipart/form-data
file
file 
必需
音频文件:要转录的音频文件File对象(不是文件名),采用以下格式之一:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。
model
string 
必需
模型名称:必填模型 whisper-1。
示例值:
whisper-1
prompt
string 
可选
提示:一个可选文本,用于引导模型的样式或继续上一个音频片段。提示 必须是英文。
response_format
string 
可选
生成格式:默认值为 'json',脚本输出的格式,可选值为:json、text、srt、verbose_json 或 vtt。
temperature
number 
可选
采样温度:默认为 0 采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使其更加集中和确定。
示例值:
0
timestamp_granularities
array[string]
可选
要为此转录填充的时间戳粒度。 必须设置为使用时间戳粒度。支持以下任一或两个选项: response_format、verbose_json、word、segment。注意:时间戳没有额外的延迟,但生成单词时间戳会产生额外的延迟。
language
string 
可选
音频语言:参数为转录音频的语言。以 ISO-639-1 格式提供输入语言将提高提取准确性。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/audio/translations' \
--form 'file=@""' \
--form 'model="whisper-1"' \
--form 'prompt=""' \
--form 'response_format=""' \
--form 'temperature="0"' \
--form 'timestamp_granularities=""' \
--form 'language=""'

返回响应

🟢200成功
application/json
Body
object {0}
示例
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}
上一页
语音转文字 whisper-1
下一页
提交模式与状态码说明
Built with