VMAN API Docs
  1. 音频接口(Audio)
VMAN API Docs
  • 模型接口
    • 聊天接口(Chat)
      • 聊天接口
      • gpts
      • gemini-pro
      • gpt-4-all(分析图片)
      • gpt-4-vision-preview
    • 自动补全接口(Completions)
      • 内容补全接口
    • 图像接口(Images)
      • DALL·E 3
      • Stable-Diffusion
      • gpt-4-all(生成图片)
    • 向量生成接口(Embeddings)
      • 创建嵌入
    • 音频接口(Audio)
      • 创建转录
        POST
      • 创建翻译
        POST
      • TTS文本转语音
        POST
    • Midjourney
      • 补充 - 其他参数以及回调
      • InsightFace任务提交
        • 提交swap_face任务
      • 任务提交
        • 执行动作
        • 提交Blend任务
        • 提交Describe任务
        • 提交Imagine任务
        • 提交Modal
        • 提交Shorten任务
      • 任务查询
        • 查询所有任务
        • 根据ID列表查询任务
        • 分页查询任务
        • 查询任务队列
        • 取消任务
        • 指定ID获取任务
        • 获取任务图片的seed(需设置mj或niji的私信ID)
    • Suno音乐(逆向)
      • v3.0
        • 生成音乐
        • 获取音乐
        • 合并音乐
      • v3.5
        • 生成音乐
        • 获取音乐
    • Flux图像(官方格式)
      • flux-pro-1.1
      • flux-pro
      • flux-dev
      • flux-查询
    • Recraft图像(官方格式)
      • styles
        • 创建样式
      • images
        • 生成图像
        • 图像矢量化
        • 移除背景
        • 清晰度提升
        • 生成式放大
    • Stability AI图像(官方格式)
      • SD3
        • Stable Image Ultra
        • Stable Image Core
        • Stable Diffusion 3
      • SDXL
        • Text-to-image
    • Ideogram图像(官方格式)
      • Generate(文生图)
      • Remix(混合图)
      • Upscale(放大高清)
      • Describe(描述)
    • Ideogram图像(逆向)
      • 图片描述
      • 文生图
      • 合成图
      • 放大图片
      • ideogram任务查询
    • Kling视频(官方格式)
      • 图像生成
      • 文生视频
      • 图生视频
      • 查询任务
    • Luma视频(逆向)
      • 付费版
        • 生成视频
        • 获取视频
    • Runway视频(官方格式)
      • 图生视频
      • 任务查询
    • CogVideoX视频(官方格式)
      • CogVideoX视频生成
      • CogVideoX视频查询
    • Viggle舞蹈(逆向)
      • Mix上传视频并生成视频
      • Mix官方模板列表
      • Mix上传视频素材库
      • Mix上传图片素材库
      • Multi上传视频并生成视频
      • Multi模板列表
      • Move上传视频并生成视频
      • 查询视频任务
      • 剩余积分查询
  • 帮助中心
    • 常见问题及解决办法
  1. 音频接口(Audio)

创建翻译

POST
/v1/audio/translations
将音频翻译成英文。

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Header 参数
Content-Type
string 
必需
示例值:
multipart/form-data
Accept
string 
必需
示例值:
application/json
Authorization
string 
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数multipart/form-data
file
file 
必需
要翻译的音频文件,支持以下格式:mp3,mp4,mpeg,mpga,m4a,wav 或 webm。
model
string 
必需
(要使用的模型的 ID,目前仅有 whisper-1 可用。
示例值:
whisper-1
prompt
string 
可选
一个可选的文本,用于指导模型的风格或继续先前的音频片段。 prompt 应为英文。
response_format
string 
可选
转录输出的格式,支持以下选项之一:json、text、srt、verbose_json 或 vtt。
示例值:
json
temperature
number 
可选
采样温度,介于 0 和 1 之间。 较高的值(如 0.8)将使输出更随机,而较低的值(如 0.2)将使其更加专注和确定性。 如果设置为 0,则模型将使用对数概率自动增加温度,直到达到一定的阈值。
示例值:
0

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/audio/translations' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: multipart/form-data' \
--form 'file=@""' \
--form 'model="whisper-1"' \
--form 'prompt=""' \
--form 'response_format="json"' \
--form 'temperature="0"'

返回响应

🟢200OK
application/json
Body
text
string 
必需
示例
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}
上一页
创建转录
下一页
TTS文本转语音
Built with