钱多多-全链路API聚合
首页钱多多首页
首页钱多多首页
  1. OpenAI接口
  • 发出请求
  • 模型接口
    • 完成对象
    • OpenAI接口
      • 文本生成(通用)
        POST
      • 图片理解(通用)
        POST
      • 图片生成(gpt-image-1)
        POST
      • 图片生成(dall-e-3)
        POST
      • 图片编辑(edits接口)
        POST
      • 图片编辑(网页版)
        POST
      • Web search(联网搜索)
        POST
      • Responses API
        POST
      • Function calling
        POST
      • response_format
        POST
      • N测试
        POST
      • 创建文本嵌入
        POST
      • 批量创建嵌入
        POST
      • 文本转语音(TTS)
        POST
      • 语音转文本(STT)whisper-1
        POST
      • 语音转文本(STT)gpt-4o-transcribe
        POST
      • 音频翻译
        POST
      • Audio接口(输出)
        POST
      • Audio接口(输入)
        POST
      • 内容补全接口
        POST
      • gpt-image-1(网页版)
        POST
      • 图片变体生成
        POST
      • 创建内容审核
        POST
      • 列出模型
        GET
    • 文生图接口
      • Grok 2 Image Gen
      • flux-schnell(OpenAI图像格式)
      • FLUX1.1-pro(OpenAI图像格式)
      • stable-diffusion(OpenAI图像格式)
      • ideogram
      • recraftv3
    • Realtime (实时语音、对话)
      • Realtime API
    • Anthropic Claude
      • 文本生成
      • 图片理解
      • 文本生成(v1/messages)
      • Tool use (function calling)
    • 谷歌Gemini
      • 文本生成
      • 文本生成 (联网)
      • 图片生成(2.0 Flash)
      • 图片生成 (Imagen 3)
      • 图片理解
      • 音频理解
      • 视频理解
    • Midjourney
      • 提交Imagine任务
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
      • 提交swap_face任务
      • 执行Action动作
      • 上传文件到discord
      • 根据ID列表查询任务
      • 指定ID获取任务
      • 获取任务图片的seed
    • GPTs 相关
      • gpt-4-all(分析图片)
      • gpt-4-all(生成图片)
      • GPTs对话
      • 搜索相关 GPTs
      • 查询 GPTs 详情
      • 批量查询 GPTs 详情
    • 文生音乐
      • Suno
        • 生成歌曲(API格式)
        • 生成歌词(API格式)
        • 查询单个任务(API格式)
        • Suno(Chat格式)
      • Udio
        • Udio(Chat格式)
    • 文生视频
      • 文生视频(luma)
      • 文生视频(runway)
      • 智谱清言GLM
      • 文生视频(可灵)
    • Rerank API
      • Jina AI 重排序格式
      • Cohere 重排序格式
      • Xinference 重排序格式
  • Python配置方式
    • Python基础对话
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
  • 帮助中心
    • 常见问题及解决办法
  • 回收站
    • 查询所有任务
    • 根据ID列表查询任务-字段displays
    • 分页查询任务
    • 查询任务队列
    • 取消任务
    • 提交Shorten任务
    • Stable-Diffusion
  1. OpenAI接口

语音转文本(STT)gpt-4o-transcribe

主站接口①
主站接口①
POST
https://api2.aigcbest.top/v1
/audio/transcriptions
官方文档:https://platform.openai.com/docs/api-reference/audio/createTranscription

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Header 参数
Content-Type
string 
必需
示例值:
multipart/form-data
Accept
string 
必需
示例值:
application/json
Authorization
string 
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数multipart/form-data
file
file 
必需
要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model
string 
必需
要使用的模型的 ID。仅whisper-1当前可用。
示例值:
gpt-4o-transcribe
prompt
string 
可选
可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。
示例值:
eiusmod nulla
response_format
string 
可选
示例值:
json
temperature
number 
可选
采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高温度,直到达到特定阈值。
示例值:
0
language
string 
可选
输入音频的语言。以ISO-639-1格式提供输入语言将提高准确性和延迟。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api2.aigcbest.top/v1/audio/transcriptions' \
--header 'Accept: application/json' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: multipart/form-data' \
--form 'file=@""' \
--form 'model="gpt-4o-transcribe"' \
--form 'prompt="eiusmod nulla"' \
--form 'response_format="json"' \
--form 'temperature="0"' \
--form 'language=""'

返回响应

🟢200OK
application/json
Body
text
string 
必需
示例
{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
修改于 2025-05-09 22:00:23
上一页
语音转文本(STT)whisper-1
下一页
音频翻译
Built with