OpenAI 音频格式
OpenAI 音频格式
OpenAI Audio
📝 简介
1.
2.
3.
💡 请求示例
文本转语音 ✅
语音转文本 ✅
{
"text": "你好,世界!"
}
音频翻译 ✅
{
"text": "Hello, world!"
}
📮 请求
端点
文本转语音
POST /v1/audio/speech
语音转文本
POST /v1/audio/transcriptions
音频翻译
POST /v1/audio/translations
鉴权方法
Authorization: Bearer $NEWAPI_API_KEY
$NEWAPI_API_KEY
是您的 API 密钥。请求体参数
文本转语音
model
input
voice
response_format
speed
语音转文本
file
model
language
prompt
response_format
temperature
timestamp_granularities
音频翻译
file
model
prompt
response_format
temperature
📥 响应
成功响应
文本转语音
语音转文本
基础 JSON 格式
{
"text": "转录的文本内容"
}
详细 JSON 格式
{
"task": "transcribe",
"language": "english",
"duration": 8.47,
"text": "完整的转录文本",
"segments": [
{
"id": 0,
"seek": 0,
"start": 0.0,
"end": 3.32,
"text": "分段的转录文本",
"tokens": [50364, 440, 7534],
"temperature": 0.0,
"avg_logprob": -0.286,
"compression_ratio": 1.236,
"no_speech_prob": 0.009
}
]
}
音频翻译
{
"text": "翻译后的英文文本"
}
错误响应
常见错误状态码
400 Bad Request
: 请求参数无效401 Unauthorized
: API 密钥无效或未提供429 Too Many Requests
: 超出 API 调用限制500 Internal Server Error
: 服务器内部错误{
"error": {
"message": "文件格式不支持",
"type": "invalid_request_error",
"param": "file",
"code": "invalid_file_format"
}
}
修改于 2025-05-30 01:47:18