大模型接入文档
  1. 音频接口
大模型接入文档
  • 客户端接入
    • 方法1:使用chatbox(最优选择)
    • 方法2:使用网站hichat.site
  • API接入
    • 发出请求
    • 模型接口
      • 聊天接口(Chat)
        • 聊天接口
        • gpts
        • gemini-pro
        • gpt-4-all(分析图片)
        • gpt-4-vision-preview
      • 自动补全接口(Completions)
        • 内容补全接口
      • 图像接口(Images)
        • Midjourney
          • 补充 - 其他参数以及回调
          • InsightFace任务提交
            • 提交swap_face任务
          • 任务提交
            • 执行动作
            • 提交Blend任务
            • 提交Describe任务
            • 提交Imagine任务
            • 提交Modal
            • 提交Shorten任务
          • 任务查询
            • 查询所有任务
            • 根据ID列表查询任务
            • 分页查询任务
            • 查询任务队列
            • 取消任务
            • 指定ID获取任务
            • 获取任务图片的seed(需设置mj或niji的私信ID)
        • gpt-4-all(生成图片)
        • DALL·E 3
        • Stable-Diffusion
      • 向量生成接口
        • 创建向量
      • 音频接口
        • 创建转录
          POST
        • 创建翻译
          POST
        • TTS文本转语音
          POST
      • Sino音乐接口
        • v3.0
          • 生成音乐
          • 合并音乐
          • 获取音乐
        • v3.5
          • 生成音乐
          • 获取音乐
      • Luma视频接口
        • /luma/v1/generations
        • /luma/v1/task
    • 帮助中心
      • 常见问题及解决办法
    • 接入demo
      • py http方式接入
      • springboot ai库接入
  1. 音频接口

TTS文本转语音

POST
/v1/audio/speech
了解如何将文本转换为音频。
相关指南:本转换为音频
将输入文本转录为音频。

请求参数

Header 参数
Content-Type
string 
可选
示例值:
application/json
Authorization
string 
可选
示例值:
Bearer ${token}
Body 参数application/json
model
string 
必需
可用的 TTS 模型之一:tts-1 或 tts-1-hd
input
string 
必需
要生成音频的文本。最大长度为4096个字符。
voice
string 
必需
生成音频时使用的语音。支持的语音有:alloy、echo、fable、onyx、nova 和 shimmer。
response_format
string 
可选
默认为 mp3 音频的格式。支持的格式有:mp3、opus、aac 和 flac。
speed
number 
可选
默认为 1 生成的音频速度。选择0.25到4.0之间的值。1.0是默认值。
示例
{
    "model": "tts-1",
    "input": "The quick brown fox jumped over the lazy dog.",
    "voice": "alloy"
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/audio/speech' \
--header 'Authorization: Bearer ${token}' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "tts-1",
    "input": "The quick brown fox jumped over the lazy dog.",
    "voice": "alloy"
}'

返回响应

🟢200成功
application/json
Body
object
object 
可选
示例
返回文件二进制流,请接收后保存到文件中
上一页
创建翻译
下一页
生成音乐
Built with