数字人
  1. 自研声音克隆(主推)
数字人
  • 标准版数字人合成
    • 生成数字人视频
      POST
    • 获取任务详情
      GET
  • 高质量视频合成
    • 创建V2视频任务
      POST
    • 查询V2合成进度
      POST
  • 自研声音克隆(主推)
    • 创建语音模型
      POST
    • 文本转语音
      POST
  • 文案二创
    • 文案二创
      POST
  • 视频二创
    • 创建视频生成任务
      POST
    • 查询视频任务状态
      GET
  • 声音克隆(废弃)
    • 创建音色模型
      POST
    • 训练模型音色
      POST
    • 创建文本转音频任务
      POST
    • 查询音色训练进度
      POST
    • 查询音频合成进度
      POST
  • 高速视频合成接口
    • 创建并训练形象模特
      POST
    • 创建高速视频任务
      POST
    • 查询模特训练进度
      POST
    • 查询pro视频进度
      POST
  1. 自研声音克隆(主推)

文本转语音

POST
/v1/tts
语音合成
将文本转换为自然语音

请求参数

Authorization
Header 参数
model
enum<string> 
可选
指定使用的 TTS 模型
枚举值:
speech-1.5speech-1.6s1s1-mini
默认值:
speech-1.5
Authorization
string 
可选
在YunApi获取到的key
示例值:
Bearer sk-xxx
Body 参数application/json
text
string 
必需
要转换为语音的文本内容
示例值:
测试语音文本
chunk_length
integer 
文本分块长度
可选
>= 100<= 300
默认值:
200
format
enum<string> 
输出音频格式
可选
枚举值:
wavpcmmp3opus
默认值:
mp3
mp3_bitrate
enum<integer> 
MP3 比特率
可选
枚举值:
64128192
默认值:
128
reference_id
string 
预上传模型的 ID
可选
示例值:
7f92f8afb8ec43bf81429cc1c9199cb1
normalize
boolean 
可选
是否对文本进行标准化处理
默认值:
true
latency
enum<string> 
延迟模式
可选
枚举值:
normalbalanced
默认值:
normal
temperature
number 
语音生成随机性控制
可选
>= 0.1<= 2
默认值:
0.7
top_p
number 
核采样参数
可选
>= 0.1<= 1
默认值:
0.7
示例
{
    "text": "测试语音生成系统是否有效",
    "chunk_length": 106,
    "format": "opus",
    "mp3_bitrate": 192,
    "reference_id": "7f92f8afb8ec43bf81429cc1c9199cb1",
    "normalize": true,
    "latency": "normal",
    "temperature": 0.1821629194370873,
    "top_p": 0.6951457824758468
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/tts' \
--header 'model;' \
--header 'Authorization: Bearer sk-xxx' \
--header 'Content-Type: application/json' \
--data-raw '{
    "text": "测试语音生成系统是否有效",
    "chunk_length": 106,
    "format": "opus",
    "mp3_bitrate": 192,
    "reference_id": "7f92f8afb8ec43bf81429cc1c9199cb1",
    "normalize": true,
    "latency": "normal",
    "temperature": 0.1821629194370873,
    "top_p": 0.6951457824758468
}'

返回响应

🟢200成功
audio/mpeg
语音生成成功
Body
object {0}
示例
{}
🟠401没有权限
🟠402402
🟠422参数错误
修改于 2025-06-20 04:28:13
上一页
创建语音模型
下一页
文案二创
Built with