Text To Speech
POST
/speaker/tts
语音合成
文本合成规范说明
- 文本长度限制:待合成文本需控制在 10,000 个字符以内(包含标点和特殊符号)。
- 段落分隔方式:使用换行符 \n 表示段落切换。
- 语音停顿控制:
支持在文本中插入停顿标记 <#x#>,用于控制字词之间的语音间隔时间,其中 x 为停顿时长(单位为秒,范围为 0.01 ~ 99.99,保留最多两位小数)。
停顿标记需满足以下条件:- 必须位于两个可发音文本之间;
- 不支持连续插入多个时间间隔标记(例如 <#1#><#2#> 为非法格式);
- 不可出现在文本开头或结尾。
- 多音字注音规则:
支持对多音字进行显式注音,采用在目标字后以<(xxx)>标注拼音的方式,其中 xxx为小写拼音并附带数字声调,括号为英文括号,系统将根据标注进行替换发音。
数字声调用数字代替,一声(阴平)为1,二声(阳平)为2,三声(上声)为3,四声(去声)为4,轻声为5
示例:
【现在高考卷<(juan3)>得厉害,高考卷<(juan4)>难度很大】
注音标记可直接嵌入 text 字段中,无需使用单独字段。
请求参数
Body 参数application/json
示例代码
返回响应
修改于 2025-06-26 06:54:21