数字人
  1. 自研声音克隆(主推)
数字人
  • 标准版数字人合成
    • 生成数字人视频
      POST
    • 获取任务详情
      GET
  • 高质量视频合成
    • 创建V2视频任务
      POST
    • 查询V2合成进度
      POST
  • 自研声音克隆(主推)
    • 创建语音模型
      POST
    • 文本转语音
      POST
  • 文案二创
    • 文案二创
      POST
  • 视频二创
    • 创建视频生成任务
      POST
    • 查询视频任务状态
      GET
  • 声音克隆(废弃)
    • 创建音色模型
      POST
    • 训练模型音色
      POST
    • 创建文本转音频任务
      POST
    • 查询音色训练进度
      POST
    • 查询音频合成进度
      POST
  • 高速视频合成接口
    • 创建并训练形象模特
      POST
    • 创建高速视频任务
      POST
    • 查询模特训练进度
      POST
    • 查询pro视频进度
      POST
  1. 自研声音克隆(主推)

创建语音模型

POST
/model
模型管理
创建一个新的语音模型(支持文本转语音)。
注意事项:
此端点需要上传文件,仅接受 multipart/form-data 和 application/msgpack 格式
需要提供有效的 Bearer 认证令牌
对于TTS模型,fast训练模式意味着模型创建后立即可用
如果模型设置为public,必须提供封面图片
语音文件应为高质量的语音样本

请求参数

Authorization
Header 参数
Authorization
string 
可选
示例值:
Bearer sk-xx
Body 参数multipart/form-data
type
enum<string> 
必需
模型类型,tts用于文本转语音
枚举值:
tts
示例值:
tts
title
string 
模型标题或名称
必需
示例值:
我的TTS语音模型
train_mode
enum<string> 
必需
模型训练模式,fast表示创建后立即可用
枚举值:
fastfull
示例值:
fast
voices
file 
必需
上传的语音文件,用于训练和调优模型
visibility
enum<string> 
可选
模型可见性设置:
public: 在发现页面显示
unlist: 任何有链接的人都可以访问
private: 仅创建者可见
枚举值:
publicunlistprivate
默认值:
public
示例值:
public
description
string  | null 
模型描述
可选
示例值:
这是一个高质量的文本转语音模型
cover_image
file 
可选
模型封面图片,如果模型是公开的则必须提供
texts
array[string] | null 
可选
与语音对应的文本,如果未指定,将对语音执行ASR识别
示例值:
["你好,世界","这是测试语音"]
tags
array[string] | null 
模型标签
可选
示例值:
["中文","女声","TTS"]
enhance_audio_quality
boolean 
是否增强音频质量
可选
默认值:
false
示例值:
false

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/model' \
--header 'Authorization: Bearer sk-xx' \
--form 'type="tts"' \
--form 'title="我的TTS语音模型"' \
--form 'train_mode="fast"' \
--form 'voices=@""' \
--form 'visibility="public"' \
--form 'description="这是一个高质量的文本转语音模型"' \
--form 'cover_image=@""' \
--form 'texts="你好,世界"' \
--form 'texts="这是测试语音"' \
--form 'tags="中文"' \
--form 'tags="女声"' \
--form 'tags="TTS"' \
--form 'enhance_audio_quality="false"'

返回响应

🟢201成功
application/json
模型创建成功
Body
模型信息响应
_id
string 
模型唯一标识符
必需
示例值:
507f1f77bcf86cd799439011
type
enum<string> 
必需
模型类型,tts用于文本转语音
枚举值:
svctts
示例值:
tts
title
string 
模型标题或名称
必需
示例值:
我的TTS语音模型
description
string 
模型描述
必需
示例值:
这是一个高质量的文本转语音模型
cover_image
string 
封面图片URL
必需
示例值:
https://example.com/cover.jpg
state
enum<string> 
模型状态
必需
枚举值:
createdtrainingtrainedfailed
示例值:
created
tags
array[string]
模型标签列表
必需
示例值:
["中文","女声","甜美"]
created_at
string <date-time>
创建时间
必需
示例值:
2023-11-07T05:31:56Z
updated_at
string <date-time>
更新时间
必需
示例值:
2023-11-07T05:31:56Z
visibility
enum<string> 
可见性设置
必需
枚举值:
publicunlistprivate
示例值:
public
like_count
integer 
点赞数量
必需
示例值:
123
mark_count
integer 
收藏数量
必需
示例值:
123
shared_count
integer 
分享数量
必需
示例值:
123
task_count
integer 
任务数量
必需
示例值:
123
author
object (Author) 
作者信息
必需
_id
string 
作者唯一标识符
必需
示例值:
507f1f77bcf86cd799439012
nickname
string 
作者昵称
必需
示例值:
张三
avatar
string 
作者头像URL
必需
示例值:
https://example.com/avatar.jpg
train_mode
enum<string> 
可选
训练模式,fast表示创建后立即可用
枚举值:
fastfull
默认值:
full
示例值:
fast
samples
array[object (SampleEntity) {5}] 
语音样本列表
可选
_id
string 
样本唯一标识符
可选
filename
string 
文件名
可选
duration
number 
音频时长(秒)
可选
text
string 
对应的文本内容
可选
created_at
string <date-time>
创建时间
可选
languages
array[string]
支持的语言列表
可选
示例值:
["zh-CN","en-US"]
lock_visibility
boolean 
是否锁定可见性设置
可选
默认值:
false
示例值:
false
unliked
boolean 
是否已取消点赞
可选
默认值:
false
示例值:
false
liked
boolean 
是否已点赞
可选
默认值:
false
示例值:
false
marked
boolean 
是否已收藏
可选
默认值:
false
示例值:
false
示例
{
    "_id": "507f1f77bcf86cd799439011",
    "type": "tts",
    "title": "我的TTS语音模型",
    "description": "这是一个高质量的文本转语音模型",
    "cover_image": "https://example.com/cover.jpg",
    "train_mode": "fast",
    "state": "created",
    "tags": [
        "中文",
        "女声",
        "TTS"
    ],
    "samples": [],
    "created_at": "2023-11-07T05:31:56Z",
    "updated_at": "2023-11-07T05:31:56Z",
    "languages": [
        "zh-CN"
    ],
    "visibility": "public",
    "lock_visibility": false,
    "like_count": 0,
    "mark_count": 0,
    "shared_count": 0,
    "task_count": 0,
    "unliked": false,
    "liked": false,
    "marked": false,
    "author": {
        "_id": "507f1f77bcf86cd799439012",
        "nickname": "张三",
        "avatar": "https://example.com/avatar.jpg"
    }
}
🟠401没有权限
🟠422参数错误
修改于 2025-06-20 04:27:13
上一页
查询V2合成进度
下一页
文本转语音
Built with