创建语音模型

创建一个新的语音模型（支持文本转语音）。

注意事项：

此端点需要上传文件，仅接受 multipart/form-data 和 application/msgpack 格式

需要提供有效的 Bearer 认证令牌

对于TTS模型，fast训练模式意味着模型创建后立即可用

如果模型设置为public，必须提供封面图片

语音文件应为高质量的语音样本

请求参数

Authorization

Header 参数

Authorization

string

可选

示例值:

Bearer sk-xx

Body 参数multipart/form-data

type

enum<string>

必需

模型类型，tts用于文本转语音

枚举值:

tts

示例值:

tts

title

string

模型标题或名称

必需

示例值:

我的TTS语音模型

train_mode

enum<string>

必需

模型训练模式，fast表示创建后立即可用

枚举值:

fastfull

示例值:

fast

voices

file

必需

上传的语音文件，用于训练和调优模型

visibility

enum<string>

可选

模型可见性设置：

public: 在发现页面显示

unlist: 任何有链接的人都可以访问

private: 仅创建者可见

枚举值:

publicunlistprivate

默认值:

public

示例值:

public

description

string | null

模型描述

可选

示例值:

这是一个高质量的文本转语音模型

cover_image

file

可选

模型封面图片，如果模型是公开的则必须提供

texts

array[string] | null

可选

与语音对应的文本，如果未指定，将对语音执行ASR识别

示例值:

["你好，世界","这是测试语音"]

tags

array[string]

模型标签列表

必需

示例值:

["中文","女声","甜美"]

created_at

string <date-time>

创建时间

必需

示例值:

2023-11-07T05:31:56Z

updated_at

string <date-time>

更新时间

必需

示例值:

2023-11-07T05:31:56Z

visibility

enum<string>

可见性设置

必需

枚举值:

publicunlistprivate

示例值:

public

like_count

integer

点赞数量

必需

示例值:

123

mark_count

integer

收藏数量

必需

示例值:

123

shared_count

integer

分享数量

必需

示例值:

123

task_count

integer

任务数量

必需

示例值:

123

author

object (Author)

作者信息

必需

_id

string

作者唯一标识符

必需

示例值:

507f1f77bcf86cd799439012

nickname

string

作者昵称

必需

示例值:

张三

avatar

string

作者头像URL

必需

示例值:

https://example.com/avatar.jpg

train_mode

enum<string>

可选

训练模式，fast表示创建后立即可用

枚举值:

fastfull

默认值:

full

示例值:

fast

samples

array[object (SampleEntity) {5}]

语音样本列表

可选

_id

string

样本唯一标识符

可选

filename

string

文件名

可选

duration

number

音频时长（秒）

可选

text

string

对应的文本内容

可选

created_at

string <date-time>

创建时间

可选

languages

array[string]

支持的语言列表

可选

示例值:

["zh-CN","en-US"]

lock_visibility

boolean

是否锁定可见性设置

可选

默认值:

false

示例值:

false

unliked

boolean

是否已取消点赞

可选

默认值:

false

示例值:

false

liked

boolean

是否已点赞

可选

默认值:

false

示例值:

false

marked

boolean

是否已收藏

可选

默认值:

false

示例值:

false

示例

{
    "_id": "507f1f77bcf86cd799439011",
    "type": "tts",
    "title": "我的TTS语音模型",
    "description": "这是一个高质量的文本转语音模型",
    "cover_image": "https://example.com/cover.jpg",
    "train_mode": "fast",
    "state": "created",
    "tags": [
        "中文",
        "女声",
        "TTS"
    ],
    "samples": [],
    "created_at": "2023-11-07T05:31:56Z",
    "updated_at": "2023-11-07T05:31:56Z",
    "languages": [
        "zh-CN"
    ],
    "visibility": "public",
    "lock_visibility": false,
    "like_count": 0,
    "mark_count": 0,
    "shared_count": 0,
    "task_count": 0,
    "unliked": false,
    "liked": false,
    "marked": false,
    "author": {
        "_id": "507f1f77bcf86cd799439012",
        "nickname": "张三",
        "avatar": "https://example.com/avatar.jpg"
    }
}

🟠401没有权限

🟠422参数错误

创建语音模型

请求参数

示例代码

返回响应