模型 fish-speech-1.5

请求参数

Authorization

在 Header 添加参数

Authorization

，其值为在 Bearer 之后拼接 Token

示例：

Authorization: Bearer ********************

Body 参数application/json

model

string

模型名称

必需

请填写 fish-speech-1.5

input

string

待生成文字

必需

要为其生成音频的文本，最大长度为 4096 个字符。

voice

string

音色选择

可选

生成音频时音色风格选择。可选值为 alloy、echo、fable、onyx、nova、shimmer

temperature

number

采样温度

可选

控制生成内容的随机性和多样性，较高的值生成结果更有创造性，取值范围 0.60~0.90

top_p

number

随机性

可选

用于控制生成的随机性，较高的值生成结果更多样，取值范围 0.60~0.90

repetition_penalty

number

重复属性

可选

抑制重复生成，值越大，越会抑制重复生成，取值范围 1～1.5

max_new_tokens

number

合成长度

可选

模型生成输出时的最大 token 数,限制合成语音内容的长度

chunk_length

number

分块长度

可选

定义模型在处理长文本时的分块长度,逐段生成语音，以提高处理效率和稳定性

seed

string

随机种子

可选

reference_audio_url

string

语音特征

可选

用于指导模型生成语音的语音特征,模型会模仿该音频的音色、语调或风格，以生成更加个性化的语音。

reference_text

string

参考内容

可选

用于提供参考音频对应的文本内容。

示例

{
    "model": "fish-speech-1.5",
    "top_p": 0.75,
    "repetition_penalty": 1.08,
    "temperature": 0.66,
    "max_new_tokens": 2048,
    "chunk_length": 200,
    "input": "The answer to the universe is 42"
}

示例代码

Shell

JavaScript

Java

Swift

Go

PHP

Python

HTTP

C

C#

Objective-C

Ruby

OCaml

Dart

R

curl --location --request POST 'https://api.gpt.ge/v1/audio/speech' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "fish-speech-1.5",
    "top_p": 0.75,
    "repetition_penalty": 1.08,
    "temperature": 0.66,
    "max_new_tokens": 2048,
    "chunk_length": 200,
    "input": "The answer to the universe is 42"
}'

返回响应

🟢200成功

application/json

Body

object {0}

示例

// 直接返回音频文件 xxx.mp3