V-API
  1. 文字转语音TTS
V-API
  • 前言(必读)
  • OpenAI官方SDK使用教程
  • 批量请求示例
  • 聊天模型(Chat)
    • 列出可用模型
      GET
    • 聊天接口(通用)
      POST
    • 聊天接口(图片分析)
      POST
    • 聊天接口(函数调用)
      POST
    • 聊天接口(o1-o3系列模型)
      POST
    • gpt-4o-all 文件分析
      POST
    • gpt-4-all 文件分析
      POST
    • 聊天补全
      POST
    • Claude (OpenAI格式)-可PDF分析
      POST
    • Claude (原生格式)-可PDF分析
      POST
    • Gemini (OpenAI格式)-可文件分析
      POST
    • GPTs
      POST
  • 内容审查
    • 文本审查
      POST
    • 图片审查
      POST
  • 向量嵌入
    • 创建嵌入
  • 图片处理
    • 特别说明
    • 任务:智能抠图
    • 任务:图片清晰化(无损放大)
    • 任务:图片添加背景
    • 任务:去水印-自动
    • 任务:去水印
    • 任务:OCR服务
    • 任务:证件照
    • 任务:照片上色
    • 查询:任务结果
  • 绘画模型(Painting)
    • MidJourney
      • 提交模式与状态码说明
      • 任务:文生图、文图生图 Imagine
      • 任务:换脸 swap_face
      • 任务:绘图变化
      • 任务:绘图变化-simple
      • 任务:执行动作
      • 任务:图生图 Blend
      • 任务:图生文 Describe
      • 任务:局部重绘 Modal
      • 任务:提示词缩短 Shorten
      • 查询:根据ID列表查任务
      • 查询:根据ID查询任务
      • 查询:根据ID获取图片
      • 查询:根据ID获取图片 Seed
      • 上传:上传图片到Discord
    • dalle和gpt-image-1
      • 图像生成 dall-e-2、dall-e-3
      • 图像生成 gpt-image-1
      • 图像编辑 gpt-image-1
      • 图像编辑 DreamO-弃用
    • Grok
      • 图像生成
    • Flux
      • Flux绘画 Dalle格式
      • Flux绘画 Chat格式
    • Ideogram
      • README
      • Generate (文生图)
      • Remix(混合图)
      • Upscale(高清放大)
      • Describe(图生描述)
    • stable-diffusion
      • stable-diffusion (chat格式)
      • stable-diffusion (dalle格式)
    • 即梦AI
      • 即梦3.0生图
      • 即梦AI 生图-旧版
    • 可灵AI
      • README
  • 视频模型(Video)
    • 视频模型说明
    • 快手可灵AI
      • Callback 协议
      • 任务:图像生成
      • 任务:虚拟试穿
      • 任务:文生视频
      • 任务:图生视频
      • 任务:视频延长
      • 任务:视频配音-对口型
      • 任务:视频特效-单图
      • 任务:视频特效-双人互动
      • 查询:任务结果
      • 查询:批量查询
    • vidu视频
      • 模板生视频template参数
      • 任务:模板生视频(推荐)
      • 任务:文生视频
      • 任务:图生视频
      • 任务:参考生视频
      • 任务:首尾帧视频
      • 查询:任务结果
    • 即梦AI
      • 任务:图生视频
      • 任务:文生视频
      • 查询:任务结果
    • pika视频
      • 任务:生成视频
      • 查询:任务结果
    • luma视频
      • 任务:生成视频
      • 任务:拓展视频
      • 查询:单个任务
      • 查询:批量查询任务
      • 获取:无水印视频
    • runway 官方API
      • 任务:生成视频
      • 查询:单个任务
    • runway 旧版API-暂时失效
      • 任务:生成视频.gen2
      • 任务:生成视频.gen3
      • 任务:拓展视频
      • 查询:单个任务
      • 上传:参考图 A认证
      • 上传:参考图 C 获取
    • 数字人
      • 必读指南
      • 任务:生成数字人视频
      • 查询:任务结果
      • 获取:默认voice 列表
  • 音频模型(Audio)
    • Realtime (实时语音对话)
    • 文字转语音TTS
      • 模型 TTS-1
        POST
      • 模型 ChatTTS
        POST
      • 模型 fish-speech-1.5
        POST
      • 模型 fish-speech-1.2-sft
        POST
      • 模型 MegaTTS3
        POST
      • 模型 Step-Audio-TTS-3B
        POST
      • 模型 FunAudioLLM-CosyVoice-300M
        POST
    • 语音转文字 whisper
      • 模型 whisper-1
      • 模型 whisper-base
      • 模型 whisper-large
      • 模型 whisper-large-v3
      • 模型 whisper-large-v3-turbo
      • 创建翻译
      • 模型 SenseVoiceSmall
  • 音乐创作(suno)
    • 接口介绍
    • 聊天方式:生成歌曲
    • 任务:生成歌曲
    • 任务:生成歌词
    • 查询:批量查询任务
    • 查询:单个任务
  • 文档处理
    • OCR识别
    • 任务:PDF解析
    • 查询:PDF解析结果
  • 3D模型
    • 任务:图片转3D模型
    • 查询:任务结果
  • 网络爬虫
    • 任务:爬取网页
    • 爬取网页并返回结果
    • 查询:异步任务结果
  • 更多接口开发中...
    • test
  • 查询令牌用量
    GET
  • 查询令牌限额
    GET
  • 查询账户信息
    GET
  1. 文字转语音TTS

模型 fish-speech-1.5

将废弃
POST
/v1/audio/speech

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数application/json
model
string 
模型名称
必需
请填写 fish-speech-1.5
input
string 
待生成文字
必需
要为其生成音频的文本,最大长度为 4096 个字符。
voice
string 
音色选择
可选
生成音频时音色风格选择。可选值为 alloy、echo、fable、onyx、nova、shimmer
temperature
number 
采样温度
可选
控制生成内容的随机性和多样性,较高的值生成结果更有创造性,取值范围 0.60~0.90
top_p
number 
随机性
可选
用于控制生成的随机性,较高的值生成结果更多样,取值范围 0.60~0.90
repetition_penalty
number 
重复属性
可选
抑制重复生成,值越大,越会抑制重复生成,取值范围 1~1.5
max_new_tokens
number 
合成长度
可选
模型生成输出时的最大 token 数,限制合成语音内容的长度
chunk_length
number 
分块长度
可选
定义模型在处理长文本时的分块长度,逐段生成语音,以提高处理效率和稳定性
seed
string 
随机种子
可选
reference_audio_url
string 
语音特征
可选
用于指导模型生成语音的语音特征,模型会模仿该音频的音色、语调或风格,以生成更加个性化的语音。
reference_text
string 
参考内容
可选
用于提供参考音频对应的文本内容。
示例
{
    "model": "fish-speech-1.5",
    "top_p": 0.75,
    "repetition_penalty": 1.08,
    "temperature": 0.66,
    "max_new_tokens": 2048,
    "chunk_length": 200,
    "input": "The answer to the universe is 42"
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.gpt.ge/v1/audio/speech' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "fish-speech-1.5",
    "top_p": 0.75,
    "repetition_penalty": 1.08,
    "temperature": 0.66,
    "max_new_tokens": 2048,
    "chunk_length": 200,
    "input": "The answer to the universe is 42"
}'

返回响应

🟢200成功
application/json
Body
object {0}
示例
// 直接返回音频文件 xxx.mp3
修改于 2025-04-12 06:07:58
上一页
模型 ChatTTS
下一页
模型 fish-speech-1.2-sft
Built with