MindCraft AI
  1. 语音合成 TTS
MindCraft AI
  • 在线调用-使用说明
  • 基础模型
    • 大语言模型 LLM
      • 其他平台上使用API
        • DIFY上使用API
        • ONE-API 上使用API
        • FastGPT 上使用API
        • 沉浸式翻译(浏览器插件) 上使用API
        • Cursor上使用MindCraft API
        • Cherry Studio上使用MindCraft API
      • LLM 模型列表+参数
      • LLM 模型对话调用
    • 语音识别 ASR
      • 语音识别请求
        • 腾讯 一句话识别
        • 腾讯 文件识别(进task任务)
        • 腾讯大模型 文件识别(进task任务)
        • 阿里 paraformer
        • 阿里 sensevoice(进task任务)
        • 字节跳动 一句话识别
      • 语音识别请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • 语音合成 TTS
      • TTS 音色列表
      • 语音合成请求
        • 字节跳动 通用合成
        • MiniMax 短文本 V2
        • MiniMax 长文本
        • 腾讯 通用合成-普通音色
        • 腾讯 通用合成-精品音色
        • 腾讯 长文本合成-普通音色
        • 腾讯 长文本合成-精品音色
        • 科大讯飞 通用合成
        • 阿里云 语音合成CosyVoice
        • 百度 短文本合成
      • 语音合成请求(汇总)
        POST
      • 模型列表及参数获取
        GET
      • 任务(task)数据获取
        GET
    • 图片生成 Images Generations
      • 图片生成请求
        • Flux 文生图
        • 智谱 文生图
        • 欧朋ai 文生图
        • 通义万象 文生图
        • 豆包 文生图
        • DeepSeek 文生图
        • MiniMax 文生图
        • Gemini 文生图
      • 图片生成请求(汇总)
      • 模型列表及参数获取
    • 视频合成 Video Generations
      • 视频合成请求
        • 智谱 文生视频
        • 智谱 图片生视频
        • MiniMax 文生视频
        • MiniMax 图生视频
        • 通义万象 文生视频
        • 通义万象 图生视频
        • 通义万象 首尾帧生成视频
        • 豆包 文生视频
        • 豆包 图生视频
        • 豆包 首尾帧生成视频
        • Gemini 文生视频
      • 视频合成请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • RAG模型
      • embedding 多模态向量模型
      • embedding 文字向量模型
      • rerank 文字向量模型
    • 音色处理 voice processing
      • 音色克隆
        • 声音克隆流程
        • 上传音频
        • 生成试听
        • 保存克隆
    • 图生图 Image to Image
      • mask局部编辑
        • 提取 mask
        • 消除 mask
        • 重绘 mask
        • 扩图 mask
      • 图生图
        • i2i 图片一致性
        • i2i 指令编辑模型
        • i2i 超分辨率模型
        • i2i 风格化模型
        • i2i 图片调整
  • 智能体
    • 聊天机器人V3 AI角色(socket)
      • 角色资源加载规则
      • 角色人设加载
        • AI角色UUIDS数据
        • 用户人设UUIDS数据
      • ChatBot 智能体V3(socket)
    • AI桌面助手 V1 AI角色
      • AI桌面助手V1(Socket)
    • socket Device认证
      • device 获取token
  • 对话数据
    • session 对话
      • message 聊天数据
        • message 获取列表
        • message 创建消息
        • message 修改消息
        • message 删除数据
        • message 清空记录
      • session 获取对话列表
      • session 创建新对话
      • session 更改对话
      • session 删除对话
  • 查看积分余额
    GET
  1. 语音合成 TTS

语音合成请求(汇总)

POST
https://api.mindcraft.com.cn/v1/audio/speech
提示
headers 需要添加 "Bearer {{api_key}}" 用来认证
点击获取api_key

以下category(短文本)合成时 生成文件#

mm_tts_T2AV2
tx_tts_stdTone
tx_tts_premTone

以下category(长文本)合成时 生成链接#

mm_tts_T2APro

以下category(长文本)合成时 获得task_id#

tx_tts_longStdTone
tx_tts_longPrecTone

使用 openai的py包 代码请求#

短文本合成语音
长文本合成(minimax)
长文本合成(腾讯)

请求参数

Header 参数
Authorization
string 
认证信息
必需
示例值:
Bearer {{api_key}}
Body 参数application/json
model
enum<string> 
模型选择
必需
枚举值:
MM_TTSL_realtime_speech-01-turboMM_TTSL_realtime_speech-01-240228MM_TTSL_realtime_speech-01-turbo-240228MM_TTSL_long_speech-01MM_TTSL_long_speech-02TX_TTS_realtimeTX_TTSP_realtimeTX_TTS_longTX_TTSP_longALI_TTSL_realtime_cosyvoice-v1ZJ_TTSL_realtimeXF_TTS_realtimeBD_TTS_realtime_zh
示例值:
MM_TTSL_realtime_speech-01-turbo
voice_id
string 
必需
音色选择 TTS 音色列表
text
string 
合成文案
必需
speed
number 
声音语速
可选
>= 0.5<= 2
默认值:
1
示例值:
1
output_format
enum<string> 
音频格式
可选
枚举值:
mp3wavpcmflacaac
默认值:
mp3
示例值:
mp3
volume
number 
可选
(MiniMax,腾讯,阿里云,科大讯飞,百度) 声音音量
>= 1<= 10
默认值:
1
示例值:
1.5
audio_sample_rate
enum<integer> 
可选
(MiniMax,腾讯,阿里云,字节跳动,科大讯飞) 声音采样率
枚举值:
1600024000320008000
默认值:
24000
示例值:
16000
bitrate
enum<integer> 
可选
(MiniMax) 声音比特率
枚举值:
3200064000128000
默认值:
32000
timber_weights
array [object {2}] 
可选
(MiniMax) 混合音色
voice_id
string 
必需
minimax参数 混合音色ID TTS 音色列表
weight
integer 
必需
minimax参数 混合音色权重
>= 1<= 100
pitch
integer 
可选
(MiniMax,阿里云,字节跳动,科大讯飞,百度) 声音语调
>= -12<= 12
默认值:
0
示例值:
0
char_to_pitch
string 
可选
(MiniMax) 特殊标注内容及注音
示例值:
燕少飞/(yan4)(shao3)(fei1)omg/oh my god
channel
enum<integer> 
可选
(MiniMax) 音频声道数
枚举值:
12
默认值:
1
示例值:
1
primary_language
enum<integer> 
(腾讯) 语言类型
可选
枚举值:
123
默认值:
1
示例值:
1
enable_subtitle
boolean 
可选
(腾讯) 开启时间戳功能
默认值:
false
segment_rate
integer 
可选
(腾讯) 断句敏感阈值 取值范围:[0,1,2]。该值越大越不容易断句,模型会更倾向于仅按照标点符号断句。此参数建议不要随意调整,可能会影响合成效果。
>= 0<= 2
默认值:
0
示例值:
0
emotion_category
enum<string> 
(腾讯) 音频情感
可选
枚举值:
neutralsadhappyangryfearnewsstoryradiopoetrycallsajiao厌恶amazepeacefulexcitingaojiaojieshuo
示例值:
neutral
emotion_intensity
integer 
可选
(腾讯) 音频情感程度
>= 50<= 200
默认值:
50
示例值:
50
callback_url
string 
可选
(腾讯) 回调 URL
示例值:
https://cloud.tencent.com/document/product/1073/55746
over_dialogue
boolean 
可选
(腾讯) 旁白与对白文本
默认值:
false
示例
{
    "model": "MM_TTSL_realtime_speech-01-turbo",
    "voice_id": "male-qn-daxuesheng",
    "text": "燕少飞",
    "speed": 1,
    "output_format": "mp3",
    "volume": 1.5,
    "audio_sample_rate": 16000,
    "bitrate": 128000
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.mindcraft.com.cn/v1/audio/speech' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "MM_TTSL_realtime_speech-01-turbo",
    "voice_id": "male-qn-daxuesheng",
    "text": "燕少飞",
    "speed": 1,
    "output_format": "mp3",
    "volume": 1.5,
    "audio_sample_rate": 16000,
    "bitrate": 128000
}'

返回响应

🟢200成功
application/json
Body
id
string 
请求ID
必需
category
string 
TTS 类型
必需
model
string 
必需
minimax参数 TTS 模型
voice_id
string 
TTS 音色
必需
data
object 
必需
category
string 
TTS 类型
必需
model
string 
必需
minimax参数 TTS 模型
voice_id
string 
TTS 音色
必需
word_count
integer 
必需
minimax参数 字数
audio_file
string 
音频链接
必需
subtitle_file
string 
必需
minimax参数 字幕文件
audio_length
integer 
必需
minimax参数 音频长度
audio_size
integer 
必需
minimax参数 音频大小
audio_sample_rate
integer 
必需
minimax参数 音频采样率
bitrate
integer 
必需
minimax参数 比特率
usage_characters
integer 
必需
minimax参数 使用字符
示例
{
    "id": "ba03d8626a5643a0be8c3ef5ae9dc850",
    "category": "mm_tts_T2APro",
    "model": "speech-01",
    "voice_id": "male-qn-qingse",
    "data": {
        "category": "mm_tts_T2APro",
        "model": "speech-01",
        "voice_id": "male-qn-qingse",
        "word_count": 3,
        "audio_file": "https://minimax-algeng-chat-tts.oss-cn-wulanchabu.aliyuncs.com/audio%2Ftts-wav-20240722143657-xoPtJbAN.wav?Expires=1721716617&OSSAccessKeyId=LTAI5tGLnRTkBjLuYPjNcKQ8&Signature=m9lqmAMGvykH1t%2FHCy4ayWFfFC8%3D",
        "subtitle_file": "https://minimax-algeng-chat-tts.oss-cn-wulanchabu.aliyuncs.com/audio%2Ftts-wav-20240722143657-xoPtJbAN.title?Expires=1721716617&OSSAccessKeyId=LTAI5tGLnRTkBjLuYPjNcKQ8&Signature=UbRJiOHmyG7a1l%2BX07N1rN9vtO0%3D",
        "audio_length": 1075,
        "audio_size": 70046,
        "audio_sample_rate": 16000,
        "bitrate": 128000,
        "usage_characters": 6
    }
}
🟢201task任务请求
修改于 2025-01-23 08:03:10
上一页
百度 短文本合成
下一页
模型列表及参数获取
Built with