MindCraft AI
  1. 语音识别 ASR
MindCraft AI
  • 在线调用-使用说明
  • 基础模型
    • 大语言模型 LLM
      • 其他平台上使用API
        • DIFY上使用API
        • ONE-API 上使用API
        • FastGPT 上使用API
        • 沉浸式翻译(浏览器插件) 上使用API
        • Cursor上使用MindCraft API
        • Cherry Studio上使用MindCraft API
      • LLM 模型列表+参数
      • LLM 模型对话调用
    • 语音识别 ASR
      • 语音识别请求
        • 腾讯 一句话识别
        • 腾讯 文件识别(进task任务)
        • 腾讯大模型 文件识别(进task任务)
        • 阿里 paraformer
        • 阿里 sensevoice(进task任务)
        • 字节跳动 一句话识别
      • 语音识别请求(汇总)
        POST
      • 模型列表及参数获取
        GET
      • 任务(task)数据获取
        GET
    • 语音合成 TTS
      • TTS 音色列表
      • 语音合成请求
        • 字节跳动 通用合成
        • MiniMax 短文本 V2
        • MiniMax 长文本
        • 腾讯 通用合成-普通音色
        • 腾讯 通用合成-精品音色
        • 腾讯 长文本合成-普通音色
        • 腾讯 长文本合成-精品音色
        • 科大讯飞 通用合成
        • 阿里云 语音合成CosyVoice
        • 百度 短文本合成
      • 语音合成请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • 图片生成 Images Generations
      • 图片生成请求
        • Flux.1 文生图
        • 智谱 文生图
        • 欧朋ai 文生图
        • 通义万象 文生图
        • 豆包 文生图
        • DeepSeek 文生图
        • MiniMax 文生图
        • Gemini 文生图 Copy
      • 图片生成请求(汇总)
      • 模型列表及参数获取
    • 视频合成 Video Generations
      • 视频合成请求
        • 智谱 文生视频
        • 智谱 图片生视频
        • MiniMax 文生视频
        • MiniMax 图生视频
        • 腾讯 文生视频
        • 通义万象 文生视频
        • 通义万象 图生视频
        • 豆包 文生视频
        • 豆包 图生视频
      • 视频合成请求(汇总)
      • 模型列表及参数获取
      • 任务(task)数据获取
    • RAG模型
      • embedding 多模态向量模型
      • embedding 文字向量模型
      • rerank 文字向量模型
    • 音色处理 voice processing
      • 音色克隆
        • 声音克隆流程
        • 上传音频
        • 生成试听
        • 保存克隆
    • 图生图 Image to Image
      • make局部编辑
        • 提取 mask
        • 消除 mask
        • 重绘 mask
        • 扩图 mask
      • 图生图
        • i2i 图片一致性
        • i2i 指令编辑模型
        • i2i 超分辨率模型
        • i2i 风格化模型
  • 智能体
    • 聊天机器人
      • 文件切片上传
        • 文件切片上传 获取上传UUID
        • 文件切片上传 上传UUID认证
      • chat_bot_v1 接口明细
        • chat_bot_v1(标准standard)
        • chat_bot_v1(专家pro)
        • chat_bot_v1(自定义customize)
      • chat_bot_v1 接口汇总
      • chat_bot 参数获取
    • 聊天机器人V2(socket)
      • ChatBot 智能体(socket)
    • 聊天机器人V3 AI角色(socket)
      • 角色资源加载规则
      • 角色人设加载
        • AI角色UUIDS数据
        • 用户人设UUIDS数据
      • ChatBot 智能体V3(socket)
    • socket Device认证
      • device 获取token
  • 对话数据
    • session 对话
      • message 聊天数据
        • message 获取列表
        • message 创建消息
        • message 修改消息
        • message 删除数据
        • message 清空记录
      • session 获取对话列表
      • session 创建新对话
      • session 更改对话
      • session 删除对话
  1. 语音识别 ASR

任务(task)数据获取

GET
https://api.mindcraft.com.cn/v1/audio/transcriptions/task/0-216931859619986
提示
headers 需要添加 "Bearer {{api_key}}" 用来认证
点击获取api_key

请求参数

Header 参数
Authorization
string 
认证信息
必需
示例值:
Bearer {{api_key}}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request GET 'https://api.mindcraft.com.cn/v1/audio/transcriptions/task/0-216931859619986' \
--header 'Authorization: Bearer '

返回响应

🟢200成功
application/json
Body
id
string 
请求ID
必需
category
string 
ASR 类型
必需
model
string 
ASR 模型
必需
data
object 
必需
category
string 
ASR 类型
必需
model
string 
ASR 模型
必需
task_id
integer 
必需
ASR task_id
text
string 
识别内容
必需
status
integer 
task 状态
必需
status_str
string 
task 状态描述
必需
result_detail
array [object {12}] 
识别细节列表
必需
示例
{
  "id": "49b8ccb3d82041a7be000e920b041d9d",
  "category": "tx_asr_recogAudio",
  "model": "8k_zh",
  "data": {
    "category": "tx_asr_recogAudio",
    "model": "",
    "task_id": 9734820722,
    "text": "[0:0.040,0:1.120,0]  燕少飞\n",
    "status_str": "success",
    "result_detail": [
      {
        "text": "燕少飞。",
        "slice_text": "燕 少 飞",
        "written_text": "",
        "begin_time": 40,
        "end_time": 1120,
        "word_size": 3,
        "speech_speed": 2.8,
        "speaker_id": 0,
        "emotional_energy": 4.248013,
        "silence_time": 0,
        "emotion_type": [],
        "word_list": [
          {
            "text": "燕",
            "begin_time": 0,
            "end_time": 225
          },
          {
            "text": "少",
            "begin_time": 225,
            "end_time": 450
          },
          {
            "text": "飞",
            "begin_time": 450,
            "end_time": 770
          }
        ]
      }
    ]
  }
}
🟢200阿里云 task格式
上一页
模型列表及参数获取
下一页
TTS 音色列表
Built with