星芸AI API开发文档
  1. 语音/文本接口
星芸AI API开发文档
  • 文档说明
  • API身份认证
  • API请求
  • API模型接口
    • 模型名称
      • 模型名称获取
    • 对话接口
      • 对话接口
    • 文本补全接口
      • 文本补全接口
    • 图像生成/识别接口
      • 图像生成接口
      • 图像识别接口
    • 向量嵌入接口
      • 向量嵌入接口
    • AI绘图(MJ绘图)接口
      • 任务提交
        • 执行动作
        • 提交Blend任务
        • 提交Describe任务
        • 提交Imagine任务
        • 提交Modal
        • 提交Shorten任务
      • 任务查询
        • 查询所有任务
        • 根据ID列表查询任务
        • 查询任务队列
        • 指定ID获取任务
        • 获取任务图片的seed
    • 开放插件(Plugin)接口
      • 联网接口
        • 联网(增强)接口
    • 语音/文本接口
      • 文本转语音(TTS)
        POST
      • 语音转文本(STT)
        POST
  • 常见问题
  • API调用错误码汇总
  1. 语音/文本接口

语音转文本(STT)

正式环境
https://aiapi.xing-yun.cn
正式环境
https://aiapi.xing-yun.cn
POST
https://aiapi.xing-yun.cn
https://aiapi.xing-yun.cn/v1/audio/transcriptions

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数multipart/form-data
file
file 
必需
音频文件对象(不是文件名)以以下格式之一进行转换:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。
示例值:
file://C:\Users\wangs\Downloads\response.mpga.mp3
model
string 
必需
要使用的模型的 ID。目前仅可用:whisper-1
示例值:
whisper-1
prompt
string 
可选
一个可选文本,用于指导模型的样式或继续上一个音频片段。提示应为英文。
response_format
string 
可选
脚本输出的格式,在以下选项之一中json,text,srt,verbose_json,vtt
temperature
number 
可选
采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使其更加集中和确定。如果设置为 0,则模型将使用对数概率自动升高温度,直到达到某些阈值。

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://aiapi.xing-yun.cn/v1/audio/transcriptions' \
--form 'file=@"C:\\Users\\wangs\\Downloads\\response.mpga.mp3"' \
--form 'model="whisper-1"' \
--form 'prompt=""' \
--form 'response_format=""' \
--form 'temperature=""'

返回响应

🟢200成功
application/json
Body
text
string 
必需
示例
{
  "text": "你好呀,这里是星芸AI"
}
上一页
文本转语音(TTS)
下一页
常见问题
Built with