语音转文本（STT）

正式环境

https://aiapi.xing-yun.cn

POST

https://aiapi.xing-yun.cn/v1/audio/transcriptions

请求参数

Authorization

在 Header 添加参数

Authorization

，其值为在 Bearer 之后拼接 Token

示例：

Authorization: Bearer ********************

Body 参数multipart/form-data

file

必需

音频文件对象（不是文件名）以以下格式之一进行转换：flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm。

示例值:

file://C:\Users\wangs\Downloads\response.mpga.mp3

model

string

必需

要使用的模型的 ID。目前仅可用：whisper-1

示例值:

whisper-1

prompt

string

可选

一个可选文本，用于指导模型的样式或继续上一个音频片段。提示应为英文。

response_format

string

可选

脚本输出的格式，在以下选项之一中json，text，srt，verbose_json，vtt

temperature

number

可选

采样温度，介于 0 和 1 之间。较高的值（如 0.8）将使输出更加随机，而较低的值（如 0.2）将使其更加集中和确定。如果设置为 0，则模型将使用对数概率自动升高温度，直到达到某些阈值。

示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

curl --location --request POST 'https://aiapi.xing-yun.cn/v1/audio/transcriptions' \
--form 'file=@"C:\\Users\\wangs\\Downloads\\response.mpga.mp3"' \
--form 'model="whisper-1"' \
--form 'prompt=""' \
--form 'response_format=""' \
--form 'temperature=""'

返回响应

🟢200成功

application/json

Body

text

string

必需

示例

{
    "text": "你好呀,这里是星芸AI"
}

修改于 2024-02-01 03:34:55

文本转语音（TTS）

常见问题