腾讯文件识别(进task任务)

请求参数

Header 参数

Authorization

string

认证信息

必需

示例值:

Bearer {{api_key}}

Body 参数multipart/form-data

file

上传文件

必需

model

enum<string>

必需

调用模型(存在腾讯和阿里模型需要注意区分)

枚举值:

TX_ASR_long_8k_zhTX_ASR_long_8k_enTX_ASR_long_16k_zhTX_ASR_long_16k_zh-PYTX_ASR_long_16k_zh_medicalTX_ASR_long_16k_enTX_ASR_long_16k_yueTX_ASR_long_16k_jaTX_ASR_long_16k_koTX_ASR_long_16k_viTX_ASR_long_16k_msTX_ASR_long_16k_idTX_ASR_long_16k_filTX_ASR_long_16k_thTX_ASR_long_16k_ptTX_ASR_long_16k_trTX_ASR_long_16k_arTX_ASR_long_16k_esTX_ASR_long_16k_hiTX_ASR_long_16k_frTX_ASR_long_16k_deTX_ASR_long_16k_zh_dialect

示例值:

TX_ASR_long_8k_zh

channel_num

enum<integer>

必需

文件上传声道单声道双声道

枚举值:

12

示例值:

1

format

enum<string>

识别文件类型

必需

枚举值:

wavpcmogg-opusspeexsilkmp3m4aaacamrraw

示例值:

pcm

text_format

enum<integer>

必需

文件识别结果返回样式

枚举值:

012345

示例值:

0

filter_modal

enum<integer>

过滤语气词

可选

枚举值:

012

示例值:

0

filter_dirty

enum<integer>

过滤脏话

可选

枚举值:

012

示例值:

0

filter_punc

enum<integer>

过滤标点符号

可选

枚举值:

012

示例值:

1

convert_num

enum<integer>

转换中文数字

可选

枚举值:

01

示例值:

1

hot_word_list

string | null

可选

临时热词表格式: "热词|权重" 如: "腾讯云|10,语音识别|5"

示例值:

腾讯云|10,语音识别|5

speaker

enum<integer>

可选

是否开启说话人分离示例值：0

枚举值:

01

示例值:

0

speaker_num

integer

可选

分离人数量示例值:0 0自动分离(最大20人)

>= 0<= 20

示例值:

0

emotion

enum<integer>

可选

情绪识别能力（目前仅支持16k_zh,8k_zh）支持的情绪分类为：高兴、伤心、愤怒示例值：0

枚举值:

012

示例值:

0

emotion_energy

enum<integer>

可选

情绪能量值示例值：0

枚举值:

01

示例值:

0

sentence_max

integer

可选

单标点最多字数（目前支持中文普通话引擎）可控制单行字幕最大字数，适用于字幕生成场景 0：不开启该功能取值范围：[6，40]

>= 0<= 40

示例值:

20

callback_url

string

可选

成功后回调url 腾讯回调说明

示例值:

https://cloud.tencent.com/document/product/1073/55746

示例代码

Shell

JavaScript

Java

Swift

Go

PHP

Python

HTTP

C

C#

Objective-C

Ruby

OCaml

Dart

R

curl --location --request POST 'https://api.mindcraft.com.cn/v1/audio/transcriptions' \
--header 'Authorization: Bearer ' \
--form 'file=@""' \
--form 'model="TX_ASR_long_8k_zh"' \
--form 'channel_num="1"' \
--form 'format="pcm"' \
--form 'text_format="0"' \
--form 'filter_modal="0"' \
--form 'filter_dirty="0"' \
--form 'filter_punc="1"' \
--form 'convert_num="1"' \
--form 'hot_word_list="腾讯云|10,语音识别|5"' \
--form 'speaker="0"' \
--form 'speaker_num="0"' \
--form 'emotion="0"' \
--form 'emotion_energy="0"' \
--form 'sentence_max="20"'

返回响应

🟢200成功

application/json

Body

id

string

请求ID

必需

category

string

ASR 类型

必需

model

string

ASR 模型

必需

text

string

识别内容

必需

word_list

array [object {4}]

必需

audio_duration

integer

腾讯参数语音长度

必需

word_size

integer

腾讯参数字符长度

必需

示例

成功示例异常示例阿里云成功示例

{
    "id": "55b3ec70155b45fba78dfb0e3fdad409",
    "category": "tx_asr_recogSentence",
    "model": "8k_zh",
    "data": {
        "category": "tx_asr_recogSentence",
        "model": "8k_zh",
        "text": "燕少飞",
        "audio_duration": 1118,
        "word_size": 3,
        "word_list": [
            {
                "text": "燕",
                "begin_time": 40,
                "end_time": 265
            },
            {
                "text": "少",
                "begin_time": 265,
                "end_time": 490
            },
            {
                "text": "飞",
                "begin_time": 490,
                "end_time": 810
            }
        ]
    }
}

🟢200task任务请求

腾讯 文件识别(进task任务)

使用 openai的py包 代码请求#

请求参数

示例代码

返回响应

腾讯文件识别(进task任务)

使用 openai的py包代码请求