科大讯飞
  1. 公文校队
科大讯飞
  • iOS SDK接入文档
  • 平台文档
    • 开发者新手指南
      • 平台简介
      • 快速指引
    • 服务协议
      • 讯飞开放平台用户服务协议
      • 讯飞星火认知大模型接口服务协议
      • 开发者应用创建规则
      • 讯飞开放平台隐私政策
      • 开发者用户个人信息保护合规指引
      • 开放平台SDK合规使用说明
      • SDK隐私政策总览
      • SDK合规使用说明总览
      • 科大讯飞儿童隐私保护政策
      • 讯飞开放平台SLA协议
      • 讯飞开放平台订购协议
    • 用户认证须知
      • 用户认证简介
      • 企业实名认证
      • 个人实名认证
      • 初创团队认证
      • 学生认证
      • 公益项目认证
      • 个人升级企业认证
    • 财务
      • 退款规则及退款流程
      • 财务相关说明
    • 账号
      • 账号注销与删除流程
      • 账号与应用说明
    • 会员
      • 会员权益详情
      • 会员时效说明
      • 会员试用版
  • 星火认知大模型
    • SparkDesk
      • SparkDesk使用指南
      • SparkDesk隐私政策
      • SparkDesk用户协议
    • 星火认知大模型
      • 服务说明
      • 通用鉴权URL生成说明
      • Spark Android SDK接入文档
      • Linux SDK接入文档
      • Windows SDK接入文档
      • 讯飞星火认知大模型隐私政策
      • Web 文档
        • 星火认知大模型Web API文档
        • 星火大模型V1.5
        • 星火大模型V2
        • 星火大模型V3
    • 星火知识库
      • 星火知识库 API 文档
        • 星火知识库 API 文档
        • 文档问答
        • 文档上传
        • 文档总结
        • 获取文档总结/概要信息
      • 新版Embedding API文档
    • 图片生成
      • 图片生成 API
    • 图片理解
      • 图片理解 API
    • 大模型定制训练平台
      • 产品使用说明
      • 星火微调服务Web API文档文档
        • 星火微调服务Web API文档文档
        • V1.5版本
        • 微调模型
  • 语音识别
    • 语音唤醒(新版)
    • 语音听写
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 音频文件格式说明
      • 语音听写服务说明
      • 语音听写(流式版)SDK隐私政策
      • 语音听写(流式版)SDK合规使用说明
      • HarmonyOS SDK 文档
      • 语音听写自训练平台
      • 语音听写(流式版)WebAPI
    • 语音转写
      • 语音转写服务说明
      • 语音转写 服务协议
      • WebAPI 文档
        • 语音转写 API 文档
        • 文件上传
        • 查询结果
    • 极速语音转写
      • 极速语音转写 API 文档
      • 小文件上传
      • 初始化分块信息
      • 分块上传
      • 分块上传完成
      • 创建任务
      • 查询任务
    • 实时语音转写
      • 实时语音转写服务说明
      • 实时语音转写 API
    • 离线语音听写
      • Android SDK 文档
      • 离线语音听写服务说明
      • 离线语音听写SDK隐私政策
      • 离线语音听写SDK合规使用说明
    • 离线语音听写(新版)
      • Android SDK 文档
      • 离线语音听写隐私政策
    • 语音唤醒
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音唤醒服务说明
      • 离线唤醒SDK隐私政策
    • 语音唤醒(新版)
      • Android SDK 文档
      • Linux SDK 文档
      • 语音唤醒隐私政策
    • 离线命令词识别
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 离线命令词识别服务说明
      • 离线命令词识别SDK隐私政策
      • 离线命令词SDK合规使用说明
  • 语音合成
    • 在线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 服务协议
      • 在线语音合成服务说明
      • 发音人自训练平台使用指南
      • WebAPI
    • 长文本语音合成
      • 长文本语音合成 API 文档
      • 创建任务
      • 查询任务
    • 离线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 服务协议
      • 离线语音合成服务说明
    • AI虚拟人技术
      • Web SDK 2.0 接入指南
      • Android-SDK
      • iOS-SDK
      • Web API 文档
        • AI虚拟人技术 API 文档
        • 音频驱动
        • 启动
        • 文本驱动
        • 停止
        • 心跳
  • 语音扩展
    • 语音评测(流式版)
      • 接口说明
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音评测SDK隐私政策
      • 语音评测(流式版)API
    • 语音评测suntone
      • 语音评测suntone API
    • 离线变声
      • Android SDK 集成文档
    • 音色转换
      • 音色转换 API
    • 性别年龄识别
      • 性别能力识别 API
    • 声纹识别
      • Web API 文档
      • 声纹识别 API
    • 歌曲识别
      • 歌曲识别 API
    • 歌曲识别 ACRCloud
      • 接口说明
      • 哼唱识别
      • 音乐识别
    • AI 客服中间件
      • 接口说明
      • 获取token
      • 查询配置
      • 直接外呼
      • 创建外呼任务
      • 提交任务数据
      • 启动外呼任务
      • 暂停外呼任务
      • 删除外呼任务
      • 查询任务
      • 结果数据推送
      • 话单推送
      • 录音推送
      • 会话推送
      • 呼入话术上下文动态数据获取
  • 自然语言处理
    • 文本纠错
      • 文本纠错 API
      • 黑白名单上传
    • 公文校队
      • 公文校对 API
        POST
    • 文本合规
      • 文本合规 API
      • 新增黑名单词库
      • 根据lib_id添加黑名单词条
      • 根据lib_id查询词条明细
      • 根据lib_id删除词条
      • 根据appid查询账户下所有词库
      • 根据lib_id删除词库
      • 创建白名单库
      • 根据lib_id添加放行词条
      • 根据lib_id查询词条详情
      • 根据lib_id删除词条信息
      • 根据appid查询所有词库列表
      • 根据lib_id删除词库
    • 图片合规
      • 图片合规 API
    • 音频合规
      • 音频合规 API
    • 视频合规
      • 视频合规 API
    • 文本改写
      • 文本改写 API
    • 机器翻译
      • 机器翻译(新) API
    • 机器翻译niutrans
      • 机器翻译niutrans API
    • 同声传译
      • 同声传译 API 
    • 离线分词
      • Android SDK 文档
  • 人脸识别
    • 人脸验证与检索
      • Android SDK 文档
      • iOS SDK 文档
      • 人脸验证与检索SDK隐私政策
      • 人脸验证与检索SDK合规使用说明
    • 人脸对比
      • 人脸比对 API
    • 人脸比对sensetime
      • 人脸比对sensetime API
    • 人脸水印照比对
      • 人脸水印照比对 API
    • 静默活体检测
      • 静默活体检测 API
    • 配合式活体检测
      • 配合式活体检测 API
    • 静默活体检测sensetime
      • 静默活体检测sensetime API
    • 人脸检测和属性分析
      • 人脸检测和属性分析 API
    • 人脸特征分析tuputech
      • 年龄 API
      • 颜值 API
      • 性别 API
      • 表情 API
  • 文字识别
    • 通用文字识别
      • 通用文字识别 API
    • 通用文字识别
      • 通用文字识别 intsig API
    • 手写文字识别
      • 手写文字识别 API
    • 印刷文字识别
      • 印刷文字识别 API
    • 印刷文字识别(多语种)
      • 印刷文字识别(多语种)
    • 印刷文字识别(多语种)intsig
      • 印刷文字识别(多语种)intsig API
    • 图片文档还原
      • 图片文档还原 API 
    • 国内通用票据识别
      • 接口说明
      • 国内通用票据识别 API
    • 离线OCR
      • Android SDK 文档
    • 名片识别 intsig
      • 名片识别 API
    • 身份证识别 intsig
      • 身份证识别 intsig API
    • 银行卡识别 intsig
      • 银行卡识别 API
    • 营业执照识别 intsig
      • 营业执照识别 intsig API
    • 增值税发票识别 intsig
      • 增值税发票识别 intsig API
    • 拍照速算识别
      • 接口说明
      • 拍照速算识别 API
    • 公式识别
      • 接口说明
      • 公式识别 API
    • 指尖文字识别
      • 接口说明
      • 指尖文字识别 API
    • 身份证识别
      • 接口说明
      • 身份证识别 API
    • 增值税发票识别
      • 接口说明
      • 增值税发票识别 API
    • 营业执照识别
      • 接口说明
      • 营业执照识别 API
    • 火车票识别
      • 接口说明
      • 火车票识别 API
    • 出租车发票识别
      • 接口说明
      • 出租车发票识别 API
  • 图像识别
    • 场景识别
      • 场景识别 API
    • 物体识别
      • 物体识别 API
    • 场所识别
      • 场所识别 API 文档
  • 基础服务
    • 云服务器 CVM
      • 云服务器 CVM 产品简介
      • 快速入门
      • 服务协议
  • 解决方案
    • 签到解决方案
      • SaaS操作文档
    • 智能硬件通用方案
      • 智能硬件通用方案说明
      • 麦克风阵列Android SDK
      • 麦克风阵列Linux SDK
      • 双麦阵列设计参考
      • 麦克风阵列录音要求
      • 语音唤醒Android SDK
      • 语音唤醒Linux SDK
      • 离线声纹Android SDK
      • 离线声纹Linux SDK
  • MSC API 文档
    • Android
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • Android 常量字段值
      • 基础类
    • IOS
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • 基础类
    • Windows&Linux
      • 文件列表
      • API 文档
    • Java
      • 所有类列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 常量字段值
      • 基础类
  1. 公文校队

公文校对 API

开发环境
http://dev-cn.your-api-server.com
开发环境
http://dev-cn.your-api-server.com
POST
https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45

接口说明#

公文校对能够对文本内容进行文字标点差错、知识性差错、内容导向风险识别三大类型27种错误分类的审核与校对,具体如下:
1.文字标点差错校对:错别字、词、多字错误、少字错误、语义重复、语序错误、句式杂糅、标点符号差错、量词和单位差错、数字差错、句子查重、序号检查。
2.知识性差错校对:重要讲话引用、姓名和职务信息、地理名词、机构名称、专有名词及术语、法律法规名称、常识差错、时政重点词、媒体报道禁用词和慎用词。
购买请点击API套餐购买 、APPID获取请点击API使用控制台 、交流讨论请点击讯飞开放平台社区

#接口Demo#

部分开发语言Demo如下,其他开发语言请参照文档进行开发,欢迎大家到讯飞开放平台社区 交流集成经验。
公文校对API Demo java语言
公文校对API Demo python语言

#接口要求#

内容说明
传输方式http[s] (为提高安全性,强烈推荐https)
请求地址https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用
Content-Typeapplication/json;charset=UTF-8
接口鉴权签名机制,详情请参照下方接口鉴权
字符编码UTF-8
响应格式统一采用JSON格式
开发语言任意,只要可以向讯飞云服务发起HTTP请求的均可
适用范围任意操作系统,但因不支持跨域不适用于浏览器
文本长度不得超过220000个字符,汉字、英文字母、标点都算做一个字符

#接口鉴权#

#1、鉴权参数列表#

所有鉴权参数均放在url地址栏。http最终请求示例url如下:
https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45?authorization=YXBpX2tleT0iOTEyMDVhZmUwZDE3ZTM4YzYxYmUzNWZjYTM0NjUwM2MiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iejhVZWhEYmZ6K2N3QU9hdEJQV25iMHZYNTZnZml3MnZlcnZtdGgvTmI0ST0i&date=Mon%2C%2028%20Aug%202023%2010%3A05%3A35%20GMT&host=cn-huadong-1.xf-yun.com
参数名类型必传描述
hostString是请求主机:cn-huadong-1.xf-yun.com
dateString是当前时间戳,RFC1123格式("EEE, dd MMM yyyy HH:mm:ss z") 示例:Mon, 28 Aug 2023 10:05:35 GMT
authorizationString是使用base64编码的签名相关信息(签名基于hamc-sha256计算) 具体参考下方详细生成规则

#2、第一步date生成规则#

date必须是UTC+0或GMT时区,RFC1123格式(Wed, 11 Nov 2020 06:24:43 GMT)。 服务端会对date进行时钟偏移检查,最大允许300秒的偏差,超出偏差的请求都将被拒绝。

#3、第二步signature原始值示例(signature_origin)#

host: cn-huadong-1.xf-yun.com
date: Mon, 28 Aug 2023 10:05:35 GMT
POST /v1/private/s37b42a45 HTTP/1.1

#4、第三步signature获取最终值#

(1)使用hmac-sha256算法结合apiSecret对signature_origin签名,获得签名后的摘要signature_sha。
signature_sha=hmac-sha256(signature_origin,$apiSecret)
(2)使用base64编码对signature_sha进行编码获得最终的signature
signature=base64(signature_sha)
基于第二步signature_origin、apiSecret以ff446b96b01252f80331ae6e4c64984a生成的最终结果示例:
z8UehDbfz+cwAOatBPWnb0vX56gfiw2vervmth/Nb4I=

#5、第四步authorization的base64前原始值示例(authorization_origin)#

api_key="$api_key",algorithm="hmac-sha256",headers="host date request-line",signature="$signature"

#6、第五步authorization获取最终值#

authorization = base64(authorization_origin)
基于authorization_origin进行base64生成的最终示例:
YXBpX2tleT0iOTEyMDVhZmUwZDE3ZTM4YzYxYmUzNWZjYTM0NjUwM2MiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iejhVZWhEYmZ6K2N3QU9hdEJQV25iMHZYNTZnZml3MnZlcnZtdGgvTmI0ST0i
根据上面返回结果,text字段base64解码后json示例
{
  "code": 200,
  "msg": "success",
  "data": {
    "checklist": [
      {
        "wordHtml": "第二个百年目标",
        "explanation": "推荐使用更常用的公文规范表述",
        "type": {
          "id": 8,
          "belongId": 8,
          "name": "时政重点词",
          "desc": "时政重点词"
        },
        "word": "第二个百年目标",
        "action": {
          "id": 2
        },
        "htmlWords": [
          {
            "word": "第二个百年目标",
            "position": 0
          }
        ],
        "suggest": [
          "第二个百年奋斗目标"
        ],
        "context": "第二个百年目标",
        "position": 0,
        "length": 7,
        "source": 2,
        "um_error_level": 1
      }
    ]
  },
  "umeiTransactionId": "0e49fe88029aeb10"
}
text字段base64解码后参数说明:
参数名类型描述
umeiTransactionIdstring日志id
codeint返回code码,200成功,其他失败
msgstring返回提示
dataobject纠错数据
data.checklistarray纠错集合
data.checklist[n].wordHtmlstring可能含有html的错误词 例如:蓝球
data.checklist[n].explanationstring解释说明
data.checklist[n].wordstring错误词
data.checklist[n].contextstring错词上下文
data.checklist[n].positionint错误词在文本中的开始位置
data.checklist[n].lengthint错误词的长度
data.checklist[n].sourceint无需关注,预留字段
data.checklist[n].typeobject类型说明
data.checklist[n].type.idint能力一级ID
data.checklist[n].type.belongIdint能力归属ID
data.checklist[n].type.namestring错误名称
data.checklist[n].type.descstring错误描述
data.checklist[n].actionobject纠错动作
data.checklist[n].action.idint纠错具体动作: 1 标记 2 替换 4 删除
data.checklist[n].htmlWordsarray错误词集合
data.checklist[n].htmlWords[n].wordstring错误词
data.checklist[n].htmlWords[n].positionint错误词开始位置
data.checklist[n].suggestarray建议集合
data.checklist[n].suggest[n]string具体建议详情

#3、错误能力ID对照表#

错误能力ID(belongId)说明
9错别字、词
31多字错误
32少字错误
35语义重复
34语序错误
39量和单位差错
36数字差错
20句式杂糅
21标点符号差错
24句子查重
119重要讲话引用
101姓名和职务信息
123地理名词
19机构名称
124专有名词及术语
8时政重点词
122媒体报道禁用词和慎用词
240法律法规名称
6常识差错
105涉国家统一、主权和领土完整
109涉民族宗教
112涉黄、暴、恐、赌、毒
111涉低俗辱骂
108涉违法违规
118其他敏感内容

#常见问题#

#公文校对与文本纠错、文本合规有哪些区别?#

答:文本纠错主要偏向通用领域(如写作、出版)文本进行纠错,公文校对在公文写作使用等领域效果更佳,同时也适合通用领域。文本合规对各类场景风险拦截更全面。

#公文校对position仅标记开始位置,结束位置怎么计算呢?#

答:公文校对给出position的同时,也给出了length错误词长度,用position+length就是对应错误词在文本中的结束位置。

#公文校对的文本有什么要求吗?#

答:原请求的校对文本不能为空且不能超过220000个字符,汉字、英文字母、标点都算做一个字符
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45' \
--header 'Content-Type: application/json' \
--data-raw '{
  "header": {
    "app_id": "your_appid",
    "status": 3
  },
  "parameter": {
    "midu_correct": {
      "output_result": {
        "encoding": "utf8",
        "compress": "raw",
        "format": "json"
      }
    }
  },
  "payload": {
    "text": {
      "encoding": "utf8",
      "compress": "raw",
      "format": "plain",
      "status": 3,
      "text": "56ys5LqM5Liq55m+5bm055uu5qCH"
    }
  }
}'
响应示例响应示例
{
  "header": {
    "code": 0,
    "message": "string",
    "sid": "string"
  },
  "payload": {
    "output_result": {
      "compress": "string",
      "encoding": "string",
      "format": "string",
      "seq": "string",
      "status": "string",
      "text": "string"
    }
  }
}

请求参数

Body 参数application/json
header
object 
用于上传平台参数
必需
app_id
string 
必需
在平台申请的appid信息
status
integer 
必需
请求状态,取值范围为:3(一次传完)
parameter
object 
必需
用于上传服务特性参数
midu_correct
object 
服务名称
必需
payload
object 
用于上传请求数据
必需
text
object 
用于上传文本数据
必需
示例

返回响应

🟢200成功
application/json
Body
header
object 
必需
code
integer 
必需
message
string 
必需
sid
string 
必需
payload
object 
必需
output_result
object 
必需
上一页
黑白名单上传
下一页
文本合规 API
Built with