消息服务总线3.0在线接口文档
  1. 1、发文检索相关接口
消息服务总线3.0在线接口文档
  • 1、服务总线-字典接口组
    • 1、国家英文码值对照相关接口
      • 1)国家三字英文码值对照列表
      • 2)根据三字英文码值获取国家名称列表
    • 2、ISO 639语言编码相关接口
      • 1)ISO 639语言编码信息列表
      • 2)指定Code集合获取名称和简称
    • 3、媒体类型相关接口
      • 1)指定境内外类型查询媒体类型【树型结构】
      • 2)指定Code集合获取名称
      • 3)指定Code集合获取字段
      • 4)根据地域查询渠道信息
    • 4、地域相关接口
      • 1)指定区域父级节点查询子集(中国)
      • 2)查询地域树(全国)
      • 3)内容提及查询
      • 4)内容提及-指定区域父级节点查询子集
    • 5、媒体信源标签相关接口
      • 1)媒体标签信息TOP25
      • 2)分页检索媒体标签列表
    • 6、标签相关接口
      • 1)标签根节点列表查询
      • 2)指定标签上一级唯一值查询该标签下子集列表
      • 3)指定标签层级查询该层级下子标签列表
    • 7、分类相关接口
      • 1)分类列表查询
  • 2、消息服务-业务接口组
    • 1、发文检索相关接口
      • 1)分页检索发文信息列表
        POST
      • 2)检索发文详情信息
        POST
      • 3)通过uuid批量查询发文信息列表
        POST
      • 4)相似文章列表查询
        POST
      • 5)获取渠道发文转发/评论关系
        POST
      • 6)根据文章ID分页获取评论列表
        POST
      • 7)Scroll创建接口
        POST
      • 8)ScrollID查询接口
        POST
      • 9)ScrollID删除接口
        POST
      • 10)根据uuid获取OCR信息
        POST
      • 11)OCR内容识别
        POST
      • 12)相似文章列表查询
        POST
    • 2、媒体账号检索相关接口
      • 附件说明
        • 境内账号字段值对应说明
        • 境外账号字段值对应说明
      • 1)分页检索媒体账号信息列表
      • 2)检索媒体账号详情信息
      • 3)根据渠道和账号ID查询是否采集该媒体账号信息
    • 3、发文分析相关接口
      • 1)通用-数据总量获取
      • 2)通用-指定分析字段返回其中某一种聚合分析
      • 3)通用-指定分析字段返回所有聚合分析
      • 4)通用-指定两个分析字段返回其中某一种聚合分析
      • 5)通用-指定字段分析日期直方图聚合
      • 6)通用-指定字段聚合和指定字段排序返回对应Top数据信息
      • 7)通用-数据字段累计求和获取
      • 8)通用-指定两个分析字段分析日期直方图聚合
      • 9)指定语义指纹获取数据量
      • 10)通用-各互动量字段总和获取
      • 11)通用-指定度量字段去重统计
      • 12)通用-指定分析字段返回其中某一种去重统计聚合分析
      • 13)通用-指定分析字段返回COUNT和SUM聚合分析
      • 14)指定渠道和发布时间字段分析日期直方图聚合
    • 4、媒体账号分析相关接口
      • 1)通用-账号总量获取
    • 5、热榜相关接口
      • 附件说明
        • 不同渠道对应同城热榜信息采集情况说明
      • 1)热搜榜信息检索
      • 2)实时热搜榜信息
      • 3)同城-热搜榜信息检索
      • 4)同城-实时热搜榜信息
      • 5)热榜详情信息获取
      • 6)根据榜单类型+渠道实时获取榜单信息
      • 7)根据榜单类型+渠道检索榜单信息
      • 8)境外热榜趋势-指定渠道获取实时热榜趋势信息
      • 9)境外热榜趋势-多条件获取热榜趋势信息
    • 7、数据推送相关接口
      • 1)分页排序多条件检索专题列表查询
      • 2)添加专题信息
      • 3)更新专题信息
      • 4)更新专题状态
      • 5)删除专题信息
      • 6)根据用户ID获取Kafka信息
  • 服务总线-附件
    • Java客户调用接口生成签名工具类
    • Python客户调用接口生成签名工具类
    • 原生服务错误码值说明
  • 产品API
    • 主题订阅
      • 订阅ID
    • 分析组件
      • 事件/话题简介
      • 热点主题
      • 概述
      • 专家观点
      • 信息内容分类
      • 发布地域
      • 发文习惯
      • 媒体曝光趋势对比
      • 媒体等级分布
      • 微博网民观点
      • 提及地域分布
      • 传播路径
      • 账号认证分布
      • 账号性别分布
      • 热点榜单
      • 热点短语
      • 热点词语
      • 情感倾向
      • 热点文章
      • 媒体曝光趋势
      • 影响力指数
      • 互动趋势
      • 热门组织
      • 热门人物
    • AI雷达
      • 主题信息列表
      • 主题信息类型+信息属性
      • 主题信息监测事件列表
  1. 1、发文检索相关接口

2)检索发文详情信息

POST
/v1/search/getSearchDetail
1、发文检索相关接口
指定检索条件查询注意:1、前端新跳转页面无法携带参数或项目直接使用,可以使用该接口           2、若前端页面可携带参数,可以忽略该请求减少资源浪费

请求参数

Header 参数
appKey
string 
AppKey
必需
nonce
string 
随机数
必需
timestamp
string 
时间戳
必需
signature
string 
必需
签名,详见附件客户签名生成工具类
Body 参数application/json
搜索详情入参
searchMode
object (SearchModeDetail) 
详情标红检索模式
可选
searchType
integer <int32>
可选
搜索关键词类型【0-高级模式、1-简易模式】
>= 0<= 1
keywordExps
array[string]
高级模式-表达式
可选
simpleKeyword
object (SimpleKeyword) 
可选

简易模式【searchType=1,此字段必填】
注意:1. [ !#^&+|(){}[]<>~!#&()——+|{}【】]-等特殊符号不支持;
            2.不支持如!&,!|,!! 连着写法;
            3.三组关键词累加输入长度限制不超过200(包含200)。

matchMethods
array[integer <int32>]
可选
匹配方式【默认文本匹配,1-文本(正文|标题)、2-OCR、3-语音、4-场景、5-人脸、6-标题、7-正文(内容)】
uuid
string 
文章唯一值
必需
index
string 
文章对应的索引
必需
isHighLight
boolean 
可选
是否高亮【默认不高亮,true-高亮、false-不高亮】
示例值:
false
示例
{
  "searchMode": {
    "searchType": 0,
    "keywordExps": [
      "string"
    ],
    "simpleKeyword": {
      "mustKeyWord": [
        "string"
      ],
      "mustKeyWordComplex": [
        "string"
      ],
      "anyKeyWord": [
        "string"
      ],
      "needExclude": [
        "string"
      ]
    }
  },
  "matchMethods": [
    0
  ],
  "uuid": "string",
  "index": "string",
  "isHighLight": false
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/v1/search/getSearchDetail' \
--header 'appKey;' \
--header 'nonce;' \
--header 'timestamp;' \
--header 'signature;' \
--header 'Content-Type: application/json' \
--data-raw '{
    "searchMode": {
        "searchType": 0,
        "keywordExps": [
            "string"
        ],
        "simpleKeyword": {
            "mustKeyWord": [
                "string"
            ],
            "mustKeyWordComplex": [
                "string"
            ],
            "anyKeyWord": [
                "string"
            ],
            "needExclude": [
                "string"
            ]
        }
    },
    "matchMethods": [
        0
    ],
    "uuid": "string",
    "index": "string",
    "isHighLight": false
}'

返回响应

🟢200OK
application/json
Body
返回数据格式
code
integer <int32>
可选
响应码【200代表成功,其他参见错误码值表】)
success
boolean 
可选
是否成功【true代表成功,false代表失败】
message
string 
响应消息
可选
data
object (SearchResultVO) 
发文检索响应结果集
可选
gid
integer <int64>
全局有序ID
可选
uuid
string 
文档唯一ID
可选
title
string 
可选
标题【针对社交媒体没有标题,只有内容,则将标题设为用户名称】
layoutName
string 
电子报纸版面名称
可选
layoutCode
string 
电子报纸版号
可选
paperPicture
array[string]
电子报纸版面图
可选
author
string 
作者
可选
source
string 
可选
文章来源【文章的原发网站或来源,针对自媒体平台发文,则将文章来源设为作者的账号名称】
abstract1
string 
摘要
可选
content
string 
内容
可选
imageOcrContent
string 
可选
OCR内容识别结果集【该字段需要单独申请权限,请联系运营人员】
imageOcrVo
string 
可选
正文图片OCR内容【该字段需要单独申请权限,请联系运营人员】
audioContent
string 
可选
视频ASR内容【该字段需要单独申请权限,请联系运营人员】
publishTime
string 
文章发布时间
可选
crawlerTime
string 
文章采集时间
可选
updateTime
string 
数据更新时间
可选
esInsertTime
string 
数据入ES时间
可选
url
string 
发文链接
可选
picturesArray
array[string]
图片链接
可选
videosArray
array[string]
视频链接
可选
videosCoverArray
array[string]
视频封面图链接
可选
mediaType
array[integer <int32>]
可选
文章内容标识【1-含文本、2-含图片、3-含视频】
htmlInfo
string 
可选
网页HTML【原网页的正文部分HTML源代码,只有网站、客户端】
likeCount
integer <int32>
可选
点赞量【自媒体、社交媒体等平台的发布文章被点赞次数】
commentCount
integer <int32>
可选
评论量【自媒体、社交媒体等平台的发布文章下的评论次数】
readCount
integer <int32>
可选
阅读量【自媒体、社交媒体等平台的文章被阅读次数】
playCount
integer <int32>
可选
播放量【抖音、快手等视频站点的视频播放次数】
watchCount
integer <int32>
可选
在看量【文章的再看量,目前只用于微信数据】
rttCount
integer <int32>
转发量
可选
collectCount
integer <int32>
收藏量
可选
barrageCount
integer <int32>
弹幕量
可选
coinCount
integer <int32>
投币量
可选
topicTags
array[string]
话题标签
可选
articleType
integer <int32>
可选
发文类型【1-原创、2-转发、3-评论】
rootArticle
object (RootArticleVO) 
可选
与原发文关系(根博文)【如果文章类型是原文该字段为空】
rootArticleId
string 
可选
根发文ID【多层级根原文ID值】
parentArticleId
string 
可选
父级发文ID【多层级转发/评论关系字段】
ipAreaName
string 
IP归属地名称
可选
ipAreaCountry
string 
IP归属地所在国家
可选
ipAreaProvince
string 
IP归属地所在省
可选
platform
object (PlatformVO) 
站点信息聚类
可选
user
object (UserVO) 
账号信息聚类
可选
analysis
object (AnalysisVO) 
分析信息聚类
可选
articleId
string 
文章id
可选
isPaid
integer <int32>
可选
是否付费采集【0-免费、1-付费】
allFaceCount
integer <int32>
可选
表情_总表情数【FB独有】
isAdvertisement
integer <int32>
可选
是否为广告数据【0-否、1-是】
hectare
string 
可选
报纸发文位置【电子报纸独有】
firstPicture
string 
可选
文章版面首图【微信独有】
articlePage
string 
可选
同一时间多篇文章的顺序【微信独有】
errors
array[string]
错误信息集合
可选
time
string <date-time>
响应时间
可选
示例
{
  "code": 0,
  "success": true,
  "message": "string",
  "data": {
    "gid": 0,
    "uuid": "string",
    "title": "string",
    "layoutName": "string",
    "layoutCode": "string",
    "paperPicture": [
      "string"
    ],
    "author": "string",
    "source": "string",
    "abstract1": "string",
    "content": "string",
    "imageOcrContent": "string",
    "imageOcrVo": "string",
    "audioContent": "string",
    "publishTime": "string",
    "crawlerTime": "string",
    "updateTime": "string",
    "esInsertTime": "string",
    "url": "string",
    "picturesArray": [
      "string"
    ],
    "videosArray": [
      "string"
    ],
    "videosCoverArray": [
      "string"
    ],
    "mediaType": [
      0
    ],
    "htmlInfo": "string",
    "likeCount": 0,
    "commentCount": 0,
    "readCount": 0,
    "playCount": 0,
    "watchCount": 0,
    "rttCount": 0,
    "collectCount": 0,
    "barrageCount": 0,
    "coinCount": 0,
    "topicTags": [
      "string"
    ],
    "articleType": 0,
    "rootArticle": {
      "rootIndex": "string",
      "rootArticleId": "string",
      "rootArticleUrl": "string"
    },
    "rootArticleId": "string",
    "parentArticleId": "string",
    "ipAreaName": "string",
    "ipAreaCountry": "string",
    "ipAreaProvince": "string",
    "platform": {
      "dataSourceType": "string",
      "websiteName": "string",
      "host": "string",
      "subHost": "string",
      "country": "string",
      "isForeignMedia": 0,
      "mediaAreaProvince": "string",
      "mediaAreaCity": "string",
      "mediaAreaCounty": "string",
      "channelName": "string",
      "channelUrl": "string",
      "mediaTags": [
        "string"
      ]
    },
    "user": {
      "userId": "string",
      "secUid": "string",
      "customId": "string",
      "userName": "string",
      "url": "string",
      "headImageUrl": "string",
      "isVerified": 0,
      "verifiedType": 0,
      "followersCount": 0,
      "publishCount": 0
    },
    "analysis": {
      "fingerprint": "string",
      "isFingerprintHead": 0,
      "interactionCount": 0,
      "weightInteractionCount": 0,
      "entityAddress": [
        "string"
      ],
      "entityOrganization": [
        "string"
      ],
      "entityPeople": [
        "string"
      ],
      "analyzeLocation": [
        "string"
      ],
      "keywords": [
        "string"
      ],
      "language": "string",
      "polarity": 0,
      "subjectSentiment": [
        "string"
      ],
      "isSensitive": 0,
      "sensitiveWords": [
        "string"
      ],
      "contentAreaCountry": [
        "string"
      ],
      "contentAreaProvince": [
        "string"
      ],
      "contentAreaCity": [
        "string"
      ],
      "contentAreaCounty": [
        "string"
      ],
      "category": "string",
      "firstPublication": 0,
      "expertOpinions": [
        "string"
      ],
      "keyPhrase": [
        "string"
      ],
      "phrases": [
        "string"
      ],
      "subjectExtract": [
        "string"
      ],
      "heatNumber": 0,
      "rank": 0,
      "tags1": [
        "string"
      ],
      "tags2": [
        "string"
      ],
      "tags3": [
        "string"
      ],
      "tags4": [
        "string"
      ],
      "tags5": [
        "string"
      ],
      "tags6": [
        "string"
      ],
      "tags7": [
        "string"
      ]
    },
    "articleId": "string",
    "isPaid": 0,
    "allFaceCount": 0,
    "isAdvertisement": 0,
    "hectare": "string",
    "firstPicture": "string",
    "articlePage": "string"
  },
  "errors": [
    "string"
  ],
  "time": "2019-08-24T14:15:22Z"
}
上一页
1)分页检索发文信息列表
下一页
3)通过uuid批量查询发文信息列表
Built with