运行采集器
POST
/v1/scrapers/{scraperId}/run请求参数
Path 参数
scraperId
string
必需
采集器的 id ,例如 网页内容采集器(https://console.beeize.com/template/3x6ue1v3tccnlqukc),scraperId 为 3x6ue1v3tccnlqukc
Header 参数
Body 参数application/json
input
object
必需
input 对应采集的输入,可以参考采集的【输入】的 Josn 视图,不同的采集器输入不一样
runOptions
object
必需
buildTag
string
必需
构建标签, 默认 latest 就可以了
timeoutSecs
integer
必需
超时时间,运行超过超时时间,会自动强制停止,建议配置大一些
memoryMbytes
integer
必需
运行的内存配置,建议配 2048
示例
{
"input": {
"key": "value",
"proxyConfig": {
"proxyType": "RESIDENTIAL",
"countryCode": "CN"
}
},
"runOptions": {
"buildTag": "latest",
"timeoutSecs": 300,
"memoryMbytes": 1024
}
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
code
integer
必需
msg
string
必需
data
object
必需
id
string
运行 Id
createAt
string
创建时间
updateAt
string
更新时间
scraperId
string
采集器 id
serviceId
string
用户 id
status
string
运行状态
input
object
运行的输入
proxyConfig
object
代理配置
timeoutSec
integer
超时时间
buildId
string
采集器构建 id
buildVersion
string
采集器构建版本
origin
string
来源
memory
integer
内存配置
logId
string
日志 id
jobId
string
job id
kvStoreId
string
键值对 id
datasetId
string
数据集 id
requestQueueId
string
采集器队列 id
deleteFlag
boolean
必需
示例
{
"code": 0,
"msg": "",
"data": {
"id": "zx6ue1uo13g7uhzvj",
"createAt": "2024-09-04 16:38:58",
"updateAt": "2024-09-04 16:38:58",
"deleteFlag": false,
"scraperId": "mm5733d6hznnyyefr",
"serviceId": "yv55vjm2zjvsaphlr",
"status": "CREATED",
"input": {
"urls": [
"https://www.baidu.com/"
],
"white_list": [
"/news"
],
"black_list": [
"/news"
],
"level": 2,
"max_page": 100,
"proxyConfig": {
"proxyType": "NO_PROXY",
"countryCode": "",
"ownProxyUrls": []
}
},
"proxyConfig": {
"countryCode": "cn",
"proxyType": "RESIDENTIAL"
},
"timeoutSec": 600,
"buildId": "v068wlhypy9473tyv",
"buildVersion": "0.0.10",
"origin": "WEB",
"memory": 2048,
"logId": "si6ue1uo13g7udjgr",
"jobId": "si6ue1uo13g7udjgr",
"kvStoreId": "e36ue1uo13g7ufjvv",
"datasetId": "ie6ue1uo13g7uezu2",
"requestQueueId": "tw6ue1uo13g7ug80h"
}
}
最后修改时间: 2 个月前