在线服务

发布服务
服务配置

字段 | 内容 | 描述 |
---|---|---|
服务名称 | 用户定义的服务名称 | 必填项,不超过20字,支持中英文 |
服务描述 | 用户定义的服务描述 | 非必填,最多支持300个字符 |
选择模型 | 模型名称 | 必选项,选择对应发布的模型,可以是运行成功的自训练模型或预置模型,并选定模型版本 |
API地址 | 用户定义的接口地址 | 必填项,仅支持英文,接口地址需要多于5个字符但不能超过20个字符。 同一个账户下的接口地址 不支持重复。 |
资源配置

字段 | 内容 | 描述 |
---|---|---|
资源池 | 公共资源池、私有资源池 | 选择服务可托管的资源池,如服务托管在私有资源池,可设定在线服务部署的算力单元来保障QPS。 |
租赁方式 | 时间单位:时/天/月 | ⼩时范围:1-23;天数范围:1-29;包⽉范围:1-12。 |
生效时间 | 日期选择 | 选择服务运行的开始和结束时间,不可选择早于今天的日期 |
失效时间 | 自动生成 | 当您选择租赁方式和生效时间后,自动计算失效时间 |
算力单元 | 设置算力单元数 | 为当前服务部署所占用的算力单元数量。算力单元越多,其可承载的QPS越高,仅支持服务部署所需最小算力单元数的整数倍调整 |
预估首Tokens时延 | 平台自动生成 | 用于评估在将数据写入持久性存储设备时,系统处理数据并返回给客户端所需的时间。 |
预估QPS | 平台自动生成 | 服务运行中产生的并发,受服务和生效时间限制。 |
ERNIE-Bot-turbo每16个算力单元,可支持约6QPS。
私有资源池资源租赁限时7折优惠,详细金额及示例可查看价格文档。
特别注意
大于等于1天小于30天:预估QPS可达上限为20
大于等于30天,小于90天:预估QPS可达上限为50
大于等于90天:预估QPS可达上限为99
列表查看

服务详情
