图像识别 gpt-4-vision-preview
POST
https://yewu.bcwhkj.cn/api/v2.Gptliu/search冰橙API提供与OPENAI官方的API兼容的接口方式,方便国内开发者进行与OPENAI的CHATGPT的接口对接服务
:::highlight purple 📌
gpt-4-vision-preview,也简称Gpt4V,本接口相当于让GPT4有了人类的眼睛,可以看到画面并理解画面。
通过识别提交的远程网址图片或图片Base 64 编码,进行识别图片内容,然后可以依据图片内容进行提问或文字创作(后续还可使用TTS音频接口,产生例如解说等实例的运用)。
例:可询问图像是否包含某文字/图片内容校正/行为预测/故事创作等
:::
有关本接口的相关详细介绍及运用的一些推荐文章:
https://zhuanlan.zhihu.com/p/665845977
https://zhuanlan.zhihu.com/p/666868438
足球解说 (gpt4V+TTs)https://baijiahao.baidu.com/s?id=1781986414419954012&wfr=spider&for=pc
字符消耗与GPT4相同
token获取方式:
访问公众号《冰橙云》进入菜单冰橙AI助手后,访问右上角 / 个人(首次访问免费赠送15000字符,可通过充值增加字符数)可查看 token
访问:https://yewu.bcwhkj.cn 》 个人 》Token令牌 获取(首次访问赠送15000字符)
请求参数
Body 参数application/json
model
enum<string>
固定值
枚举值:
gpt-4-vision-preview
messages
array [object {2}]
必需
role
string
可选
content
array [object {3}]
可选
max_tokens
integer
必需
示例
{
"model": "gpt-4-vision-preview",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "这是什么图片?"
},
{
"type": "image_url",
"image_url": {
"url": "https://vkceyugu.cdn.bspapp.com/VKCEYUGU-908027cd-0849-4303-ae20-d3bed9830e3a/25eaeef6-ccce-4b08-9caa-de04ecef681a.png"
}
}
]
}
],
"max_tokens": 300
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
id
string
必需
object
string
必需
created
integer
必需
model
string
必需
usage
object
必需
prompt_tokens
integer
必需
completion_tokens
integer
必需
total_tokens
integer
必需
choices
array [object {3}]
必需
message
object
可选
finish_details
object
可选
index
integer
可选
示例
成功示例
{
"id": "chatcmpl-8L6BxSCOohqe8lq5lPxmqqHa0yB3Z",
"object": "chat.completion",
"created": 1700039381,
"model": "gpt-4-1106-vision-preview",
"usage": {
"prompt_tokens": 269,
"completion_tokens": 85,
"total_tokens": 354
},
"choices": [
{
"message": {
"role": "assistant",
"content": "这是一个橙色的简化风格的图标,呈现一个类似于桃子的水果形状,上面带有一个绿色的叶子。这可能用于代表食物、健康、水果类的应用程序图标或是某种品牌标识。"
},
"finish_details": {
"type": "stop",
"stop": "<|fim_suffix|>"
},
"index": 0
}
]
}
最后修改时间: 6 个月前