钱多多-全链路API聚合
首页钱多多首页
首页钱多多首页
  1. Python配置方式
  • 发出请求
  • 模型接口
    • 完成对象
    • OpenAI接口
      • 文本生成(通用)
      • 图片理解(通用)
      • 图片生成(gpt-image-1)
      • 图片生成(dall-e-3)
      • 图片编辑(edits接口)
      • 图片编辑(网页版)
      • Web search(联网搜索)
      • Responses API
      • Function calling
      • response_format
      • N测试
      • 创建文本嵌入
      • 批量创建嵌入
      • 文本转语音(TTS)
      • 语音转文本(STT)whisper-1
      • 语音转文本(STT)gpt-4o-transcribe
      • 音频翻译
      • Audio接口(输出)
      • Audio接口(输入)
      • 内容补全接口
      • gpt-image-1(网页版)
      • 图片变体生成
      • 创建内容审核
      • 列出模型
    • 文生图接口
      • Grok 2 Image Gen
      • flux-schnell(OpenAI图像格式)
      • FLUX1.1-pro(OpenAI图像格式)
      • stable-diffusion(OpenAI图像格式)
      • ideogram
      • recraftv3
    • Realtime (实时语音、对话)
      • Realtime API
    • Anthropic Claude
      • 文本生成
      • 图片理解
      • 文本生成(v1/messages)
      • Tool use (function calling)
    • 谷歌Gemini
      • 文本生成
      • 文本生成 (联网)
      • 图片生成(2.0 Flash)
      • 图片生成 (Imagen 3)
      • 图片理解
      • 音频理解
      • 视频理解
    • Midjourney
      • 提交Imagine任务
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
      • 提交swap_face任务
      • 执行Action动作
      • 上传文件到discord
      • 根据ID列表查询任务
      • 指定ID获取任务
      • 获取任务图片的seed
    • GPTs 相关
      • gpt-4-all(分析图片)
      • gpt-4-all(生成图片)
      • GPTs对话
      • 搜索相关 GPTs
      • 查询 GPTs 详情
      • 批量查询 GPTs 详情
    • 文生音乐
      • Suno
        • 生成歌曲(API格式)
        • 生成歌词(API格式)
        • 查询单个任务(API格式)
        • Suno(Chat格式)
      • Udio
        • Udio(Chat格式)
    • 文生视频
      • 文生视频(luma)
      • 文生视频(runway)
      • 智谱清言GLM
      • 文生视频(可灵)
    • Rerank API
      • Jina AI 重排序格式
      • Cohere 重排序格式
      • Xinference 重排序格式
  • Python配置方式
    • Python基础对话
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
  • 帮助中心
    • 常见问题及解决办法
  • 回收站
    • 查询所有任务
      GET
    • 根据ID列表查询任务-字段displays
      POST
    • 分页查询任务
      POST
    • 查询任务队列
      GET
    • 取消任务
      POST
    • 提交Shorten任务
      POST
    • Stable-Diffusion
      POST
  1. Python配置方式

Python使用Claude识别图片

识别链接格式图片
from openai import OpenAI

client = OpenAI(
    base_url="https://api2.aigcbest.top/v1",
    api_key="sk-xxxx"
)

response = client.chat.completions.create(
  model="claude-3-5-sonnet-20240620",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "What’s in this image?"},
        {
          "type": "image_url",
          "image_url": {
            "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
          },
        },
      ],
    }
  ],
  max_tokens=300,
)

print(response.choices[0])
识别本地图片
import base64
import time
from openai import OpenAI
import openai

key = 'sk-xxxx' 

client = OpenAI(
    base_url="https://api2.aigcbes.top/v1",
    api_key=key
)


def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')


image_path = "图片.jpg"

base64_image = encode_image(image_path)

while True:
    response = client.chat.completions.create(
        model="claude-3-5-sonnet-20240620",
        messages=[
            {
                "role": "user",
                "content": [
                    {"type": "text", "text": "这张图片里有什么?请详细描述。"},
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": f"data:image/jpeg;base64,{base64_image}"
                        }
                    }
                ]
            }
        ],
        temperature=1
    )
    print(response)
    print(response.choices[0].message.content)
    time.sleep(1)
修改于 2024-10-30 06:09:09
上一页
Python使用gpt-4o识别图片
下一页
常见问题及解决办法
Built with