个人项目
  1. LLM
个人项目
  • 系统介绍
  • 系统优势
  • 补充说明
  • 辅助功能
    • 功能介绍
    • 账户余额查询
      • 余额查询-OpenAI Next
      • 余额查询-MJ Next
    • 文件上传
      • 文件上传-OpenAI Next
      • 文件上传-MJ Next
    • 文件解析(无特定接口)
      • 文件解析功能介绍
  • 按量计费
    • LLM
      • 资源介绍
      • 接入说明
      • 参数详情
      • 发出请求
      • 身份验证
      • 项目说明
      • 费用说明
      • 聊天(Chat)
        • 聊天完成对象
        • 聊天完成块对象
        • 创建聊天补全
      • 自动补全(Completions)
        • 完成对象
        • 创建完成
      • 音频(Audio)
        • 创建语音
        • 创建转录
        • 创建翻译
      • 嵌入(Embeddings)
        • 嵌入对象
        • 创建嵌入
      • 微调(Fine-tuning)
        • 微调作业对象
        • 微调作业事件对象
        • 创建微调作业
        • 列出微调作业
        • 检索微调作业
        • 取消微调
        • 列出微调事件
      • 图像(Images)
        • README
        • 图像对象
        • 创建图像
        • 创建图片编辑
        • 创建图像变体
      • 模型(Models)
        • 模型对象
        • 列出模型
        • 检索模型
        • 删除微调模型
      • 文件(Files)
        • README
        • 文件对象
        • 上传文件
        • 删除文件
        • 检索文件
        • 检索文件内容
        • 列出文件
      • 审查(Moderations)
        • 调节对象
        • 创建内容审核
      • 助手测试版(AssistantsBeta)
        • 辅助对象
        • 辅助文件对象
        • 创建助手
        • 检索助手
        • 修改助手
        • 删除助手
        • 列出助手
        • 创建辅助文件
        • 检索助手文件
        • 删除辅助文件
        • 列出助手文件
      • 线程数(Threads)
        • 线程对象
        • 创建线程
        • 检索线程
        • 修改线程
        • 删除话题
      • 留言(Messages)
        • 消息对象
        • 消息文件对象
        • 创建消息
        • 检索消息
        • 修改留言
        • 列出消息
        • 检索消息文件
        • 列出消息文件
      • 运行(Runs)
        • 运行对象
        • 运行步骤对象
        • 创建运行
        • 检索运行
        • 修改运行
        • 列表运行
        • 提交工具输出以运行
        • 取消运行
        • 创建线程并运行
        • 检索运行步骤
        • 列出运行步骤
    • GPTs
      • 资源介绍
      • 接入说明
      • 可用模型
      • GPTs
        • 流式接入GPTs
        • 非流式接入GPTs
        • 根据ID查询GPTs详情
        • 搜索GPTs
      • 文件上传
  • 按次计费
    • MJ Chat
      • 资源介绍
      • ImageGenerations
    • Suno-Proxy
      • 歌词生成
        • 生成歌词
      • 音乐生成
        • 生成音乐
      • 音乐上传
        • 上传音乐
      • 歌曲拼接
        • 歌曲拼接
      • 任务查询
        • 查询任务
    • sora
      • 官方格式
        • 创建视频
        • 查询视频
      • openai chat 格式
        • 生成视频
    • 可灵(官方格式)
      • 图像生成(暂不支持)
      • 文生视频
      • 图生视频
      • 查询任务
    • MJ Proxy
      • 资源介绍
      • 参数说明
      • 调用示例
      • 费用说明
      • 任务查询
        • FetchFromTask
        • ImageSeed
      • 任务提交
        • Blend
        • SwapFace
        • Describe
        • Imagine
        • Shorten
        • Modal
        • Action
        • Change
    • SD Chat
      • ImageGenerations Copy Copy
    • SD Proxy
      • SD3
        • Stable Image Ultra
        • Stable Image Core
        • Stable Diffusion 3
      • SDXL
        • Text-to-image
    • Suno Chat
      • SunoGenerations
    • Suno Proxy 旧
      • /v1/song/feed
      • /v1/song/create
    • Luma Chat
      • LumaGenerations
    • Lumvip Proxy
      • /generations
      • /task
      • /extend
    • Luma Proxy
      • /generations
      • /extend
      • /task
    • Pika
      • 创建视频
      • 查询视频
    • Domo
      • 创建视频
      • 查询视频
    • urlanalysis
      • 链接总结(summary)
      • 链接聊天(chat)
      • 字幕导出(subtitle)
  1. LLM

参数详情

频率和存在惩罚
Completions API 中发现的频率和存在惩罚可用于降低对令牌重复序列进行采样的可能性。他们通过添加贡献直接修改 logits(非标准化对数概率)来工作。
在哪里:
mu[j]是第 j 个标记的对数
c[j]是在当前位置之前对该令牌进行采样的频率
float(c[j] > 0)如果为 1,c[j] > 0否则为 0
alpha_frequency是频率惩罚系数
alpha_presence是存在惩罚系数
正如我们所见,存在惩罚是一种一次性的加性贡献,适用于所有至少被采样过一次的标记,而频率惩罚是与特定标记被采样的频率成正比的贡献。
如果目标只是稍微减少重复样本,则惩罚系数的合理值约为 0.1 到 1。如果目标是强烈抑制重复,那么可以将系数增加到 2,但这会显着降低样本质量。负值可用于增加重复的可能性。

关键概念#

GPT#

OpenAI 的 GPT(生成式预训练变压器)模型经过训练可以理解自然语言和代码。GPT 提供文本输出来响应其输入。GPT 的输入也称为“提示”。设计提示本质上是如何“编程”GPT 模型,通常是通过提供说明或一些如何成功完成任务的示例。GPT 可用于多种任务,包括内容或代码生成、摘要、对话、创意写作等。请阅读我们的 GPT 介绍指南和 GPT 最佳实践指南来了解更多信息。

嵌入#

嵌入是一段数据(例如某些文本)的矢量表示,旨在保留其内容和/或其含义的各个方面。在某些方面相似的数据块往往比不相关的数据具有更紧密的嵌入。OpenAI 提供文本嵌入模型,该模型将文本字符串作为输入并生成嵌入向量作为输出。嵌入对于搜索、聚类、推荐、异常检测、分类等非常有用。在我们的嵌入指南中阅读有关嵌入的更多信息。

代币#

GPT 和嵌入模型以称为标记的块的形式处理文本。标记代表常见的字符序列。例如,字符串“tokenization”被分解为“token”和“ization”,而像“the”这样的短而常见的单词则被表示为单个标记。请注意,在句子中,每个单词的第一个标记通常以空格字符开头。查看我们的 Tokens 计算器来测试特定字符串并查看它们如何转换为标记。根据粗略的经验,1 个标记大约相当于 4 个字符或英文文本的 0.75 个单词。
要记住的一个限制是,对于 GPT 模型,提示和生成的输出之和不得超过模型的最大上下文长度。对于嵌入模型(不输出标记),输入必须短于模型的最大上下文长度。每个 GPT 和嵌入模型的最大上下文长度限制可以在模型索引中找到。
上一页
接入说明
下一页
发出请求
Built with