薛定猫API官方文档
  1. Python配置方式
薛定猫API官方文档
  • 薛定猫API官方文档
    • 引言
    • 在线调试说明
    • 发出请求
    • 中转站基本介绍
      • API 快速开始指南
      • 联系客服
      • 分组详细表格
      • 分组的特殊性及价格差异
      • 如何新建指定分组的令牌
      • 代理接口调用地址
      • API Key 额度查询服务
      • 免费AI聊天项目导航
    • Chat模型
      • ChatGpt 接口
        • ChatGPT音频(Audio)
          • 创建语音
          • 创建转录
          • 创建翻译
          • 官方N测试
        • ChatGPT聊天(Chat)
          • 聊天完成对象
          • 聊天完成块对象
          • gemini图片创作接口
          • 创建聊天补全 (流式)
          • 聊天接口
          • 创建聊天补全 (非流)
          • 识图接口
          • 提交视频生成任务-chat格式
          • 创建聊天识图 (流式)
          • 创建聊天识图 (非流)
          • 列出模型
          • 创建聊天函数调用 (只能非流)
          • 创建结构化输出
          • 控制推理模型努力程度
        • ChatGPT自动补全(Completions)
          • 完成对象
          • 创建完成
        • ChatGPT嵌入(Embeddings)
          • 嵌入对象
          • 创建嵌入
        • ChatGPT绘画
          • DALL·E 3
          • 编辑
      • Anthropic Claude 接口
        • 聊天完成对象
        • 聊天完成块对象
        • 创建聊天补全 (流式) [原生格式]
        • gpt-4-all(分析图片)
        • gpt-4-all(生成图片)
        • GPTs对话
        • Stable-Diffusion
      • 谷歌Gemini
        • gemini图片创作接口
        • 聊天接口
        • 识图接口
    • 文生图模型
      • README
      • 图像对象
      • MJ绘画
        • 上传图片
        • 提交Imagine任务
        • 根据任务ID 查询任务状态
        • 根据ID列表查询任务
        • 获取任务图片的seed
        • 执行Action动作
        • 提交Blend任务
        • 提交Describe任务
        • 提交Shorten任务
        • 提交Modal
        • 提交swap_face任务
      • ideogram 绘画
        • Generate 3.0(文生图)Generate
        • Generate 3.0(图片编辑)Edit
        • ideogram
        • Generate 3.0(图片重制)Remix
        • Generate 3.0(图片重构)Reframe
        • Generate 3.0(替换背景) Replace Background
        • ideogram(文生图)
        • Remix(混合图)
        • Upscale(放大高清)
        • Describe(描述)
      • DALL·E 3
    • 文生视频模型
      • luma 视频生成
        • 官方API格式
          • 提交生成视频任务
          • 扩展视频
        • 查询任务
          • 查询单个任务
          • 批量获取任务
      • 快手可灵
        • Callback协议
        • 图像生成
        • 文生视频
        • 图生视频
        • 查询任务(免费)
        • 查询任务(免费)
      • Runway 视频生成
        • 提交视频生成任务
        • 查询视频任务(免费)
        • 官方Function calling调用
    • GPTs 相关
      • Stable-Diffusion
      • 创建聊天识图 (流式) best64
      • 创建聊天识图 (非流)
    • 文生音乐 Suno
      • 说明
      • 参数
      • 任务提交
        • 生成歌曲(灵感、自定义、续写)
        • 生成歌词
        • 歌曲拼接
      • 查询接口
        • 批量获取任务
        • 查询单个任务
      • 创建聊天创作图 (非流)
    • 系统API
      • 获取令牌列表
      • 新增令牌
    • Python配置方式
      • gpt realtime模型调用
      • python openai官方库(使用AutoGPT,langchain等)
      • python 连续对话
      • python 使用 语音转文本
      • python 使用文本转语音
      • python 使用Embeddings 向量化
      • python 调用DALL·E
      • python简单调用 openai function-calling demo
      • python 简单langchain 调用openai demo
      • python llama_index 配置
      • Python使用gpt-4o识别图片-本地图片
      • Python基础对话
      • Python使用gpt-4o识别图片
      • Python使用Claude识别图片
      • python 库流式输出
      • python request 请求 流式输出demo
      • python 使用gpt-image-1 创建编辑图片
    • nodejs 配置方式
      • nodejs 基础对话
    • 各种插件/软件使用教程
      • CLAUDE DEV 配置教程
      • chatgpt-on-wechat 配置教程
      • 沉浸式翻译 设置gpt翻译
      • nextchat 设置教程
      • aider 配置教程
      • Cursor 配置教程
      • lobechat 设置教程
      • chatgpt GPT Academic 学术优化配置gpt教程
      • zotero gpt 配置方法
      • 浏览器插件ChatGPT Sidebar
      • ChatBox(推荐使用)
      • 开源gpt_academic
    • 帮助中心
      • HTTP状态码及其含义
  1. Python配置方式

python 使用文本转语音

文字转语音 (TTS) API 指南#

概述#

音频 API 提供 speech 端点,基于 TTS 模型实现以下功能:
📝 博客文章朗读
🌍 多语言音频生成
🎵 实时音频流输出
重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音

基础使用#

基本示例#

功能特性#

音频质量选项#

tts-1: 低延迟,适合实时应用
tts-1-hd: 更高质量,可能有更少的静态内容

可用声音#

alloy
echo
fable
nova
shimmer
onyx

支持的输出格式#

格式特点适用场景
MP3默认格式通用场景
Opus低延迟网络流媒体和通信
AAC高效压缩移动设备播放
FLAC无损压缩音频存档
WAV无压缩低延迟应用
PCM原始采样24kHz, 16位有符号

实时音频流#

支持语言#

支持多种语言,包括:
亚洲语言:中文、日语、韩语等
欧洲语言:英语、法语、德语等
其他语言:阿拉伯语、印地语等
注意:当前声音主要针对英语优化

常见问题#

Q: 如何控制生成音频的情感?#

A: 目前没有直接控制机制。大写字母或语法可能影响输出,但效果不确定。

Q: 能创建自定义声音吗?#

A: 不支持创建自定义声音。

Q: 生成的音频归属权?#

A: 归创建者所有,但需告知用户这是 AI 生成的音频。
上一页
python 使用 语音转文本
下一页
python 使用Embeddings 向量化
Built with