python 使用文本转语音
文字转语音 (TTS) API 指南
概述
speech
端点,基于 TTS 模型实现以下功能:重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音
基础使用
基本示例
功能特性
音频质量选项
可用声音
支持的输出格式
格式 | 特点 | 适用场景 |
---|---|---|
MP3 | 默认格式 | 通用场景 |
Opus | 低延迟 | 网络流媒体和通信 |
AAC | 高效压缩 | 移动设备播放 |
FLAC | 无损压缩 | 音频存档 |
WAV | 无压缩 | 低延迟应用 |
PCM | 原始采样 | 24kHz, 16位有符号 |
实时音频流
支持语言
注意:当前声音主要针对英语优化