ChatfireAPI
首页官网模型列表服务监控
关于更多
  • 充值
  • 联系客服
首页官网模型列表服务监控
关于更多
  • 充值
  • 联系客服
  1. Elevenlabs 语音
  • 最新公告
  • OpenAI
  • AnthropicClaude
    • Claude(原生接口)
      POST
  • Google
  • Elevenlabs 语音
    • text-to-speech
      POST
    • text-to-speech-with-timestamps
      POST
    • speech-to-text
      POST
  • Fal.ai
    • upscale 视频
      • topaz/upscale/video
      • 任务状态
      • 任务结果
    • elevenlabs 语音
      • elevenlabs/tts/turbo-v2.5
    • pixverse 视频
      • videos
      • 特效 effects
    • flux 图片
      • FLUX.1 [Dev] Redux
      • FLUX.1 [Schell] Redux
      • FLUX.1 [Dev] 图片生成图片
      • FLUX.1 Kontext [Pro]
      • FLUX.1 Kontext [Pro] 文本转图片
      • FLUX.1 Kontext [Multi](实验性多图编辑)
      • FLUX.1 Kontext [Max]
      • FLUX.1 Kontext [Max Multi](实验性多图编辑)
      • FLUX.1 [Dev] 文本生成图片
      • FLUX.1 [Schell] Redux
    • kling 视频
      • 创建任务-对口型
      • 任务状态
      • 任务结果
    • hunyuan 视频
      • text-to-video
      • image-to-video
      • video-to-video
      • 任务状态
      • 任务结果
    • vidu 视频
      • text-to-video
      • image-to-video
      • start-end-to-video
      • reference-to-video
      • 任务状态
      • 任务结果
    • pika 视频
      • text-to-video
      • image-to-video
      • pikascenes 多张图生视频
      • 任务状态
      • 任务结果
    • luma 视频
      • text-to-video
      • image-to-video
      • video-to-video
      • 任务状态
      • 任务结果
    • minimax 海螺视频
      • text-to-video
      • image-to-video
      • 任务状态
      • 任务结果
    • minimax 语音克隆
      • 语音克隆
      • 语音合成
      • 任务状态
      • 任务结果
    • 获取任务状态
      GET
    • 获取任务结果
      GET
  • Flux(BFL官方接口)
    • 创建任务 flux-kontext
      POST
    • 获取任务 flux-kontext
      GET
  • 火山方舟
    • 使用说明
    • 即梦视频(网页版)
      • 创建任务(即梦视频)
      • 获取任务(即梦视频)
    • 即梦视频 Doubao-Seedance
      • 创建任务-seedance
      • 获取任务-seedance
    • 即梦图片 SeedEdit
      • 人物参考
      • 创建任务
      • 获取任务
    • 智能绘图
      • 火山创建任务
      • 火山获取任务
  • Kling 可灵
  • MiniMax 海螺
    • v1(官方格式)
      • 获取任务
      • 创建任务(海螺视频)
      • 语音合成
      • 语音克隆
      • 文件上传
    • v2
      • 创建任务-海螺
      • 获取任务
  • 智谱 AI
    • 创建任务 vidu/cogvideox
    • 获取任务
  • 万相
    • 创建任务 wan
    • 获取任务
  • Search 搜索
    • 创建任务
    • mcp-开发中
  • Textin 合合
  • Images
    • 使用说明
    • 图像对象
    • 使用说明
    • 图片编辑(gpt-image)
      • edits(gpt-image)
      • edits(flux)
      • 创建图片(generations)
      • 图片编辑(chat)
      • edits(gpt-image) Copy
      • edits(gpt-image) Copy Copy
    • Recraft(图片)
      • 生成图片(OpenaiD3)
      • 图片矢量化
      • 变高清
      • Generate Image(生成图片)
    • 即梦3.0(Seedream)
    • 即梦垫图(SeedEdit)
    • 创建图像(FLUX)
    • 创建图像(Recraftv3)
    • 创建图像(Cogview)
    • 创建图像(混元)
    • 创建图像(Kling)
    • 创建图像(StableDiffusion)
    • 创建图像
    • 创建图像变体
    • kolors(文生图/图生图)
    • 虚拟换衣(virtual-try-on)
    • flux-kontext(文生图、图生图)
    • 海螺图片
    • Doubao-图片生成
  • Audio
    • 音乐生成(Suno)
      • 使用说明
      • 生成歌词
      • 生成歌曲(灵感、自定义、续写)
      • 获取任务
    • 语音克隆(fish-tts-model)
    • 语音合成(fish-tts)
    • 创建语音
    • 创建转录
    • 创建翻译
    • CosyVoice 语音克隆
    • IndexTTS-1.5 语音克隆
    • Step-Audio-TTS 语音克隆
  • Midjourney
    • 补充 - 其他参数以及回调
    • InsightFace任务提交
      • 提交swap_face任务
    • 任务提交
      • 执行动作
      • 提交Blend任务
      • 提交Describe任务
      • 提交Imagine任务
      • 提交modal
      • 提交Shorten任务
    • 任务查询
      • 查询所有任务
      • 根据ID列表查询任务
      • 分页查询任务
      • 查询任务队列
      • 取消任务
      • 指定ID获取任务
      • 获取任务图片的seed(需设置mj或niji的私信ID)
    • 获取任务
    • 创建任务 mj-video
    • 创建任务 mj-edits
  • RAG
    • 嵌入对象
    • Rerank
      • README
      • 重排序
    • 多模态向量嵌入
    • 创建嵌入(gemini-embedding)
    • 创建嵌入
  • Files
    • 使用说明
    • 文件对象
    • 文件用途(Purpose)
      • Suno
      • 文档解析OCR(textin)
      • 文档解析OCR(moonshot/kimi)
    • 上传文件
    • 删除文件
    • 检索文件
    • 检索文件内容
    • 列出文件
  • 🔥AI 工具
    • 合合签约(Textin)
      • 去水印
      • 文件转Markdown
      • 文档图像切边增强矫正
    • 图片处理
      • 去水印(remove-watermark)
      • 变高清(clarity)
      • 无损扩图(expand)
      • 抠图(rmbg-2.0)
      • 照片修复-待上线
      • 黑白照片上色-待上线
      • 图片矫正-待上线
    • 证件照(ID Photos)
      • 使用说明
      • 证件照生成
    • 抠图(ai-matting)
    • 变清晰(clarity)
    • 风格变换(style)
    • 图像切边增强矫正
    • 翻译助手
    • 视频转音频
    • OCR2.0
    • 图片转Markdown(image-to-markdown)
    • 图片文字识别(text-recognize)
  • 文档智能&图片处理
    • 图像水印去除(watermark-remove)
    • 文字识别(text_recognize_3d1)
    • 文档图像切边矫正(dewarp)
    • PDF转Markdown(pdf_to_markdown)
  • AI产品配置教程
    • Sider
    • 沉浸式翻译
  • 教程类
    • 视频生成模型操作指南
  • 系统API
    • ApiKey信息查询
  • 视频生成(Videos)
    • sora
      • 官方格式
        • 创建视频
        • 查询视频
      • openai chat 格式
        • 生成视频
    • 数字人系列-对口型(lipsync)
      • 创建任务
      • 获取任务
    • Runway(官方格式)
      • 创建任务(图生视频)
      • 获取任务
    • Luma(官方格式)
      • 创建任务(图生视频)
      • 获取任务
  • 内容审查(Moderations)
    • README.md
    • 创建内容审核
  • Deepdataspace
  1. Elevenlabs 语音

text-to-speech

POST
https://api.chatfire.cn/elevenlabs/v1/text-to-speech/{voice_id}
最后修改时间:2025-07-15 10:00:36
责任人:未设置
ElevenLabs Turbo v2.5 模型,用于文本转语音生成。
高质量、低延迟,非常适合实时应用。支持 32 种语言,同时保持自然的语音质量。
ElevenLabs Turbo v2.5 model for text-to-speech generation.
High quality with lowest latency, ideal for real-time applications. Supports 32 languages while maintaining natural voice quality.

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Path 参数
voice_id
object 
必需
点击获取 https://api.elevenlabs.io/v1/voices
示例值:
JBFqnCBsd6RMkjVDRZzb
voice_id
string 
可选
要使用的声音的ID。使用 Get voices 端点列出所有可用的声音。
Query 参数
output_format
object 
必需
URL查询字符串中的参数
示例值:
mp3_44100_128
enable_logging
boolean 
可选
当 enable_logging 设置为 false 时,请求将使用零保留模式。这意味着此请求的历史记录功能将不可用,包括请求拼接。零保留模式只能由企业客户使用。
默认值:
true
optimize_streaming_latency
integer  | null 
已废弃
已弃用。您可以以牺牲一些质量为代价来开启延迟优化。最佳的最终延迟因模型而异。可能的值:0 - 默认模式(无延迟优化),1 - 正常延迟优化(约为选项3可能延迟改善的50%),2 - 强延迟优化(约为选项3可能延迟改善的75%),3 - 最大延迟优化,4 - 最大延迟优化,但同时关闭文本规范化器以节省更多延迟(最佳延迟,但可能会读错数字和日期等)。
默认值:
null
output_format
enum<string> 
可选
生成音频的输出格式。格式为 codec_sample_rate_bitrate。例如,一个 22.05kHz 采样率、32kbs 比特率的 mp3 表示为 mp3_22050_32。192kbps 比特率的 MP3 要求您订阅 Creator 或更高级别的套餐。44.1kHz 采样率的 PCM 要求您订阅 Pro 或更高级别的套餐。请注意,μ-law 格式(有时写作 mu-law,通常近似为 u-law)常用于 Twilio 音频输入。
枚举值:
mp3_22050_32mp3_44100_32mp3_44100_64mp3_44100_96mp3_44100_128mp3_44100_192pcm_8000pcm_16000pcm_22050pcm_24000pcm_44100pcm_48000ulaw_8000alaw_8000opus_48000_32opus_48000_64opus_48000_96opus_48000_128opus_48000_192
默认值:
mp3_44100_128
Body 参数application/json
HTTP请求体
text
string 
必需
将被转换成语音的文本。
model_id
enum<string> 
可选
将要使用的模型的标识符,您可以使用 GET /v1/models 查询它们。该模型需要支持文本转语音,您可以使用 can_do_text_to_speech 属性检查这一点。
枚举值:
eleven_turbo_v2_5eleven_multilingual_v2
language_code
string  | null 
可选
用于强制模型使用特定语言的语言代码(ISO 639-1)。目前只有 Turbo v2.5 和 Flash v2.5 支持语言强制。对于其他模型,如果提供语言代码,将返回错误。
voice_settings
object  | null 
可选
声音设置,用于覆盖给定声音的存储设置。它们仅应用于当前请求。
stability
number <double> | null 
可选
决定声音的稳定性以及每次生成之间的随机性。较低的值会为声音引入更广泛的情感范围。较高的值可能导致声音单调,情感有限。
use_speaker_boost
boolean  | null 
可选
此设置可增强与原始说话者的相似度。使用此设置需要稍高的计算负载,从而增加延迟。
similarity_boost
number <double> | null 
可选
决定在尝试复制原始声音时,AI 应在多大程度上遵循原始声音。
style
number <double> | null 
可选
决定声音的风格夸张程度。此设置试图放大原始说话者的风格。它确实会消耗额外的计算资源,如果设置为非 0 值,可能会增加延迟。
speed
number <double> | null 
可选
调整声音的速度。值为 1.0 是默认速度,小于 1.0 的值会减慢语速,大于 1.0 的值会加快语速。
pronunciation_dictionary_locators
array [object {2}]  | null 
可选
要应用于文本的发音词典定位器(id, version_id)列表。它们将按顺序应用。每个请求最多可以有 3 个定位器。
pronunciation_dictionary_id
string 
发音词典的 ID。
必需
version_id
string  | null 
可选
发音词典版本的 ID。如果未提供,将使用最新版本。
seed
integer  | null 
可选
如果指定,我们的系统将尽力进行确定性采样,以便使用相同种子和参数的重复请求应返回相同的结果。不保证确定性。必须是 0 到 4294967295 之间的整数。
previous_text
string  | null 
可选
当前请求文本之前的文本。可用于在连接多个生成时改善语音的连续性,或影响当前生成中语音的连续性。
next_text
string  | null 
可选
当前请求文本之后的文本。可用于在连接多个生成时改善语音的连续性,或影响当前生成中语音的连续性。
previous_request_ids
array[string] | null 
可选
在此生成之前生成的样本的 request_id 列表。在将大型任务拆分为多个请求时,可用于改善语音的连续性。当跨代使用相同模型时,结果将是最好的。如果同时发送了 previous_text 和 previous_request_ids,则将忽略 previous_text。最多可以发送 3 个 request_id。
next_request_ids
array[string] | null 
可选
在此生成之后生成的样本的 request_id 列表。next_request_ids 在重新生成存在某些音频质量问题的样本时,对于保持语音的连续性特别有用。例如,如果您生成了 3 个语音剪辑,并且想要改进剪辑 2,将剪辑 3 的请求 ID 作为 next_request_id(并将剪辑 1 的请求 ID 作为 previous_request_id)传递将有助于在合并的语音中保持自然的流畅性。当跨代使用相同模型时,结果将是最好的。如果同时发送了 next_text 和 next_request_ids,则将忽略 next_text。最多可以发送 3 个 request_id。
apply_text_normalization
enum<string> 
可选
此参数通过三种模式控制文本规范化:‘auto’、‘on’ 和 ‘off’。当设置为 ‘auto’ 时,系统将自动决定是否应用文本规范化(例如,拼出数字)。设置为 ‘on’ 时,将始终应用文本规范化,而设置为 ‘off’ 时,将跳过。对于 ‘eleven_turbo_v2_5’ 或 ‘eleven_flash_v2_5’ 模型,无法开启此功能。
枚举值:
autoonoff
默认值:
auto
apply_language_text_normalization
boolean 
可选
此参数控制语言文本规范化。这有助于在某些支持的语言中正确发音。警告:此参数会显著增加请求的延迟。目前仅支持日语。
默认值:
false
use_pvc_as_ivc
boolean 
已废弃
已弃用。如果为 true,我们将不使用 PVC 版本的语音进行生成,而是使用 IVC 版本。这是为了解决 PVC 版本中较高延迟的临时解决方法。
默认值:
false
response_format
enum<string> 
可选
枚举值:
url
示例
{
  "text": "The first move is what sets everything in motion.",
  "model_id": "eleven_turbo_v2_5"
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.chatfire.cn/elevenlabs/v1/text-to-speech/JBFqnCBsd6RMkjVDRZzb?output_format=mp3_44100_128' \
--header 'Content-Type: application/json' \
--data-raw '{
  "text": "The first move is what sets everything in motion.",
  "model_id": "eleven_turbo_v2_5"
}'

返回响应

🟢200成功
application/octet-stream
Body
object {0}
示例
文件流
修改于 2025-07-15 10:00:36
上一页
Elevenlabs 语音
下一页
text-to-speech-with-timestamps
Built with