model_type = "udio130-v1.5" 时,歌曲时长固定位 130 秒;为 "udio32-v1.5" 时,歌曲时长固定位 32 秒。
lyrics_type = user,表示使用用户提供的歌词生成音乐,此时 prompt 的作用类似于 tags,填写风格。
lyrics_type = instrumental,用于创建纯音乐,prompt 用于相关提示词。
lyrics_type = generate 时,表示自动生成歌词,prompt 用于描述需要生成什么样的歌曲。
config.mode = regular,表示生成音乐。
song_section
用于指定在完整歌曲中生成片段的起始和结束位置。0% (0) 对应歌曲开头,50% (0.5) 对应歌曲中间,100% (1) 对应歌曲结尾。点击数值指示器可切换为自动模式,让模型自行决定最佳位置。这个功能在使用歌曲扩展特性时特别有用。
lyrics_placement
用于指定在完整歌曲中放置歌词的位置。8% 对应歌曲开头,50% 对应歌曲中间,90% 将在歌曲结尾处生成片段。这个功能在使用歌曲扩展特性时特别有用。
prompt_strength
控制提示词对生成内容的影响程度。较高的值可以提高对提示词的遵循度,但可能会导致生成的声音不够自然。
lyrics_strength
控制歌词对生成内容的影响程度。较低的值可能会产生更自然的声音,但可能会忽略部分歌词内容。
clarity_strength
控制模型在生成音频时对清晰度和乐器分离度的优先级。较高的值可能会产生更清晰的音频,但声音可能不够自然。
generation_quality
实验性功能。用于在生成质量和生成速度之间进行权衡。