腾讯发布开源音乐大模型 SongGeneration

SongGeneration 是由腾讯 AI Lab 最新发布并开源的音乐生成大模型,定位为面向创作的“AI 共创”工具。

模型亮点

音质、音乐性与速度兼顾

  • 基于 LLM‑DiT 融合架构,兼顾高速生成和高音质。
  • 对比测试显示,在旋律、伴奏、结构等维度超越多数开源模型,与商业闭源系统表现相当或更优。

支持多种可控生成方式

  • 文本控制:关键词提示即可生成对应风格作品;
  • 风格跟随:使用参考音频生成风格统一的新曲;
  • 多轨合成:同时输出人声与伴奏音轨;
  • 音色跟随:音色可基于示例音频进行克隆。

中英双语支持

  • 支持中文、英文、嘻哈、古风、电子等多语种与风格,兼顾国际与本土化需求。

腾讯 AI Lab 的 SongGeneration 代表国产音乐生成模型的最新突破:三者兼顾(音质×音乐性×速度),功能丰富(文本、音频、风格、音色控制),中英文双语支持,在多个维度已经超出大多数开源模型表现,并具备挑战商业闭源系统的实力。目前更开放、更精准,值得音乐开发者、内容创作者与研究团队深入尝试和整合。


已发布

分类

来自

标签:

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注