您现在的位置:sf999 > 游戏资料 >

sf999单职业 昆仑万维:中国首个音乐 SOTA 模型天工 SkyMusic 音乐大模型开启公测

时间:2024-04-18 点击:100

核心提示:感谢IT之家网友西窗旧事的线索投递!IT之家4月17日消息,昆仑万维今日宣布,天工3.0大模型性能提升显著,旗下的天工SkyMusic音乐大模型也在今日面向全社会开放公测。天工3.0拥有4000亿...

感谢IT之家网友 西窗旧事 的线索投递!

IT之家 4 月 17 日消息,昆仑万维今日宣布,天工 3.0 大模型性能提升显著,旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。

天工 3.0 拥有 4000 亿参数,超越了 3140 亿参数的 Grok-1,是全球最大的开源 MoE 大模型。天工 3.0 在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域性能提升显著,数学 / 推理 / 代码 / 文创能力提升超过 30%。天工 3.0 新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项 AI 能力。

▲?天工 3.0 模型参数超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音乐大模型也在今日面向全社会开放公测。昆仑万维表示天工 SkyMusic 在人声 & BGM 音质、人声自然度、发音可懂度等领域“显著”领先对手,综合性能超越 Suno V3,取得音乐大模型 SOTA(State of the art model,即在当前研究中表现最好的模型)。

天工?SkyMusic?采用音乐音频领域类?Sora?模型架构,Large-scale Transformer?负责谱曲,来学习?Music Patches?的上下文依赖关系,同时完成音乐可控性,Diffusion Transformer?负责演唱,通过?LDM?让?Music Patches?被还原成高质量音频,使其能够支持生成?80?秒?44100Hz?采样率双声道立体声歌曲。

▲?天工 SkyMusic AI 音乐大模型技术架构

据介绍,天工?SkyMusic?具备以下特点:

高质量?AI?音乐:生成?80?秒?44100Hz?采样率双声道立体声?AI?歌曲

人声“以假乱真”:中文水平极为优秀,发音清晰无异响

歌词段落控制:生成的歌曲可以明确分辨出不同歌词段落的情绪变化

多种音乐风格:支持说唱?/?民谣?/?放克?/?古风?/?电子等

音乐智能表达:能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧

参考音乐生成:用户上传自有参考音乐,生成风格、唱腔类似的歌曲

方言歌曲生成:支持粤语、成都话、北京话等众多方言

IT之家从公开资料获悉,昆仑万维是中国互联网平台出海企业,深耕海外市场十余载,业务覆盖包括信息分发、社交、?娱乐、元宇宙、游戏及?AIGC?等多个领域,旗下包括?AGI?与?AIGC?、海外信息分发与元宇宙、投资等三大业务板块,市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。截至目前,全球平均月活跃用户近?4?亿,海外收入占比达?84%。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

  • sf999.com 新开传奇网站 找sf999 传奇私服发布网
  • 搜服九九九(www.sf999.com)最全面的传奇私服发布网,为找私服的玩家提供最新最全的热血传奇私服开服资讯和新开传奇sf游戏攻略,sf999传奇新服网立志打造最权威的新开传奇网站专区!
  • sf999(www.kaiwuzhineng.com) © 2024 版权所有 All Rights Reserved. 苏ICP备20015483号-1