文字可生成音乐!Meta发布的AI工具AudioCraft有何不同之处?
财联社8月3日讯(编辑 牛占林)美东时间周三,Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。
(资料图片仅供参考)
(来源:Meta官网)
Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
Meta在官网介绍称,MusicGen接受过Meta拥有的和特别授权的音乐训练,可以从文本提示生成音乐,而AudioGen接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。
在6月初,Meta推出了名为MusicGen的开源人工智能模型,这是一种深度学习语言模型,可以根据文本提示生成音乐。
Meta的EnCodec是一个基于深度学习的音频编解码器,由人工智能驱动,可以在音频质量没有损失的前提下,将音频压缩到比MP3格式还要小10倍的程度。
AudioGen则是一个来自Meta和耶路撒冷希伯来大学的研究团队的人工智能模型,可以通过输入文本来生成音频,亦可以扩展现有音频。AudioGen可以区分不同的声音对象,并在声学上将它们分开。
Meta还演示了MusicGen和AudioGen工作的流程图,并表示将让这些模型开源,让研究人员和从业人员可以用自己的数据集训练适合自己的模型,并帮助推进人工智能生成音频和音乐领域的发展。
与其他音乐模型相比,AudioCraft系列模型能够生成长期一致的高质量音乐和音频,还简化了音频生成模型的整体设计,使得该工具简单易用。
Meta相信它的模型可以引领新一波歌曲潮流,就像合成器改变音乐一样。“我们认为MusicGen可以变成一种新型的乐器,就像最初出现的合成器一样。”
当然,Meta也承认创作复杂而又优秀的音乐还是比较困难的,因此它选择将AudioCraft开源,以使用于训练它的数据多样化。
今年早些时候,谷歌也发布了名为MusicLM的音乐生成模型,并于5月向上月向所有用户开放。除此之外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。
关键词:
您可能也感兴趣:
为您推荐
暑期21天运动之旅 小区里一道特别的风景
城发环境股东户数增加2.85%,户均持股33.36万元
比亚迪7月销量解读:宋家族、汉家族、海鸥大涨
排行
最近更新
- 文字可生成音乐!Meta发布的AI工具AudioCraft有何不同之处?
- 强制关注公众号?广西消委会:消费者有权拒绝和举报
- 房产早9点速评 | 央行再提降低存量房贷利率;前7月房企拿地...
- 股票大作手:调整过后有机会!
- 是什么让恐龙长得如此巨大?
- 16GB成主流,手机内存12GB也要被淘汰了
- 《博德之门3》迷踪步护符获得方法
- 利率可到4% 大额存单抢疯了 有银行要求“配货”才能买 这...
- 上证国际 | 美国大规模发债潮涌 信用评级时隔12年再遭调降
- 多家企业闻“汛”而动 紧急驰援救灾一线
- 华天科技最新消息(华天韵)
- Sonos Move 2 音箱曝光:续航 24 小时、IP65 防水、售价 499 美元
- 相约大运 成就梦想丨接力“冰墩墩” “蓉宝”成为成都夏日宠儿
- 赛微电子(300456.HK):公司北京MEMS工厂的生产经营未受近期暴雨影响
- 银河证券:风电行业迎来装机复苏 建议把握两条主线
- “卡努”移速是0!何时拐弯?还会来个“回马枪”吗?
- 中信证券:中长期看好具备广阔前景的地产服务企业
- 国家网信办征求意见:拟升级“青少年模式”为“未成年人模式”
- 银河证券:风电行业迎来装机复苏 持续看好海风
- 努比亚Z50S Pro正式发布
- 最高200元!多地出手:这样过马路,罚!
- 我国6台核电机组获得国家核准
- 中南大学教育关爱暑期社会实践正式授牌开营
- 西安力量驰援涿州 救助被困群众900余人!
- 远赴日本开国际记者会,江宏杰砸300万元新台币杠上福原爱
- 韩媒:中国出口管制镓锗动摇韩国半导体根基
- 相约大运 成就梦想丨接力“冰墩墩” “蓉宝”成为成都夏日宠儿
- 永定河洪水到达本市 三项措施确保泛区行洪安全
- 静海区:暂别家园 也很温暖
- 十项行动 见行见效 | 天津口岸上半年平行进口汽车占全国七成以上