多种高难度乐器信手拈来！就能完美复现音乐 MIT联合沃森实验室团队推出最新AI 只看手势动作 (多种高难度乐谱图片)

文章编号：46624 资讯动态 2024-12-10 AI生成音乐

会玩乐器的人在生活中简直自带光环！

不过，学会一门乐器也真的很难，多少人陷入过从入门到放弃的死循环。

但是，不会玩乐器，就真的不能演奏出好听的音乐了吗？

最近，麻省理工（MIT）联合沃森人工智能实验室（MIT-IBM Watson AI Lab）共同开发出了一款AI模型 Foley Music ，它可以根据演奏手势完美还原乐曲原声！

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

而且还是不分乐器的那种，小提琴、钢琴、尤克里里、吉他，统统都可以。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

只要拿起乐器，就是一场专业演奏会！如果喜欢不同音调，还可以对音乐风格进行编辑，A调、F调、G调均可。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

这项名为《Foley Music：Learning to GenerateMusic from VIDeos》的技术论文已被ECCV2020收录。

接下来，我们看看AI模型是如何还原音乐的？

会玩多种乐器的Foley Music

如同为一段舞蹈配乐需要了解肢体动作、舞蹈风格一样，为乐器演奏者配乐，同样需要知道其手势、动作以及所用乐器。

如果给定一段演奏视频，AI会自动锁定目标对象的身体关键点（Body Keypoints），以及演奏的乐器和声音。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

身体关键点：由AI系统中的 视觉感知模块 （Visual Perception Model）来完成。它会通过身体姿势和手势的两项指标来反馈。一般身体会提取25个关2D点，手指提起21个2D点。

乐器声音提取：采用 音频表征模块 （Audio Representation Model），该模块研究人员提出了一种乐器数字化接口（Musical Instrument Digital Interface，简称MIDI）的音频表征形式。它是Foley Music区别于其他模型的关键。

研究人员介绍，对于一个6秒中的演奏视频，通常会生成大约500个MIDI事件，这些MIDI事件可以轻松导入到标准音乐合成器以生成音乐波形。

在完成信息提取和处理后，接下来， 视-听模块 （Visual-Audio Model）将整合所有信息并转化，生成最终相匹配的音乐。

我们先来看一下它完整架构图：主要由视觉编码，MIDI解码和MIDI波形图输出三个部分构成。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

视觉编码： 将视觉信息进行编码化处理，并传递给转换器MIDI解码器。从视频帧中提取关键坐标点，使用GCN（Graph-CNN）捕获人体动态随时间变化产生的潜在表示。

MIDI解码器： 通过Graph-Transfomers完成人体姿态特征和MIDI事件之间的相关性进行建模。Transfomers是基于编解码器的自回归生成模型，主要用于机器翻译。在这里，它可以根据人体特征准确的预测MIDI事件的序列。

MIDI输出： 使用标准音频合成器将MIDI事件转换为最终的波形。

实验结果

研究人员证实Foley Music远优于现有其他模型。在对比试验中，他们采用了三种数据集对Foley Music进行了训练，并选择了9中乐器，与其它GAN-based、SAmpleRNN和WaveNet三种模型进行了对比评估。

其中，数据集分别为AtinPiano、MUSIC及URMP，涵盖了超过11个类别的大约1000个高质量的音乐演奏视频。乐器则为风琴，贝斯，巴松管，大提琴，吉他，钢琴，大号，夏威夷四弦琴和小提琴，其视频长度均为6秒。以下为定量评估结果：

可见，Foley Music模型在贝斯（Bass）乐器演奏的预测性能最高达到了72%，而其他模型最高仅为8%。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

另外，从以下四个指标来看，结果更为突出：

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！黄色为Foley Music模型，它在各项指标上的性能表现远远超过了其他模型，在正确性、噪音和同步性三项指标上最高均超过了0.6，其他最高不足0.4，且9种乐器均是如此。

另外，研究人员还发现，与其他基准系统相比，MIDI事件有助于改善声音质量，语义对齐和时间同步。

说明

另外，该模型的优势还在于它的可扩展性。MIDI表示是完全可解释和透明的，因此可以对预测的MIDI序列进行编辑，以生成A\G\F调不同风格音乐。如果使用波形或者频谱图作为音频表示形式的模型，这个功能是不可实现的。

只看手势动作，就能完美复现音乐，MIT联合沃森实验室团队推出最新AI，多种高难度乐器信手拈来！

最后研究人员在论文中表明，此项研究通过人体关键点和MIDI表示很好地建立视觉和音乐信号之间的相关性，实现了音乐风格的可拓展性。为当前研究视频和音乐联系拓展出了一种更好的研究路径。

以下为Youtobe视频，一起来感受下AI音乐!

引用链接：

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/4f0720f5312059e52bd2.html

上一篇：只是为了蹭热点吗阿里突然公布一波芯片大动

下一篇：滴滴AI单通道语音分离面临哪些挑战Labs宋辉

长鸿精密

深圳市长鸿塑胶模具有限公司,12年专注于电木模具厂家,电木模具加工,电木生产厂家,深圳PF注塑厂家,胶木加工厂,提供产品设计,模具制作,生产注塑,喷油印丝,产品组装一站式服务,全国咨询热线:0755-23217349

设计美化 2024-11-13 10:57:20

太平洋汽车网pcauto.com.cn

太平洋汽车网下设汽车报价,汽车评测以及新闻、导购、维修、保养、安全、汽车论坛、自驾游、汽车休闲、汽车文化等方面的内容,是中国汽车排名前列的综合汽车网站,提供全面的车型数据、参数、配置、报价、相关新闻和图片等

图片摄影 2024-08-16 13:23:45

东港远东节水灌溉设备有限公司

辽宁省东港市远东节水灌溉设备有限公司是生产PE、PVC、PPR等塑料管材、管件，集喷灌、微喷、滴灌、渗灌、过滤施肥系统等节水设备。是研制开发，生产销售为一体的专业公司

编程开发 2024-07-11 13:31:32

铝合金阳光雨棚

重庆博晟装饰工程有限公司专注于铝艺护栏、围栏、车棚、阳光雨棚、凉亭、葡萄架、庭院门、阳光房等各种铝艺产品设计、生产、定做、安装、售后等业务。从事铝艺行业多年，款式多样，质量可靠，大气美观，可为客户提供量身设计定制的服务，欢迎来电咨询！

设计美化 2024-08-17 22:50:28

雨伞厂,广州市荃雨美雨伞有限公司,广州雨伞厂,雨伞厂家,广东雨伞厂,广州太阳伞厂,太阳伞厂,帐篷厂,恩平雨伞厂,肇庆雨伞厂,鹤山雨伞厂,佛山雨伞厂,深圳雨伞厂,荃雨美雨伞厂,东莞雨伞厂,高尔夫雨伞,广州制伞厂,清远雨伞厂,中山雨伞厂,珠海雨伞厂,江门雨伞厂,韶关雨伞厂,伞厂,三水雨伞厂,阳江雨伞厂,阳春雨伞厂,雨伞工厂,雨伞生产工厂,广告雨伞厂,广告伞

广州市荃雨美雨伞有限公司,是广东地区一家集设计、生产、广告策划于一体的综合性企业。公司主要生产制造各类时尚的雨伞、广告伞，太阳伞，帐篷，广告太阳伞、沙滩伞等。公司有专业设计团队免费设计快速出版、欢迎来人来样定制各种广告雨伞、多年制伞经验受到客户一致好评，我们以客户理念为根本、以质量求生存的原则让本厂员工把好每一道质量关，荃雨美雨伞厂是一家实体雨伞厂、欢迎来人来电咨询定制。

设计美化 2024-07-14 19:41:45

杭州科莱迪环保技术有限公司

杭州科莱迪环保技术有限公司位于风景秀丽的浙江省杭州市，创建于2003年，致力于环境保护工程，科技攻关，新工艺研法应用；新产品开发与生产为主导，博采国内外先进的给排水处理工艺和设备的长处。对生活污水、工业废水处理与资源回用等净化消毒技术，进行了长期的开发与应用，研制生产出了新一代，先进典型实用的消毒新产品“CL缓释消毒器”，并已申报了国家专利，同时赢得了广大用户的青睐。对此，本厂遵循专业、诚信、创新的精神，奉行质量第一，用户至上的宗旨，为推动中国环保事业作出自己的贡献。

网络应用 2024-11-16 18:33:45

水木天工家居官网

电影视频 2024-11-28 22:25:54

必要商城

必要商城是国内首家C2M(CustomerTOManufactory)模式电子商务平台，消费者直连制造商购物，享受大牌品质，工厂价格。2024年加入一线品牌商品，大牌特卖，买贵退差，为您提供高性价比的商品和服务。

商业服务 2024-12-05 16:29:49

乐用微信应用开发平台是微信第三方合作伙伴,拥有小程序生成工具,在这里您能找到您想要的各种模块功能并快速生成您想要的小程序.无需编码,无需程序员,300秒就可以完成快速制作。

网络应用 2024-12-09 18:23:38

【龙岩吊车

龙岩鼎邦起重吊装有限公司主提供：龙岩起重,龙岩吊车,龙岩拖车,龙岩背车,龙岩交通施救,龙岩设备就位,龙岩装卸,龙岩工程机械出租,龙岩设备安装,龙岩物流,龙岩货车

物流快递 2025-01-31 21:32:05

伊马莱富(上海)制药机械有限公司

伊马莱富(上海)制药机械有限公司是一家年轻而富有活力的公司，坐落于上海青浦工业园区。专业从事液体、粉末药品的无菌灌装联动线的研发、生产、销售和服务;包括洗瓶机、灭菌烘箱、液体和粉体灌装机、轧盖机。伊马莱富(上海)制药机械有限公司致力于服务国内外市场并取得了显著的成就，在2012年底成为了意大利伊马（IMA）集团成员。

商业服务 2025-02-07 03:00:31

钢结构不锈钢岗亭

上海岗亭厂家产品：保安岗亭、门卫岗亭、钢结构不锈钢岗亭等小区保安值班成品岗亭，更有豪华型真石漆岗亭。翼亭岗亭行业的智慧工厂。可来图来样设计岗亭，定制移动厕所、垃圾房等产品。翼亭岗亭厂家直销价格优惠，品质保证！覆盖浙江|上海|江苏|北京|天津|河北|山东|山西|江西|湖南|湖北|宁夏|安徽|内蒙古等全国地区

设计美化 2025-02-24 16:07:16

熊大爷现包饺子有名气吗前景如何 (熊大爷现包饺子加盟)

饺子是人们生活中经常吃的产品，不仅味道很好，而且有丰富的营养价值，随着人们对美食的需求量增加，所以市场上出现更多的餐饮品牌店，其中就有熊大爷现包饺子，熊大爷现包饺子是一家特色的品牌店，主打经营水饺产品，产品质量很好，而且味道十分的不错，受到广大消费者的青睐，那么，熊大爷现包饺子有名气吗，前景如何，熊大爷现包饺子有名气吗熊大爷现包饺子发...。

2024-12-21 15:35:35

英特尔地位会受到影响吗高通正室微软出轨 (英特尔地位会提高吗)

没有永远的朋友，也没有永远的敌人，只有永远的利益，2017年11月6日，半导体行业势如水火的一组老对手Intel和AMD宣布了它们的重新结盟；结果在一个月后，Intel的旧爱——微软——就与高通进入了蜜月期，在12月5日的高通技术峰会上，数款基于骁龙835处理器的Windows10笔记本正式亮相，也许更让Intel扎心的是，微软执行副...。

2024-12-09 19:42:53

投影仪流明度多少合适 (投影仪流明度多少白天可以用)

dkngo大神级投影控发表于2023，10，21投影仪的流明度，亮度，越高，投影出来的图像就越亮，但是流明度不是越高越好，因为流明度过高也可能造成过度照明，导致投影图像的亮度过高，影响观看效果，甚至可能损坏视力，一般来说，投影仪的流明度需要根据投影环境以及投影尺寸来确定，以下是一些常见的投影环境与推荐流明度，1.室内环境，黑暗or昏暗...。

2024-11-28 14:18:50

东芝75Z840F电视通过U盘安装软件教程 (东芝75z870mf)

怎么看第三方软件看直播，有需要的朋友可以参考下，最新方法怎么看电视台，只需要在电视上装一个当贝市场就可以轻松解决，1、下载当贝市场，http，www.dangbei.com，安装包并拷贝到U盘，2、打开东芝电视，按下遥控器的设置键，打开设置界面，点击，更多设置，3、在设置界面找到，通用，选择，商场模式，，把商场模式改为，开启，状...。

2024-11-25 12:40:52

中国春节的那些习俗 (中国春节那里海鲜最便宜又好吃)

正月是农历新年的开始，人们往往将它看作是新的一年年运好坏的兆示期，所以，过年的时候，禁忌，特别多，当然，各个地方的风俗习惯不一样，过年的禁忌也是不一样的，...。

2024-11-17 21:28:20

美国官员连支损招北约打中资基建名目主意挑唆欧洲对华施压！美媒放风 (美国官员连支多少人)

[全球时报驻美国特约记者张思思全球时报特约记者任重全球时报记者陈子帅]继北约宣布宣言争光中国后，美国有线电视资讯网，CNN，11日放风称，北约官员正在探讨，假设欧洲大陆东部与俄罗斯迸发更大范围的抵触，北约将采取执行收回欧洲一些由中国持有的基础设备名目，接受，全球时报，记者采访的专家以为，这是美媒借助北约峰会的机遇向欧洲施加言论压力，迫...。

2024-07-13 13:02:09

梦见自己拉粑粑什么意思 (梦见自己拉粑粑是什么意思)

依照中国传统周公解梦的观念，梦见大便意味财产，现代心思学解释梦见自己拉粑粑梦见自己拉粑粑，从心思学过去讲，拉粑粑有，辞旧迎新，之含意，潜看法中您想放弃自己不好的观念或许想改正自己不好的习气，想开局崭新的踊跃的生存，这样的态度是值得必需的，独身者梦见自己拉粑粑，预示着你近期在爱情上走烂桃花运，倡导你要多加小心，防止自己的激情被同性应用，...。

2024-07-09 22:48:18

逍客为什么提价这么多 (逍客为什么提速慢)

逍客提价的要素重要有两点，首先，市场上的同类车型竞争十分剧烈，生产者在选用车型时有很大的空间，多少钱适合的车型往往是生产者首要思考的要素，其次，逍客作为一款老款车型，无法防止地遭到了期间的影响，车型降级换代的需求越来越大，但未来的新款车型还未知，因此生产者也会担忧购置后车型过于过期，为了激起生产者的购车愿望并优化销量，厂商选用了降落多...。

2024-07-07 19:48:05

比速t3智能挡多少钱? (比速t3功能介绍)

比速t3智能挡的售价为5.59万至6.49万，作为一款针对年轻人个体所设计的紧凑型SUV，比速T3驳回前置前驱驱动方式，形状时兴动感，该车型搭载1.3T节能环保能源，标配多位一体ESC车身稳固系统、倒车雷达、倒车影像、皮质座椅、中控大屏等性能，为生产者提供温馨驾乘感触的同时，优化了行车安保级别，比速t3定速巡航怎样激活?比速t3定速巡...。

2024-07-07 07:40:18

数十名以色列初级将领呐喊内塔尼亚胡与哈马斯达成开战协定外媒一致最新迹象 (数十名以色列民族)

[全球网报道记者李梓瑜]，今天俄罗斯，RT，、，以色列时报，7月2日征引美国，纽约时报，信息称，数十名以色列初级将领示意，他们宿愿以总理内塔尼亚胡与巴勒斯坦伊斯兰抵制静止，哈马斯，达成开战协定，以便为或者与黎巴嫩真主党迸发抗争做好预备，对此，内塔尼亚胡回应称，这不会出现，，将继续成功，覆灭哈马斯，抗争指标，RT称，新一轮巴以抵触将进...。

2024-07-04 13:49:16

淘宝卖纸尿裤怎么处理

在淘宝平台上销售纸尿裤是一项需要细心处理的工作。首先，我们需要选择合适的供应商，确保纸尿裤的质量，因为这是关乎宝宝健康的重要商品。我们可以选择知名品牌，或者通过市场调研找到性价比高的供应商。同时，我们

2024-02-02 08:10:11

Thunderbolt驱动下载-IntelThunderbolt驱动v1.41.1134.0官方最新版

IntelThunderbolt驱动是英特尔专为雷电控制器打造的一款非常给力的驱动程序，据悉雷电控制器融合了PCIExpress数据传输技术和DisplayPort显示技术

2023-11-07 10:55:52

文章推荐

苹果做笔记的app哪个好用2022 好用的做笔记的软件推荐 (苹果做笔记的软件)

现在手机作为人们身上不可或缺的东西，它可以干好多的事情，今天小编为大家带来苹果做笔记的app哪个好用2022，有了小编为大家推荐的几款软件，相信大家以后身上都不需要带纸和笔了，随时随地的记笔记，方便快捷，1、，有道云笔记，有道云笔记是一款多平台记录工具，你可以通过文档，语音，文字等方式进行记录，非常方便，就算是网上笔记，也可以对网页进...。

2025-02-10 00:34:54

资讯动态

康复之家用品加盟有多少扶持 (康复之家用品有哪些)

从生活水平提升之后，科技技术也在不断的升级，所以市场上不断的生产出更多有质量的医用设备，可以给顾客带去不错的护理体验，康复之家用品是大家熟悉的品牌，发展多年的时间，一直坚持为顾客带去有质量的产品，给顾客带去不错的护理体验，因此在市场上稳定的发展，选择加盟品牌十分的不错，那么，康复之家用品加盟有多少扶持，康复之家用品创立于1998年，是...。

2025-01-31 18:24:39

创业加盟

孔赞大抄手加盟多少钱 (孔赞大抄手创始人)

抄手也被称之为馄饨，和水饺很相似，因为健康美味，在当下很受欢迎，在餐饮行业，有很多人气抄手小吃店品牌，比如说孔赞大抄手，小吃店以抄手为招牌，因为物美价廉，赢得了很多消费者的喜爱，人气高，生意火，有些创业者感兴趣，想要加盟开店，分一杯羹，那么，孔赞大抄手加盟多少钱，孔赞大抄手小吃店从创立到现在，收获了无数好评，在全国各地，拥有很多粉丝，...。

2024-12-21 19:07:17

创业加盟

啊哔哩哔哩公布2023年度弹幕 (哔哩哔哩公会中心)

12月15日，哔哩哔哩，以下简称，B站，与中国文物交流中心、中国文字博物馆联合发布2023年度弹幕，啊，2023年度弹幕，啊，，是指当所见所闻刷新自身认知，当代年轻人往往会用，啊，来抒发惊叹，比如看到UP主展示绝活时、发现宝藏内容时、见证重大科技突破时，今年，B站用户一共发送，啊，超1320万次，UP主，墨欣，的，一笔写...。

2024-12-04 01:09:42

资讯动态

两会特写 (两会特写丨见证日新月异的河南)

3月6日，中共中央政治局常委、国务院总理李克强参加全国政协经济界联组会议，亲切看望出席全国政协十三届五次会议的经济界委员并参加讨论，询问相关问题，讨论关键措施，共商促进经济发展行稳致远大计，3月6日，中共中央政治局常委、国务院总理李克强看望出席全国政协十三届五次会议的经济界委员并参加讨论，新华社记者殷博古摄央视，新闻联播，就李克强总理...。

2024-12-03 23:59:04

资讯动态

多种高难度乐器信手拈来！ 就能完美复现音乐 MIT联合沃森实验室团队推出最新AI 只看手势动作 (多种高难度乐谱图片)

会玩多种乐器的Foley Music

实验结果

相关文章

文章推荐

多种高难度乐器信手拈来！就能完美复现音乐 MIT联合沃森实验室团队推出最新AI 只看手势动作 (多种高难度乐谱图片)