阿里34篇论文入选国际顶会CVPR EMO等模型亮相 Animate 2024 Anyone (阿里 完整文章)

文章编号:40629 资讯动态 2024-12-03 阿里2024大模型CVPR

近日,国际计算机视觉顶会CVPR 2024在西雅图召开,阿里共34篇论文被收录,其中有6篇入选Highlight和Oral Paper,被收录论文研究方向涵盖多模态模型、图像编辑及可控视频生成等前沿领域。早些时候火遍国内外的Animate Anyone、EMO、Facechain等模型也在会议现场亮相,并吸引了大量参会人员的关注与体验。

阿里34篇论文入选国际顶会 2024,Animate Anyone、EMO等模型亮相

CVPR是计算机视觉领域最顶级的学术会议,每年都有大量企业、研究机构和高校参会,过去十几年曾诞生了ResNet、ImageNet等极具影响力的研究成果。据统计,今年CVPR共提交了 11532 份论文,最终2719 篇被接收,接受率只有23.6%,为近4年最低,而Highlight和Oral的占比仅为11.9%和3.3%。

在阿里通义实验室的Highlight论文《SCEdit: Efficient and Controllable Image Diffusion Generation via Skip Connection Editing 》中,研究团队提出了一种全新的图像扩散生成框架 SCEdit,它引入了全新的SC-Tuner的轻量级微调模块,通过对原始模型进行细微的调整,大幅度降低了训练参数量、内存消耗和计算开销。实验结果显示,SCEdit可快速迁移到特定的生成场景中,相比LoRA节省30%-50%的训练显存开销,可应用于边缘图、深度图、分割图、姿态、颜色图、图像补全等条件生成任务。目前相关代码及微调模型均已开源。

阿里34篇论文入选国际顶会 2024,Animate Anyone、EMO等模型亮相

会议现场,阿里首次在海外展示了基于Animate Anyone和EMO打造的大模型应用,吸引了来自全球各地参会者体验。过去半年,这两个项目在Github上累计获得超20k的Star,是视频生成领域的标杆项目。

据介绍,目前通义大模型家族已拥有文本生成、图像生成、视频生成、图像理解等全模态能力。不久前开源的Qwen2-72B是全球性能最强的开源模型,性能超过美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。

版权文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
河北省重点新闻网站

邯郸新闻网,邯郸新闻传媒中心,新闻热线:8181890;邯郸日报:3111018;日报广告(挂失):3111071;晚报广告:3111076(晚报)。地址:邯郸市娲皇路189号。邯郸新闻门户,百姓生活助手。

百思通古诗词网

古诗词是一种有特殊格式及韵律的文体,它以古体诗、近体诗为代表。按音律分,可分为古体诗和近体诗两类。按内容可分为叙事诗、抒情诗、送别诗、边塞诗、山水田园诗、怀古诗(咏史诗)、悼亡诗,咏物诗,军旅诗等。

手机游戏下载

56游戏网致力为网友收集当下热门的游戏、软件下载,为网友们提供最新手游攻略、软件教程、游戏排行榜,每天分享最新的游戏、软件资源免费提供参考下载。欢迎关注56游戏网!

超值分享汇

Websitecreatedusingcreate-react-app

上海保安公司

上海中龙护嘉保镖集团是经过正规注册的专业的上海保镖公司,上海保安公司,临港保安公司,为北京,上海,广州,深圳,杭州,苏州,南京,重庆,四川等城市提供专业的私人保镖,贴身保镖,保安服务等。

我最牛网

8cc7.com为您提供:,短网址程序,短网址服务,短网址转换,短网址API接口,批量生成短链接,短网址生成,压缩所有网址包括图片、flash、mp3、rar等所有互联网地址,专业的网址缩短网站!。

清图

清图是一款在线图片处理工具,可以将模糊图片秒变清晰,支持动漫图片、证件照、黑白图片上色功能。

青草网络科技有限公司

平面设计作品展示网站网络工作室网站

酷米网

酷米网是一家提供域名交易,网站交易,商标交易,抢注域名,域名查询,域名抢注,域名网站,域名注册,网站购买,网站建设,网站设计,网站制作,商标注册,商标购买等服务的中介平台

【七八美文】优美句子摘抄

美文句子摘抄网提供短文摘抄,好词摘抄,好句摘抄,好段摘抄,名人名言摘抄等内容。

百富源资本

深圳市前海百富源股权投资管理有限公司为百富源集团旗下的投资管理公司之一,注册资本为1000万元。主营业务为:股权投资管理、投资管理顾问及咨询相关服务。

全局底部横幅