倍 扩散模型是风口 4.5 2022 中国论文数量为美国的 AI 全景报告出炉 剑桥 (倍扩散模型是谁提出的)

近日,剑桥大学的2022年 AI 全景报告(《State of AI Report 》)出炉!

报告汇总和聚焦了过去一年里 AI 行业中炙手可热的事件,援引数据来自知名科技公司和研究小组,由投资者 Nathan Benaich 和 Ian Hogarth 编写,从研究、产业、政策、安全、预测五个维度出发,对最新的 AI 发展现状和未来预期进行深度分析。



扩散模型火热、模型开源提速

从研究领域来看,今年 AI 发展呈现五大趋势:

基于文本到图像的生成能力,扩散模型(Diffusion Models)席卷计算机视觉世界

扩散模型是深度生成模型中新的 SOTA,在一些基准测试中,其图像生成能力超越了 GAN,是当前文本生成图像最火热的模型,并逐渐扩大到文本生成、文本转音频、文本转视频以及分子设计等领域。

今年4月,OpenAI 发布 DALL-E 2,只需要给到寥寥几句文本指示就可以生成全新的图像,刚亮相就在图像生成和图像处理领域引发极大的关注度。不久,谷歌也紧接着推出的 Imagen,基于大型 Transformer 语言模型在理解文本方面的能力和扩散模型在高保真图像生成方面的能力,将文本生成图像的逼真度和语言理解提到了新高度。

而真正将生成式 AI 推向创作高潮的,是 Stability.Ai 在8月份公开发布的 Stable Diffusion 模型,只需输入几行文字描述,几秒钟后,AI 便能生成一幅幻彩斑斓的画作。

可以看到,目前 Stability.ai 和 Midjourney 等公司所创建的文本转图像模型,已经可以跟发展成熟的 AI 实验室的产品相媲美,其中,Midjourney 采用了订阅制的收费模式已经盈利,Stability 的模型则是开源的。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

此外,基于扩散的文本到视频生成的研究也从今年4月左右就展开了。

9月下旬,Meta 发布“Make-a-Video”,宣布了从文本到视频生成的 DELL-E 时刻早于预期,文本转视频的扩散模型首次在业界引起轰动。不到一周后,谷歌也发布了两个模型:基于扩散模型的 Imagen 和非扩散模型的 Phenaki,后者能够通过附加提示动态来调整视频生成。

AI for science,聚焦塑料回收、核聚变反应堆控制和天然产物发现等更多科学问题

在 AI for science 研究中,今年有不少突出的工作。

其中,DeepMind 与悉尼大学、牛津大学合作,将 AI 模型应用到数学领域的拓扑和表示论猜想,提出了一种新的算法,通过研究纽结的结构,发现数学在不同领域中的隐藏联系,该研究发表在《自然》杂志上。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

一年前,DeepMind 发布 AlphaFold2,以原子水平的准确度预测了三分之二的蛋白质结构,并与 EMBL-EBI 共同发布蛋白质结构数据库 AlphaFold DB。

到了今年7月28日,DeepMind 宣布 AlphaFold DB 已从 100 万个结构扩展到超过 2 亿个结构,扩大超过 200 倍,可用于植物、细菌、动物和其他生物的蛋白质预测结构,极大地提升了人们对于生物学的理解。

在塑料回收方面,来自 UT Austin 的研究人员设计了一种能够降解 PET 的酶(PET 是一种占全球固体废物12%的塑料),称为 PET 水解酶( FAST‑PETase),能够在一周内几乎完全降解51种不同产品,并且还可以从回收的单体中重新合成 PET FAST‑PETase。

标度法则重新聚焦数据:模型标度并不是全部都需要的,朝单一模型发展,其核心在于数据

对于通用多任务、多模式模型的尝试,可以追溯到谷歌此前提到的“一个模型来学习”。

此前有研究发现,LLMs 可实现让机器人通过自然语言对每个步骤的解释来完成各种任务,但由于对机器人所处环境和现实能力缺乏认知,LLMs 的解释时常会出现无法被理解的情况。随着 PaLM-SayCan 的出现,这一问题也已经得到解决。

DeepMind 推出的 Gato 将这项工作带到了另一个层次,通过一个1.2B参数转换器,可以实现在机器人、模拟环境、视觉和语言中执行数百项任务。

此外,Transformer 作为一种解码器架构,当前其影响力已经超出 NLP,在计算机视觉上也发挥着重要作用,正在成为真正的跨模态产品。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:与 Transformer 相关的论文占比

社区驱动的大型模型开源速度加快,集合模式可以参与同大型实验室的竞争

OpenAI、DeepMind 旗下有多个模型已被开源社区实现、克隆和改进,进度远超预期。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:社区驱动的 GPT 等开源

尽管 AI 研究将越来越集中于少数大型实验室,但随着计算成本和访问权限的降低,因此也出现了最先进的研究在更小、以前不为人知的实验室得到提出等情况,同时,这些新的独立研究实验室也在迅速开源。

受神经科学的启发,AI 研究方法向认知科学的方向发展
2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:中美 AI 论文数量对比

数据显示,自2010年以来,中国机构撰写的 AI 论文数量是美国的4.5倍,远远超过美国、印度、英国和德国的总和。

同时,中国的论文更关注与监控相关的任务,包括对象检测、跟踪、场景理解、动作和说话者识别等。




AI 初创公司投资放缓
新贵 AI 半导体初创公司与 英伟达 相比是否有作为?

报告显示, 英伟达的芯片在 AI 研究论文中最受欢迎, GPU 的使用率是 ASIC 的131倍,是 Graphcore 、 Habana 、 Cerebras 、 SambaNova 和 Cambricon 的芯片总和的90倍,是谷歌 TPU 的78倍,是 FPGA 的 23 倍。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:英伟达芯片在 AI 论文中的引用数量

招聘冻结和 AI 实验室解散,促使许多初创公司从 等巨头中诞生

DeepMind 和 OpenAI 的校友各自开花,组建了许多新的初创公司,分别研究不同领域的 AI 技术,如:AGI 、人工智能安全、生物技术、金融科技、能源、开发工具和机器人技术。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:由 DeepMind 和 OpenAI 分解出来的初创公司

最新 技术被大型科技公司和初创公司转化为商业开发人员工具

OpenAI 的 Codex 迅速从 2021 年 7 月的研究演变为 2022 年 6 月的开放商业化,微软的 GitHub Copilot 现在以每月 10 美元到每年 100 美元。亚马逊在 2022 年 6 月发布了 CodeWhisperer 预览版。谷歌透露,其内部正在使用以 ML 驱动的代码完成工具,也许几年内会出现在浏览器 IDE 中。同时,拥有 100 多万用户的 Tabnine 筹集了 1500 万美元,承诺有望实现准确的多行代码填写。

人工智能加快药物研发,促进医疗产业发展

人工智能药物发现公司在临床试验中拥有 18 项资产,高于 2020 年的 0 项。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:每家公司各个阶段的资产数量和资产百分比

另外,由于放射科医生的短缺和成影数量的增加,通过评估X光片针对疾病变得更有挑战性。因此立陶宛初创公司 Oxipit 创建了一个名叫 ChestLink 的计算机视觉系统,该系统可以自动报告没有异常的胸部 X 光片,就无需放射科医生来检查,这是业界首个基于计算机视觉的诊断自主认证。

大学是孕育人工智能公司的温床

目前,大学是人工智能公司重要的资源来源,包括> 随着市场的扩大,对AI初创公司的投资速度在放缓

与去年相比, 2022 年预计使用AI的公司融资额将减少36%,但仍有望超过 2020 年的水平,这与全球所有 Start-up 阶段和 Scale-up 阶段的公司投资相当。

VC 投资的下降在 1 亿以上的轮次中最明显,而投资规模较小的轮次预计到 2022 年底全球将达到 309 亿美元,与 2021 年的水平相当。

综合公共企业价值(EV)已经下降到 2020 年的水平。同时,私营企业的估值不断增长,综合企业价值已经达到 2.2 万亿美元,比去年增长 16% 。

图注:对 AI 初创公司的投资(按轮次)以及对所有初创公司的投资(按轮次)

目前美国的AI独角兽公司数量领先,其次是中国和英国。 美国已经创造了 292 家 AI 独角兽公司,企业价值合计 4.6 万亿美元,中国创造了 69 家 AI 独角兽公司,企业价值合计 1.4 万亿美元,英国创造了 24 家 AI 独角兽公司,企业价值合计 2070 亿美元。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:各个国家独角兽企业数量以及独角兽企业

尽管对于美国 AI 初创公司的投资大幅度下降,但它们仍然占全球人工智能总投资的一半以上。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:对 AI 公司的投资金额

企业软件是全球投资最多的类别,而机器人技术占据了 AI 风险投资的最大份额。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:各个领域投资金额

尽管 IPO 和 SPAC IPO 的数量急剧下降,但 AI 公司的收购数量可能会超出 2021 年的水平。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:全球 AI 公司的退出数量,以及 2022 年退出的 AI 企业




对未来一年的预测

在2021年的报告中,曾对2022年 AI 的发展情况做出了8项预测,其中已实现 Transformers 在游戏中超过人类表现,这主要得益于 DeepMind 的 Gato 模型可实现对未来状态和动作的预测,日内瓦大学提出的 IRIS 模型则解决了 Atari 环境下的任务。

未实现的预测中提到,graphcore、Cerebras、SambaNova、Groq、Mythic 中至少有一家被大型科技公司或者半导体公司收购,在今年也没有实现;ASML 的市值当前仅为1650亿美元,距预期中的5000亿美元还存在很大差距;JAX 框架的使用仍然占 Papers With Code 每月回购的不到1%,未达到预测中的5%。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:2021年预测中共4项实现

还有一些往年的预测在今年实现了,其中,美国 CHIPS 法案在今年禁止接收方在中国扩大业务,原预测中英伟达最终未能完成对 Arm 的收购、该交易也于今年正式取消。在 AI 初创公司方面,Helsing(德国)在今年筹集了1亿美元的A轮融资。

而对于一直备受关注的 AI 治理问题,2019年预测至少有一家主流 AI 公司会对治理及管理模式作出实质性的调整,Anthropic 也在今年成立、作为公益性公司活动。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:2020年及之前的预测在今年实现

报告中也提出了对未来12个月的9项预测,分别是:

你觉得哪些可能会实现呢?

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

版权文章,未经授权禁止转载。详情见 转载须知 。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

全局中部横幅
龙门吊

河南华东起重机械设备有限公司是专业单梁桥式双梁门式起重机生产厂家,A级资质龙门吊厂家直销供应,龙门吊型号规格齐全,龙门吊价格报价,门式起重机厂家购买,门式起重机公司非标设计定做定制业务!

保险网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

68Design

68Design是国内领先的设计师远程工作平台,拥有300万+设计师,为雇主提供网站设计、APP、小程序、LOGO设计、包装设计、电商详情页、插画、摄影等优质人才服务。雇主远程雇佣设计师,在线考勤办公,用人成本节省50%。

POS机品牌网

中国十大pos正规品牌,正规一清机pos,目前好的POS机品牌,我们只推荐可靠正规的pos机品牌,pos一机一户解决刷卡问题;银联报备的pos机品牌,POS机个人免费申请,费率低,可秒到账!

沈阳肤康皮肤病医院

沈阳皮肤病医院哪家好★沈阳肤康皮肤病医院★抚顺-本溪-辽阳-鞍山-盘锦-营口皮肤病专科,辽宁皮肤病专科医院!沈阳皮肤病医院哪家好全国连锁专业治疗牛皮癣,皮炎,痤疮,青春痘,腋臭等皮肤疾病,汇聚沈阳有名皮肤病专家团队,采用尖端的诊疗设备,中西药结合疗法,网络预约挂号免费!

南通万户电子商务有限公司

南通用友专业从事企业ERP管理系统的销售、研发及应用,为企业提供财务、进销存、生产制造等服务(Tel:188-6298-1058),是用友在南通设立的分支机构。

平罗县人民政府

平罗县位于宁夏平原北部,辖13个乡镇144个行政村,总面积2060平方公里,总人口31.6万人,其中少数民族人口占38%,先后荣获全国民族团结进步示范县、国家全域旅游示范县、国家园林县城、全国休闲农业和乡村旅游示范县、全国国土资源节约集约模范县、国家级妇幼健康优质服务示范县、自治区双拥模范县、自治区食品安全先进县、全区民族团结进步模范集体、自治区文明县城、自治区卫生县城等荣誉称号。2020年,全县实现地区生产总值177.4亿元,增长3%;规模以上工业增加值增长1.6%;全社会固定资产投资增长6%;社会消费品零售总额下降3.8%;地方一般公共预算收入7.11亿元,下降14.1%。一般公共预算支出43.46亿元,增长13.4%;城乡居民人均可支配收入分别为29683元和16890元,增长3.5%和7.8%。

铅板

铅板-铅门-铅玻璃-硫酸钡-铅房-探伤门-铅屏风-山东健生源辐射防护材料有限公司

苏州物流公司

美易天物流专注苏州到全国各省市县物流专线,天天发车,直达全国各地,如您有货物需要从苏州发往各地,请直接联系美易天物流:15051535542.

西安青软信息科技有限公司

青软科技是致力于电子商务实训教学软件,市场营销模拟教学软件,ERP电子沙盘系统,旅行社管理教学系统软件,电子商务B2C商城教学软件以及电子商务直播实训和新媒体营销实训教学软件的研发与销售的高新技术企业公司,服务热线029-89588876.

GB9948无缝钢管,GB9948石油裂化管,GB9948无缝管,GB9948钢管

山东昊月金属制品有限公司【电话:135-0893-9810】专业生产GB9948无缝钢管,GB9948石油裂化管,GB9948无缝管,GB9948钢管等,价格合理,现货供应,可按照客户需求定制,口碑好,欢迎来电洽谈!

全局底部横幅