沉寂近30年后火了！存内计算如何打破AI算力瓶颈 (三十年的沉淀)

2012年，深度学习算法在图像分类竞赛中展现出的显著性能提升引发了新一轮的AI热潮。

2015年，深度学习算法对芯片的快速增长需求引发了AI芯片创业热潮。

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

不过，拥抱AI芯片的设计者们很快发现，使用经典冯诺依曼计算架构的AI芯片即使在运算单元算力大幅提升，但存储器性能提升速度较慢的情况下，两者的性能差距越来越明显，而深度学习算法带来的数据搬运消耗的能量是计算消耗能量的几十倍甚至几百倍，“内存墙”的问题越来越显著。

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

因此，依靠软件算法以及云端强大计算能力的人工智能虽然取得了较大的成功，可以胜任多种特定的智能处理任务，但是面临功耗、速度、成本等诸多挑战，离智能万物互联时代还有巨大差距。

AI芯片的核心技术之一就是解决“内存墙”挑战，可以在存储器内直接做计算的存内计算（In-MEMOry Computing）技术在沉寂了近30年后，AI热潮下近年来成为焦点。无论是顶级学术会议，还是巨头公司都在寻找能够用存内计算打破AI芯片“内存墙”的最佳技术方案。

那么，谁会是最终的破局者？

存内计算被不少业内人士认为是最适合AI的芯片架构，广受学术界和产业界的青睐。

2018年，国际顶级学术会议-IEEE国际固态电路会议（ISSCC）有一个专门的议程讨论存内计算。2019年和2020年关于存内运算的论文更是大爆发，ISSCC2020与存内计算相关的论文数量上升到了7篇。同时，2019年电子器件领域顶级会议IEDM有三个专门的议程共二十余篇存内计算相关的论文。

除了学术界，产业界也越来越多的玩家布局该技术。IBM基于其独特的相变存内计算已经有了数年的技术积累；台积电正大力推进基于ReRAM的存内计算方案；英特尔、博世、美光、Lam Research、应用材料、微软、亚马逊、软银则投资了基于NOR Flash的存内计算芯片。

其实，利用存储器做计算在很早以前就有人研究，上世纪90年代就有学者发表过相关论文。但没有人真正实现产业落地，究其原因，一方面是设计挑战比较大，更为关键的是没有杀手级应用。随着深度学习的大规模爆发，存内计算技术才开始产业化落地。

存内计算的产业化落地历程，与知存科技创始人的求学创业经历关系密切。

2011年，郭昕婕本科毕业于北大信息科学技术学院微电子专业，本科毕业之后郭昕婕开始了美国加州大学圣塔芭芭拉分校（UCSB）的博士学业，她的导师Dmitri B.Strukov教授是存内计算领域的学术大牛，2008年在惠普完成了忆阻器的首次制备，2010年加入了美国加州大学圣塔芭芭拉分校。郭昕婕也成为了Dmitri B.Strukov教授的第一批博士生，开始了基于NOR FLASH存内计算芯片的研究。

Dmitri B. Strukov告诉她，FLASH已经商用几十年，技术成熟，成本很低，是最接近产业化的方向，但缺点同样是因为FLASH研究起步较早，学术界对FLASH存内计算的研究期望较高，发表文章不易。2013年，随着深度学习的研究热潮席卷学术界，在导师的支持下，郭昕婕开始尝试基于NOR FLASH存内计算的芯片研发。

耗时4年，历经6次流片，郭昕婕终于在2016年研发出全球第一个3层神经网络的浮栅存内计算深度学习芯片，首次验证了基于浮栅晶体管的存内计算在深度学习应用中的效用。仅一年后，她就进一步攻下7层神经网络的浮栅存内计算深度学习芯片。

也是在2016年，郭昕婕的大学同学，也是她丈夫的王绍迪，同样看到了存内计算芯片在AI中的应用价值，选择和郭昕婕继续在博士后阶段从事存内计算的研究工作。2017年，美国开始大力资助存内计算技术的研发，王绍迪和其导师的项目也获得了600万美金的资助。郭昕婕夫妇认为时机成熟，毅然选择回国创业，并获得了启迪之星、兆易创新等关联人的投资支持。

2017年10月，知存科技在北京成立，由于积累了丰富的经验，知存科技在成立后的10个月内就首次流片。同时加上存内计算技术逐渐获得认可，知存科技的发展也在逐步加快，并于2018年12月获得获讯飞领投的天使+轮融资，2019年8月又获得中芯聚源领投的近亿元A轮融资。

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

王绍迪对存内计算技术在AI中的应用充满信心，他接受雷锋网采访时表示：“AI算法的参数越多，存内计算的优势越大。因为存内计算是在存储器中储存了一个操作数，输入另一个操作数后就可以得到运算结果。所以参数越多，节省的数据搬运就越多，优势也就越明显。存内计算可以看作是一个大的锤子，AI算法是钉子，早期落地的算法是小钉子，随着时间推演，钉子会越来越大越来越多。”

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

知存科技的方案是从底层重新设计存储器，利用NOR FLASH存储单元的物理特性，对存储阵列进行改造，重新设计外围电路使其能够容纳更多的数据，同时将算子也存储到存储器当中，使得每个单元都能进行模拟运算并且能直接输出运算结果，以达到存内计算的目的。

由此看来，存内计算是破解“内存墙”瓶颈的好方法，但为什么在多种存内计算的技术路径中，知存科技选择的是NOR FLASH？

其实，能做存内计算的存储器并不多，除了FLASH，还有亿阻器、相变存储器、铁电存储器、自旋存储器、SRAM等，但各有各的优缺点。

综合来看，NOR FLASH是目前最适合产业化的方向，众多巨头投资的美国初创公司Mythic采用的也正是NOR FLASH。至于为什么用NOR FLASH做存内计算被业界看好，王绍迪表示：“单独从器件特性看，NOR FLASH的优势不仅体现在功耗和成熟度等方面，高精度也是很大的优势。目前主要的问题是没有28nm以下的NOR FLASH工艺，但是基于当前工艺的NOR FLASH存内计算相比传统方案的优势已经足够高了。”

使用NOR FLASH单元可以完成8bit权重存储和8bit * 8bit的模拟矩阵乘加运算。单一NOR FLASH阵列可并行完成200万次矩阵乘加法运算，计算吞吐量相比DRAM和SRAM等存储器带宽高出100-1000倍。

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

知存科技存算一体芯片技术

“相比使用数字电路计算，使用NOR FLASH进行存内计算减少了数据搬运消耗的能量，再加上NOR FLASH进行乘加法运算功耗也很低，这样就会带来百倍甚至千倍的功耗降低。”王绍迪表示。

当然，考虑到外围电路的功耗，NOR FLASH存内计算最终能够实现的功耗降低在几十倍到上百倍之间。不同的算法和应用能够实现的提升也不同。

王绍迪介绍，目前来看NOR FLASH存内计算技术可以在单芯片中支持到300M左右的深度学习权重参数，不需要额外的内存就可以进行计算。目前智能语音模型的大小通常在几百K到几兆的大小，端侧的图像推理模型大小通常在几兆到几十兆之间，因此NOR FLASH存内计算芯片可以满足大部分AI场景的需求。

存内计算可以支持的模型精度可以达到现在主流的8比特。王绍迪说，8比特可以覆盖大部分的深度学习应用，即便有些极限场景需要更高的16比特，我们也有解决方案在研发。我们希望未来存内计算能够覆盖60%-70%的AI应用。

需要指出的是，知存科技的技术水平领先业界3-4年。 郭昕婕博士在2012、2013年就开始研究基于NORFLASH的存内计算技术，其他公司基本到2018年才开始研发投入。作为一项新兴前沿技术，研发存内计算需要大量的技术积累，存在许多坑需要一步一步去踩，即便其他公司投入大量资源，在不出现技术泄露的情况下，至少也得三四年左右的时间才能达到知科技存目前的成绩。

这其中的设计挑战，包含了控制电路、模拟电路、编程技术、可靠性设计、架构设计等。 模拟设计就是其中非常大的挑战，由于FLASH进行的是模拟计算，但算法都是基于数字电路开发，这就对模拟运算增加了很多苛刻的要求。

王绍迪说：“虽然理论上存内计算芯片在功能上无需完全匹配现有的芯片，但目前业界的AI算法都是基于现有芯片架构开发的，因此知存科技的产品必须去适应这些商用算法，并且要做到高精度，这经历了一次次地流片迭代，这些经历和技术积累也成为了知存科技的优势。”

“在迭代的过程中，我们需要去解决工艺、温度、编程、噪声等带来的误差，同时还要解决一些模拟运算遇到的问题，解决问题的过程也是一个创新的过程。正如魏少军教授所说：产品创新是芯片设计企业的永恒话题。”他进一步表示。

而这也解释了知存科技选择NOR FLASH的原因，从零开始设计NOR FLASH存内计算芯片需要非常长的时间，NOR FLASH之所以能比NAND FLASH进度更快，是因为NOR-FLASH已经有一套成熟的方案，可以基于已有的方案进行优化，更快推出产品。

经历了多次流片和技术迭代之后，知存科技上月底发布了两款智能语音芯片MemCore001/MemCore001P，支持智能语音识别、语音降噪、声纹识别等多种智能语音应用。芯片运行功耗小于300uA，待机功耗小于10uA。

根据知存科技的技术文档，MemCore001/MemCore001P典型工作频率为24MHz(工作时钟)和2MHz(唤醒时钟)，MemCore001P在低功耗模式下，采用片内独立的低功耗时钟，可与其他芯片通过中断协同交互，进一步降低整个系统的功耗。

沉寂近30年后火了！存内计算如何打破AI算力瓶颈？

MemCore001/MemCore001P内置2MB深度学习网络参数存储空间，可同时存储和运算多达32层的多个（相同或不同）深度学习网络算法，支持DNN/RNN/LSTM/TDNN等多种网络结构。

作为协处理器，MemCore001/MemCore001P可兼容基于Arm架构的Cortex-M4/M3/M33/M0等系列MCU以及基于RISC-V的MCU。

不过，芯片想要落地，还要把存内计算的硬件优势转化为落地优势。王绍迪表示，产品能落地仅有一点优势并不够，能否落地还要看市场的需求。当然，想要尽快落地，要做到让现在的商用算法在尽可能少做改变的同时尽快适配我们的芯片，这点非常重要的，这就需要和算法公司一起合作，在落地过程中不断了解需求，让软件和硬件协同起来，都发挥最大作用。

他进一步指出，软件平台可以让开发者在算法迁移和调试的时候更加方便。不过存内计算的工作方式比较简单，比如传统架构需要几百万个周期才能完成的计算，存内计算一个周期就可以完成，所以存内计算的编译器是粗颗粒度的，开发难度较低。

因此，知存科技与合作方开发了相应的系统解决方案，包含智能语音降噪和智能语音识别等算法，可直接集成在芯片中，供应用开发者方便调用。

与其它大部分AI芯片一样，知存科技的MemCore001/MemCore001P在进行算法迁移的时候也需要重新训练。这时候，如何才能吸引客户使用存内计算的芯片？

王绍迪说：“如果我的芯片能够带来的提升非常明显，或者原先不能落地的应用使用了我们的芯片之后可以落地，这样才有人愿意尝试。这样的场景很多，需要去探索，不过目前已经有意向客户准备使用我们的产品。”

知存科技在存内计算的领先性从另一个角度也能说明，“早期研发的时候，由于缺乏晶圆工厂和EDA工具的支持，我们的开发工作很多就要从自动变成手动，但这同时让知存科技建立起了存内计算芯片的设计方法学。”王绍迪表示。

这样的领先让知存科技有可能成为存内AI芯片的破局者，知存科技的目标是在三年内实现5000万颗芯片的出货目标。对此，王绍迪表示乐观，他认为消费市场5000万的出货量并不多，如果选对了方向，一个产品的出货量在几年内就能达到上千万。

5000万的出货意味着公司可以实现盈利，在这样的目标下，硬件和软件都需要不断迭代。 王绍迪透露，现在公司每三到四个月就会流片一次，一年会推出一款甚至两款新产品。视觉芯片的样片会在明年流片，预计后年会正式推出。

作为AI发展的关键推动力，AI芯片能够在多大程度上满足AI算法的需求成为关键。要满足AI算法的需求就需要解决AI芯片内存墙的核心挑战，存内计算以其能够同时存储和计算的特性被视为解决内存墙挑战的一种方法，但其用模拟计算满足数字算法的需求，外围电路设计、软件设计、工艺带来的误差都是挑战。

存内计算的公司之间显然还不是竞争关系，但我们都期待存内计算AI芯片能够出现代表性地应用，推动AI的快速落地和持续发展。

Live回顾：值得你去了解的“存算一体AI芯片技术”

Live预告| 知存科技CEO：存算一体AI芯片的架构创新

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/ad5dcb80fabaffaf84b6.html

上一篇：清华团队再获突破研制出全球首款多阵列忆阻

下一篇：能干掉各种AI花式作弊吗高考拍照搜题背后

虎扑体育

虎扑是以体育赛事和男性兴趣生活为主的社区网站。专注于NBA赛程、NBA录像、NBA直播、NBA资讯、球员交易、足球、英超、电竞、LPL等全部篮球足球电竞赛事，并提供虎扑步行街社区服务。

新闻资讯 2024-11-13 11:08:17

意表

意表截屏识别各种类型表格，结果识别到剪贴板。程序常驻状态栏，支持快捷键操作。

科技创新 2024-09-15 02:05:03

全民格斗争霸

4399全民格斗争霸是一款横版3D格斗ARPG页游，经典动作地下城格斗争霸。在一次次战斗中经历刺激的冒险，得到道具和宝藏，成为顶尖的强者。

游戏网游 2024-08-16 23:08:46

德析仪器

四川德析仪器有限公司是一家着重于进口实验设备及耗材的公司,公司成立于2009年,注册资金8000万元,旗下拥有自主品牌是一家专业专注于实验室发展的综合性企业。公司力求建立起最全面的实验室仪器设备在线供应平台,为客户提供全面、优质、便捷的采购服务平台。

商业服务 2024-07-11 13:30:44

宁波网站建设,宁波网站维护,软件开发,微信小程序,网络推广,程序开发,百度推广,技术分包

宁波易捷成立2015年,业务涉足于网站建设,网络推广等互联网业务，自运营平台56商铺网，欢迎合作咨询。

网络应用 2024-08-17 20:37:22

首页

昆明安居网,昆明市住保局,昆明市公房管理中心

管理咨询 2024-08-17 20:58:21

西安办公高隔

西安森之华隔断厂家（17847688556）专业提供玻璃隔断、办公玻璃隔断、办公高隔间隔断、酒店活动隔断、会议室活动隔、卫生间隔断、双玻百叶隔断、高隔间、高隔断以及淋浴房生产和制作安装服务的厂家，西安隔断公司电话：15711223871

商业服务 2024-08-18 14:37:26

幻雪忆梦个人页

毛玻璃拟态UI个人主页是雪梦原创的一款简约风格开源的新UI主页设计。

设计美化 2024-11-23 01:10:13

成都精神病医院

成都棕南医院是经卫生行政主管部门审批成立的省市区医保定点医院，设有精神卫生中心、心理咨询中心、青少年康复中心等重点科室，专家团队专注精神心理健康领域，用技术实力得到了社会各界高度认可。

管理咨询 2024-11-24 23:06:54

轻喜到家

深圳轻喜到家中国家庭数字化生活服务平台,轻喜到家提供日常保洁、高端保洁、保姆、母婴护理、育婴早教、产康护理、家电清洗、家居养护等专业的到家服务。

商业服务 2024-12-21 18:27:29

贵阳市妇女联合会

贵阳市妇女联合会|贵阳市妇联

电影视频 2025-02-06 19:17:56

【湖州二手房网

湖州悠居客提供真实的租房、二手房、整租、公寓等湖州房产信息，及时的房地产新闻资讯，每日实时更新全城数千中介公司上万经纪人最新挂牌的租售房源，免费查询湖州房产信息，就到悠居客。

新闻资讯 2025-02-13 23:36:14

坑爹的iPhone国内以旧换新 (坑爹的穿越游戏)

昨日，苹果在国内宣布启动iPhone以旧换新的消息迅速传开，国内果粉期待多年的好政策终于来了，可经过部分媒体的体验，苹果官方提供的iPhone折旧价格实在是，惨不忍睹，，那苹果给出的回收价格到底是多少?又有哪些版本的iPhone能以旧换新呢?泡泡网制作了一张，10问苹果以旧换新，图片，对此次苹果以旧换新进行了解答，这10个问题相信能帮...。

2025-01-30 17:32:43

症状轻微吴恩达已接种疫苗我感染了新冠 (轻微症状感染者能治好吗)

刚刚，著名人工智能，AI，学者吴恩达，AndrewNg，感染了新冠，不过，庆幸接种了三针疫苗，吴恩达目前的新冠症状与轻度流感差不多，他也非常感激疫苗工作者在对抗这场大流行病种所做出的的努力，吴恩达是谷歌大脑的联合创始人和主管，曾担任过百度首席科学家，他目前是美国斯坦福大学计算机科学系和电子工程系教授，而在美国，新冠患者现有确诊接近三千...。

2024-12-09 19:45:46

珊口科技崔彧玮 AIoT 在家庭场景下的趋势 (珊口科技崔彧简历)

编者按，为了构建行业对AIoT产业的全新认知，解析AIoT泛产业的，云、管、边、端，及智能制造产业的发展，探讨当下AIoT行业落地困境及工业互联网发展思路，2019年11月22日，全球AIoT产业·智能制造峰会在深圳隆重举行，本次会议由雷锋网主办，由深圳市软件行业协会、深圳市大数据产业协会、深圳市人工智能学会、深圳市人工智能行业协会作...。

2024-12-03 18:16:52

17个问题带你深度了解精灵4无人机 90分钟 (170个问题)

本月初大疆发布了精灵系列最新产品精灵4，首次加入的，障碍感知，、，智能跟随，、，指点飞行，三项创新功能，让精灵4完成了智慧的进化，在上周末的国内首秀上，精灵4的表现赢得了阵阵惊呼，不少人说看了精灵4后不想再去玩精灵3了，显然精灵4已经成功地吸引了大家的注意，在购买之前对于精灵4你一定有很多问题，所以我们开设了这样一堂硬创公开课，专门讲...。

2024-12-01 01:33:24

应该怎么选择投影机流明越高越好吗 (卧室的灯应该怎么选择)

发表在综合交流大区2020，3，3010，11过去，打造家庭私人影院是一件较为奢侈的事情，现如今，投影仪的普及率越练越高，同一价位中的投影机各有其特色，所以选择成为一个难题，下面以亮度为说明，投影机流明越高越好吗，应该怎么选择，在众多投影分类中，亮度是被提及最多的一个基础参数，无论是横向比较不同品牌的投影机，或者是纵向比较同一品牌的不...。

2024-11-28 18:22:22

知乎官方回应别想用知乎不给这些隐私信息 (知乎官方回应新冠病毒)

这两天打开知乎APP，你可能会被弹窗提示知乎上线了隐私政策，通过隐私政策的要点简介和11个章节条款，知乎逐一告知了将如何处理用户的个人信息，并申明了保护用户隐私的承诺，收集个人信息，将具体收集的内容告诉用户，本应是一件好事，但却引发了不小的争议和质疑，有用户质疑，知乎为什么要收集那么多个人信息?另一方面，不同意隐私政策就无法继续使用知...。

2024-11-26 18:02:05

阜阳碧桂园锦绣江山未按合同退屋宇面积差的钱 (阜阳碧桂园锦绣江山)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 20:36:27

ArduBlock下载-ArduBlock(图形化编程软件)v2.0中文免费版

ArduBlock是Arduino官方编程环境的第三方图形化编程软件，必须要在Arduino软件下运行，是以图形化积木搭建的方式编程的

2023-11-11 15:16:00

Calibre下载-Calibre(电子书阅读器)v6.29官方中文版

Calibre(电子书阅读器)是免费的电子书制作、阅读软件，源代码开放，拥有跨平台的设计，支持多个基于不同系统的便携式移动设备，包括苹果iPhone、Amazon电子书等设备。

2023-11-05 11:15:55

【雷神加速器下载】2023年最新官方正式版雷神加速器免费下载

腾讯软件中心提供2023年最新10.0.9.3官方正式版雷神加速器高速下载，本正式版雷神加速器软件安全认证，免费无插件。

2023-09-19 01:09:18

普里戈任离奇身亡时，他的乌克兰“老对手”也阵亡了|巴赫|瓦格纳|莫斯科|俄罗斯|卢旺达

普里戈任离奇身亡时，他的乌克兰“老对手”也阵亡了,巴赫,普里戈,瓦格纳,乌克兰,莫斯科,俄罗斯,卢旺达,普里戈任遭遇坠机

2023-09-02 16:49:35

文章推荐

日本经营类游戏像素类下载大全2022 好玩的经营像素类游戏推荐 (日本经营类游戏)

像素经营类游戏因为具有像素元素、内存小等特点一直被玩家们喜欢，在整个游戏圈子里的热度也是很高的，那么日本经营类游戏像素类下载大全2022呢，小编为大家带来好玩的经营像素类游戏推荐，带大家找到像素经营游戏的乐趣1、，宇宙探险物语，宇宙探险物语是一款日本的像素风格探险游戏，玩家们可以在游戏中体验到全像素场景哦，所有的游戏场面以及特效制作全...。

2025-02-12 00:03:57

资讯动态

加盟一个驾校需要多少资金 (加盟一个驾校,招一个学生提成多少)

近年来报考驾照的人可谓是越来越多，随着汽车的普及，考驾照成为了很多人的选择，而且不光光是诸多的年轻人纷纷报考，很多的中老年人也加入到报考大军中来，给驾校带来了很多的生源和发展空间，随着驾校行业的不断专业化发展，越来越多的驾校品牌以连锁化的发展模式在诸多地方建立了培训校区，受到了很多消费者的喜爱，而且项目也给很多的创业人士带来了发展机会...。

2025-01-31 19:11:01

创业加盟

新石器无人车完成6亿元C轮融资获得头部客户近万台订单 (新石器无人车公司)

新石器无人车近日宣布完成6亿元人民币C轮融资，本轮投资方包括中金汇融、前海方舟、中金启阳、亦庄国投以及壳牌资本，本轮融资完成后，新石器将继续推进产品技术研发及全国交付部署，资本加持，新石器，抢跑，未来可期无人配送赛道已来到下半场，赛点，，能否在这个关键节点抢占商业化先机，成为各家跑赢这场，马拉松，的关键，此次融资，自然也成了新石器，跑...。

2024-12-03 22:33:22

资讯动态

少年创客马拉松一场激发创造潜力的比赛 (少年创客作品)

光想不干的人，我们称之为空想家；有想法就立即动手，借助科学工具实现自己创意的人，我们称之为创客，Maker，创客马拉松，顾名思义则是一场创客的极限运动，在规定的时间内现场连续开发，利用开源硬件和3D打印等工具，实现自己的创意最终变成作品的一项比赛，少年创学院前身硬创邦是，创客马拉松，的商标持有者和发起者，致力于创客教育和创客马拉松...。

2024-12-03 18:34:22

资讯动态

孔一凡饺子加盟费多少钱 (孔一凡饺子加盟)

以新鲜好的食材作为馅料包裹而成的水饺拥有令人垂涎的口感，水饺这道快餐化的美食项目在我国是比较常见的，甚至于在一些特定的节日中都养成了吃水饺的习惯，水饺的需求量高，品牌亦是有很多，孔一凡饺子是这当中好的水饺品牌，它是以传统的手工工艺进行包制而成，而且在馅料食材的选择方面，它亦是有着苛刻的要求，以新鲜的食材为主，也正是因此，孔一凡饺子成为...。

2024-12-02 23:19:46

创业加盟

沉寂近30年后火了！存内计算如何打破AI算力瓶颈 (三十年的沉淀)

相关文章

文章推荐