AI推理最高提速7倍 阿里云第八代企业级实例g8i算力升级 整机性能提升85% (ai推理芯片干什么用的)

文章编号:41141 资讯动态 2024-12-03 算力大模型通用算力

如果说2023年是人工智能大模型元年,那么2024年或许就是各形态AI应用大规模落地元年。

据IDC预测,2024 年全球将涌现出超过5亿个新应用,相当于过去40年间出现的应用数总和。

而作为AI发展基础之一的算力,面临着越来越多的挑战。

如何打造新一代算力日益成为云厂商在思考的事情。

1月11日,阿里云宣布第八代企业级通用计算实例ECS g8i算力再升级,国内首发代号Emerald Rapids的第五代英特尔至强可扩展处理器,依托阿里云自研的“飞天+CIPU”架构体系,ECS g8i实例的整机性能最高提升85%,AI推理性能最高提升7倍,可支撑高达72B参数的大语言模型,帮助中小规模模型起建成本降低50%。

同时,新实例还提供了端到端安全防护,为企业构建可信AI应用提供强有力的隐私增强算力支撑。

阿里云弹性计算产品线总经理张献涛表示,“阿里云ECSg8i实例的强劲表现,证明了以CPU为中心的计算体系同样具备加速AI推理的巨大潜力,公共云不仅可胜任超大规模的AI模型,也为AI应用加速落地开辟了新路径。”

英特尔中国数据中心和人工智能集团至强客户解决方案事业部总经理李亚东表示:“最新上市的第五代英特尔至强®可扩展处理器每个内核均内置AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其AI训练性能提升多达29%,AI推理能力提升高达42%。我们希望借由阿里云第八代企业级实例(ECS g8i)共同助力开发者实现技术普惠,让AI技术无处不在。”

通用算力再提升,整机性能提升85%

作为企业级通用计算实例,ECSg8i实例在计算、存储、网络和安全等能力得到了全方位提升。

据了解,从关键参数上看,ECSg8i实例的L3缓存容量提升到320MB,内存速率高达5600MT/s,整机性能提升85%,单核性能提升25%;存储方面,ESSD云盘提供100万IOPS,全面搭载NVMe,存储延迟低至百微秒;网络方面,PPS高达3000万,标配阿里云自研eRDMA大规模加速能力,时延低至8微秒;安全方面,ECS g8i实例支持可信计算与加密计算等特性,全球率先支持机密虚拟机TDX技术,构建了全面的安全防护。

阿里云第八代企业级实例g8i算力升级,整机性能提升85%,AI推理最高提速7倍

在E2E场景下,ECSg8i实例可将MySQL性能提升最高达60%,Redis和Nginx的性能分别提升40%和24%,面向游戏、视频直播、电商、金融、医疗、企业服务等行业提供强劲的算力支持,满足其在数据库、大数据、AI推理等应用场景下对性能的严苛要求。

此外,ECS g8i实例还提供了多种硬件原生加速能力,包括QAT和IAA等加速器。阿里云通过自研技术,将硬件加速能力更细颗粒度透传至实例虚拟机,小规格的ECS g8i实例也同样具备加速能力。其中,依托于QAT原生加解密加速器,ECSg8i实例在压缩/解压缩场景下性能最大可提升70倍,加解密性能提升4倍以上。

为AI提速,可支撑72B参数的大语言模型

生成式AI掀起的技术革命,正在推动计算范式发生根本性的变化。当前,AI大模型推理在算力上依然面临诸多挑战,例如首包延迟受限于并行处理能力与浮点运算能力,吞吐性能则受限于内存带宽和网络延迟。

阿里云ECS g8i实例针对这些难题都进行了相当程度的优化,包括内置指令集从AVX512升级到了IntelAMX高级矩阵扩展加速技术,可让生成式AI更快地运行。

据了解,相对于AVX512指令集,启用AMX AI加速后,ECS g8i实例在int 8矩阵计算的性能最高提升7倍。

阿里云第八代企业级实例g8i算力升级,整机性能提升85%,AI推理最高提速7倍

基于AMX AI加速能力,g8i可更迅速地响应中小规模参数模型,运行知识检索、问答系统及摘要生成等AI工作负载时,起建成本相比A10 GPU云服务器下降50%。此外,配合阿里云平台的Spot抢占式实例,成本优势将进一步凸显,进一步降低AI推理成本。

与此同时,基于自研eRDMA超低延时弹性网络,阿里云g8i实例集群拥有超低延时网络和高弹性优势,可轻松支撑72B参数级别的大语言模型分布式推理,推理性能随集群规模接近线性加速,并可支持超过32batchsize的超大参数规模的AI模型负载,运行文生图、AI生成代码、虚拟助手以及创意辅助工具等AI工作负载。

阿里云第八代企业级实例g8i算力升级,整机性能提升85%,AI推理最高提速7倍

以阿里云通义千问开源的Qwen-72B大模型为例,可在g8i实例eRDMA网络构建的集群实现高效运行,在输入小于500字情况下,首包延时小于3秒,每秒可生成7个Token。

为安全加码,助力企业构建可信AI应用

安全方面,阿里云在全产品线构建了端到端的安全防护,可保障数据存储、数据传输、数据计算的全流程安全。

在最底层,基于CIPU的安全架构搭载安全芯片TPM作为硬件可信根,实现服务器的可信启动,确保零篡改;虚拟化层面,支持虚拟可信能力vTPM,提供实例启动过程核心组件的校验能力;在实例可信的基础上支持不同平台的机密计算能力,实现了运行态的内存数据隔离和加密的保护。

阿里云第八代企业级实例g8i算力升级,整机性能提升85%,AI推理最高提速7倍

值得一提的是,此次升级的ECS g8i实例全量支持Trust Domain Extension TDX技术能力,业务应用无需更改,即可部署到TEE之中,极大降低了技术门槛,并以极低的性能损耗为大模型等AI应用提供隐私增强算力,护航大模型的云上数据安全。

阿里云第八代企业级实例g8i算力升级,整机性能提升85%,AI推理最高提速7倍

以Qwen-Chat-7B模型为例,启用TDX后,既确保了模型推理的安全可信,也保护了数据的机密性和完整性。

“阿里云将不断深耕技术、持续产品创新,为企业提供更加稳定、强大、安全、弹性的计算服务,推动各行业的AI应用进入全量爆发时代。”张献涛表示。

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
云仓管家

云仓管家是一家专门做管仓服务的公司,服务涵盖提货、存储、质检、换标贴码、商品组套与拆分、分拣、发货和退换货等。主要提供云仓库、淘宝云仓一件代发、京东一件代发、云仓管理系统、电商云仓代发货、仓配一体化、快递云仓物流等,业务覆盖浙江杭州、金华、义乌、宁波、海宁、嘉兴、上海等地。

快递查询

提供包括申通、顺丰、圆通、韵达、中通、百世、极兔、德邦、天天、EMS、宅急送、跨越、UPS、新邦等快递公司在内的170多个快递物流单号查询。可以自动识别快递公司。(顺丰快递需要收件人/寄件人手机号后四位)

中国采购与招标网

中国采购与招标网是招标采购供应链数字化一体化服务平台,为中国政府、企业、事业、招标代理机构、供应商提供强大的专业招标采购相关服务,提供招标采购数据挖掘和信息服务、企业级招标采购系统定制服务、企业数智化转型赋能服务、行业交易全流程技术服务、企业品牌推广评价服务,以及招标采购执业人员培训、培养、认证及继续教育。

微信视频小程序

本站提供市面上最新最全的微信视频小程序资源,您可以免费获取这些应用资源。

高考在线

高考在线官网,是一家专注高考志愿填报服务的大数据平台,为高考考生提供高考数据全方位免费查询服务、高考志愿模拟填报服务等。

服企来(中山)企业管理服务有限公司

服企来(中山)企业管理服务有限公司秉承“专心、专业、专注”的服务宗旨,从事促进民营经济、小微企业发展提供财富信息咨询服务,致力于为各中小微企业提供专业有效的一站式企业服务解决方案。

手机游戏

52pkvr网为用户分享手机游戏、资讯、app、产品、技术等,并提供安全可靠的资源下载,帮助用户快速找到最新的海量资源,玩游戏,试应用,52pkvr网为您解决一切需求

精密激光焊接机

苏州精海激光智能科技有限公司主要产品包括:精密激光焊接机,塑料激光焊接机,激光锡焊机,机械手激光三维切割机,3d/pcb/三维激光打标机,精密切管机,激光清洗机,视觉定位焊接机,旋转激光打标机,全自动精密激光焊接等5大类型30多种型号的工业激光设备。

星康游戏网

星康游戏网为广大游戏玩家提供最新、最全、最热门的游戏攻略,覆盖手机游戏、端游、页游等全平台内容。无论是新手还是高手,这里都有你需要的游戏攻略和技巧,一站式满足游戏需求,轻松成为游戏达人

专业防爆设备

广东英鹏环境设备有限公司自主研发防爆型产品,其中包括防爆空调,防爆冷水机,防爆暖风机,防爆机柜空调,防爆防潮柜,防爆直膨式空调,防爆一体式屋顶空调,防爆除湿机等防爆电器生产,专业定制技术方案,可免费咨询,专业生产厂家-广东英鹏环境设备有限公司

中国石家庄人力资源服务产业园

中国石家庄人力资源服务产业园,中国石家庄人力资源产业园,中国石家庄人力资源服务产业园高新园,石家庄人力资源产业园,石家庄人力资源服务产业园,中国石家庄人力资源服务产业园,石家庄人力资源服务产业园高新园,石家庄高新区人力资源产业园,石家庄人力资源产业园,石家庄高新区人力资源服务产业园,石家庄人力资源服务产业园,河北省人力资源产业园,河北省人力资源服务产业园

全局底部横幅