TeleAI 完成首个全国产化万卡万参大模型训练 并正式开源 TeleChat2 (中国人工智能公司排名)

文章编号:39791 资讯动态 2024-12-03 AI大模型TeleChat

近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。

这是由中国电信集团CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成,在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性,实现了 GPU 同等算力计算效率的 93%以上,同时模型有效训练时长占比达到 98%以上。

TeleAI 完成首个全国产化万卡万参大模型训练,并正式开源 TeleChat2-115B

TeleChat-52B在OpenCampass推理榜单排名第一

在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 TeleChat 系列模型提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。

TeleAI 完成首个全国产化万卡万参大模型训练,并正式开源 TeleChat2-115B

TeleChat2-115B在C-Eval的Open Access模型综合榜单排名第一

TeleChat2在模型训练与数据构建方面的研究经验

针对超大参数模型训练,TeleAI 采用了大量小模型进行 SCAling,进而验证不同模型结构的有效性。同时,在数据配比方面,基于小模型实验结果反馈,采用回归预测模型,得到较优数据配比。

基于以上策略,能够大幅提升大参数模型最优方案的搜寻效率。另外,在后训练退火阶段,TeleAI 通过大量实验验证探索到了退火最佳数据量和最佳配比,以及学习率变化方式等,进一步提升了模型训练效果。

在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练。其次采用迭代式更新策略,使用模型对 Prompt(提示词)数据进行指令复杂性提升与多样性扩充,通过模型合成和人工标注提升答案质量,并利用拒绝采样获取优质 SFT 数据及 RM(奖励模型)代表性数据,用于 SFT 训练和 DPO(偏好对齐)训练,以及模型效果迭代。

TeleAI自研语义大模型获多项权威赛事第一名

连获中国计算语言学大会(CCL2024)挑战赛两项冠军: TeleAI在CCL2024大会上获得中文空间语义理解评测和古文历史事件类型抽取评测两项第一名。其中,在古文历史事件类型抽取评测任务挑战赛中,更是在所有子任务均取得第一名的情况下获得了综合排名第一。

NLPCC2024 中文议论文挖掘(Shared Task5)挑战赛冠军: TeleAI语义团队基于上下文学习策略对大模型进行优化,通过利用从粗粒度到细粒度的 Prompt 设计、多模型的投票机制等手段,进一步提高了模型准确率和鲁棒性,最终以领先第二名将近 3 分的绝对优势排名第一。

开源共享,引领创新

TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先开源大模型的央企机构,TeleAI 积极通过开源推动大模型技术的不断进步,并持续推动和引领技术创新向产业落地快速跃迁。

开源地址:

特约稿件,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
萌站·次元导航

Moe321萌站,收录最新最热门的二次元网站,二次元资讯、二次元资源、动画、漫画、轻小说、萌音、游戏、cosplay全掌握,二次元导航之门,收藏我的二次元(づ ̄3 ̄)づ

教学网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

高端改性塑料创新领导者

深圳华力兴新材料股份有限公司是一家专业从事中国电子电气领域高端改性工程塑料创新领导者,多年来专注于电子电气行业的高性能改性工程塑料,化工新材料领域,为行业客户提供高品质改性工程塑料,在各主要市场占有领先地位,电话:0755-66838833。

拉力机

上海和晟仪器科技有限公司创建于2006年,注册资金600W人民币,是一家以从事仪器仪表制造业为主的国家级高新技术企业。公司曾先后获授“创新型中小企业”、“国家高新技术企业”等资质和荣誉;是试验机、环境类仪器、热分析仪设备制造生产商。

云南商标注册

云南励合知识产权专注于云南商标注册、版权登记、专利咨询、进出口经营权资质办理、自动进出口许可证、种植基地备案、原产地证备案办理等商务服务。

不锈钢雕塑厂家

成都云卷舒园林景观专业的不锈钢雕塑厂家,电话:18111611118专注不锈钢雕塑,城市园林雕塑、人物形象雕塑、公园景观雕塑,是一家集个性化造型、设计、安装、维护的雕塑企业,公司拥有30多人的专业队伍,10多年的雕塑公司服务了1000多家大型企业,包含万科地产、融创地产、通威创新基地、宜宾华侨城等大型企业选择了我们。云卷舒园林工程为您解决一切技术难题。

高槐编程网

高槐编程网是编程爱好者的首选学习平台,提供全面且权威的编程教程,包括软件编程、网络编程、数据库管理、操作系统、程序设计、脚本语言、网页制作、建站技术、网站技巧、网络知识技术及CMS教程等,助您成为编程高手。

云上宁德官网

云上宁德官网-云上公司注册,简称云上宁德官网-云上公司注册,是互联网线上虚拟园区,通过互联网的办法提供线下园区几乎所有的配套服务。除电子营业执照办理外,还能提供政策申报与兑现、线上培训、引导基金等服务。

深圳瑞赛环保科技有限公司

深圳瑞赛环保科技有限公司技术团队由多名博士、硕士组成,研发型技术人员占比70%左右。公司在PCB、电镀、阳极氧化等行业根据废水性质开发“源头控制”废水处理工艺及设备,可以为企业创造资源增效价值,大幅削减危废处置和废水处理成本,解决环保设施升级空间受限等问题,减轻企业环保压力。公司于2019年12月获得国家高新技术企业认证,已获授权专利三十余项,其中发明专利两项。2021年10月通过ISO9001及ISO14001质量认证体系。

colinyk的私房菜

IT大数据技术、数仓学习分享

全局底部横幅