日日新 勇夺 商汤推出 融合大模型 双冠王

文章编号:52226 资讯动态 2025-02-01 日日新商汤双冠王

今年大模型还要如何进化,还有怎样的想象空间?

刚刚,商汤正式推出“日日新”融合大模型 ,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。

商汤推出“日日新”融合大模型,勇夺“双冠王”

国内权威大模型测评机构SuperCLUE最新发布的《中文大模型基准测评2024年度报告》:商汤“日日新”融合大模型以总分68.3的优异成绩,与 DeepSeek V3 一起并列国内榜首,成为年度第一。

商汤推出“日日新”融合大模型,勇夺“双冠王”

在近期另一个权威综合评测机构Opencompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。

商汤推出“日日新”融合大模型,勇夺“双冠王”

“一个模型、双料冠军” ,意味着商汤科技率先在原生融合模态训练取得实质性突破,这将引领业界从大语言模型和多模态大模型分立的普遍现状,走向真正意义的模型一统。

商汤“日日新”突破了模态融合的技术,跨越了模态之间的鸿沟,就为深度推理能力和多模态信息的结合铺平了道路。

文理兼修,能写能看能推理

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

实现原生模态融合后,“日日新”融合大模型不止能达到人类“看”和“想”的水平,还可以帮助你解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写……这些都可以实现。

英文“草书”难以辨认,发给“日日新”融合大模型看看,识别快速精准。 商汤推出“日日新”融合大模型,勇夺“双冠王”

图表分析,关键要素提取、信息分析、给出结论,几个步骤合一迅速完成,省时省力。

商汤推出“日日新”融合大模型,勇夺“双冠王”

也可以化身“数理老师”,给出详细的解答任务。

数学题↓↓

商汤推出“日日新”融合大模型,勇夺“双冠王”

解物理题↓↓

商汤推出“日日新”融合大模型,勇夺“双冠王”

创意冷幽默没人懂?“日日新”懂你的奇奇怪怪

商汤推出“日日新”融合大模型,勇夺“双冠王”

点击,来与“日日新”互动!

融合模态开拓应用新维度

在实际应用场景中,相较于传统大语言模型仅支持单一文本输入的模式,"日日新"融合大模型展现出显著优势,尤其是在自动驾驶、视频交互、办公教育、金融、园区管理、工业制造等天然拥有丰富模态信息的场景中。

“日日新"融合大模型能够有效满足用户对图像、视频、语音、文本等多源异构信息的综合处理与识别需求。

例如,在办公、金融领域,其行业属性拥有很多复杂的富模态文档:表格、文本、图片、视频,以及融合上述形式的丰富信息,基于“日日新”融合大模型的商汤应用——办公小浣熊就可以高效地完成处理分析相关的复杂任务。

商汤推出“日日新”融合大模型,勇夺“双冠王”

与此同时,基于融合大模型的优势,商汤“日日新”在视觉交互上也有丰富的应用场景,例如,在线上教育、语音客服等场景,均可以结合语音和自然语言来提升交互体验。

去年年底开始,原生多模态大模型就逐渐成为业内探讨的重要方向。然而由于数据和训练方法的局限,业内很多机构的尝试并不成功—— 多模态训练过程往往会导致纯语言任务尤其是指令跟随和推理任务的性能严重下降。

得益于在计算机视觉领域十年深耕以及人工智能赋能场景的丰富经验,商汤一直坚信多模态模型是AI 2.0 进行场景落地的必由之路,对于多模态大模型的研发也有自己的独特见解。在推动语言模型和多模态模型融合的过程中,发展出两项关键的创新技术:融合模态数据合成与融合任务增强训练,进而完成“日日新”融合大模型的训练,推向市场。

在预训练阶段, 商汤不仅采用了天然存在的海量图文交错数据,还通过逆渲染、基于混合语义的图像生成等方法合成了大量融合模态数据,在图文模态之间建立起大量交互桥梁,使得模型基座对于模态之间的丰富关系有更扎实的掌握,也为更好地完成跨模态任务打下坚实的基础,从而实现整体性能的提升。

在后训练阶段 ,商汤基于对广泛业务场景的认知,构建了大量的跨模态任务,包括视频交互、多模态文档分析、城市场景理解、车载场景理解等。通过把这些任务融入到增强训练的过程,商汤的融合模态模型不仅被激发出强大的对多模态信息进行整合理解分析的能力,而且还形成了对业务场景有效的响应能力,走通了应用落地反哺基础模型迭代的闭环。

真正实现多模态交互与深度融合,走向真正意义的模型一统,是走向世界模型的必经之路,商汤科技已在该赛道实现领跑优势。

版权文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
jiwu.comPR查询结果

PR值全称为PageRank(网页级别),取自Google的创始人LarryPage。它是Google排名运算法则(排名公式)的一部分,PR查询可以根据域名查出对应网站(可查内页)的PR。

问船数据网

问船数据(www.wenchuan.net)为公众提供商品的市场价格数据、货运物流数据、宏观经济数据、金融数据以及相关的行情资讯、研究报告和统计资讯。

DCCT多采

DCCT多采,是一家深耕中国本土市场的品牌整案营销&技术开发服务商,核心团队过往在一线的4A公司及互动公司积累了丰富的实践经验,主要业务负责人毕业于MIT麻省理工、明尼苏达、昆士兰、查普曼大学道奇电影学院、贵大、深大等大学,善用我们的天赋为品牌客户创造价值,为品牌客户提供一体化的整合传播服务。根植上海,在深圳、广州设有分支,服务于全球的品牌。

网络公关营销

锐创网络公关公司解决企业搜索引擎网络排名,提供网络公关传播新闻报纸媒体发稿,论坛首页推荐,免费下载各种营销媒体资源及报价表,以实际效果案例为企业提高品牌宣传价值。

山东世纪鑫旺新材料有限公司

山东世纪鑫旺新材料有限公司是一家专注于化工领域研发、生产和销售的高新技术企业。自创立以来,我们始终秉持着创新、质量、服务的核心价值观,致力于为客户提供高品质的化工产品和专业的技术支持。经过多年的稳步发展,公司已成为业内具有广泛影响力的知名企业。

冷切飞锯生产厂家,冷切锯设备厂,冷锯品牌推荐,高频焊管设备

廊坊市新汇聚机电设备公司冷切飞锯生产厂家,主营高频焊管设备.冷切锯设备厂专注冷切飞锯设备研发多年.推出冷切飞锯,高频焊管设备系列产品.冷锯品牌推荐.联系冷切飞锯生产厂家获取冷锯品牌推荐信息.

气动执行器(直行程

浙江诚业阀门执行器有限公司是一家致力于研发、制造气动执行器及气动控制阀的高新技术型企业。

慕残网

慕残网,慕残网站,慕残交友,慕残交流,慕残论坛,慕残文化,慕残视频,慕残小说,慕残截肢,慕残轮椅,慕残儿麻,慕残征婚,慕残照片,慕残直播

cosama

cosama是一款专门为喜爱二次元的小伙伴们打造的兴趣交流平台。平台内含有大量的高颜值的小姐姐小哥哥们,支持一键语音匹配交友,还有超级多的漫展的资讯。

纵横海域

钓鱼人必看是钓鱼爱好者的门户网站,包括钓鱼技巧,鱼饵配方,鱼类等大量钓鱼知识,也是钓鱼爱好者网的家园。

苏州卫生间隔断

苏州恒亮隔断厂家是一家专业生产卫生间隔断,洗手间隔断,移动手机柜,厕所隔断,整体衣帽间及橱柜等的厂家,吴江、昆山、常熟、张家港、太仓等地均可上门免费测量沟通

FoxJK工作室

FoxJK工作室专注于互联网应用开发,帮助您利用互联网创造价值。

全局底部横幅