大模型就不够 靓丽 IJCAI2024 大会主席张成奇 对话 克服了幻觉 (大模型不够取代人类思维作文800字)

作者丨王悦 张进

编辑丨陈彩娴

第 33 届IJCAI大会在韩国济州岛圆满结束,为期一周(8.3-8.9)的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者,大会现场的氛围跟 8 月的济州岛天气一样火热,现场的热情氛围昭显了当下人工智能领域的蓬勃发展。

延续了 IJCAI 2023,此次大会最热门的两个领域依然是计算机视觉跟机器学习,有关大模型的话题往往参与者众。此次参会人数将近 3000人,论文提交数量超过 2023 年的 23.8%。

张成奇是 IJCAI 首位华人大会主席,也是进入 IJCAI 理事会的第三位华人,前两位分别是IJCAI 2019理事会主席杨强和IJCAI 2023理事会主席周志华。

张成奇告诉 AI 科技评论,他跟 IJCAI 的渊源要追溯到2011 年,这一年在他的积极参与下澳大利亚墨尔本成功取得了 IJCAI 2017 的举办权。这一届赞助创历史新高,赞助费超 70 万美元,这是与张成奇的努力密不可分的。

更重要的是,张成奇本人在人工智能领域的成就亦不容小觑。

张成奇于 1982 年在吉林大学攻读硕士研究生,从事专家系统方面的研究,而吉林大学是中国最早开始研究人工智能的单位之一。早年,张成奇曾用9年时间做一项研究,最终于1992年在 “国际人工智能杂志(Artificial Intelligence Journal)”上发表了大陆华人中的第一篇AI 期刊文章。根据2024年8月份Google Scholar统计,张成奇的所有文章被引用总数超过33000次,H-Index为70。

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

在从事人工智能和数据挖掘领域研究的 40 多年时间里,张成奇取得了丰硕的研究成果,到目前为止,共发表 300多 篇科技论文,很多论文都发表在顶级期刊。曾于2011年获得新南威尔士州科学与工程(工程和ICT类)奖,并在2011年获得悉尼科技大学副校长卓越研究(领导类)奖。

大会主席张成奇认为,IJCAI 的举办极大地促进了当地人工智能领域的交流,此次 IJCAI 选址韩国相比在其他地方举办韩国参会者多出超 20 倍。

在韩国济州岛举办的 2024 IJCAI 现场,AI 科技评论跟张成奇对话,讲述他首次担任大会主席的感受、本次 IJCAI 的变化以及他对当下人工智能发展、大模型发展的一些看法。以下是对话原文(经过简单编辑):

一、IJCAI 更严格了,但被接收的大部分都是好文章

AI 科技评论:今年各国的参会人数在整体参会者中占比大约是多少?

张成奇:中国参会者大概可以达到参会总人数的 1/3 左右。韩国参会者人数相比在其他地方举办多了起码 20 倍,占总参会人数的1/5左右。IJCAI 选址对当地参会人数会有很大地促进作用,比如 2017 年澳大利亚的 IJCAI ,有 500 多澳大利亚人参加(大约1/4),这次澳洲过来的学者就只有 70 人左右。

AI 科技评论:我们观察到,今年 IJCAI 的很多赞助商都来自中国。

张成奇:是的。从 2017 年起主要的赞助商都来自国内,这次来的参展企业有信也科技,百度、滴滴、华为、美图、OPPO、ViVo、京东,贝式计算等。

IJCAI 从 2017 年开始,专门设置了一个 Sponsorship Officer,之前是我在负责,从去年开始由于涵负责,我来协助。

企业赞助的钱每年都可以资助很多学生,金额可以达到数十万美金,受资助的学生也更愿意在这个会议上投论文,这是一个正循环。

AI 科技评论:组织 IJCAI 的过程中,是否遇到过很大的困难?

张成奇:IJCAI 整体进程推进得较顺利。由于我自己有组织过很多场大型国际会议的经验,对其中的节奏把握有很多经验,可以算得上驾轻就熟。在近30年来,我先后在澳大利亚人工智能年会、亚太人工智能年会、亚太数据挖掘大会、国际数据挖掘大会这些会议中多次担任大会主席。

AI 科技评论:您担任过这么多地区会议、国际会议的华人主席,有什么感受?

张成奇:能够担任顶会主席的人非常少,其中的华人就更少。我之前当过 KDD、ICDM 的主席,这次也担任了 IJCAI 的主席。这一系列主席当下来之后,至少感觉组织事情更有条理了。

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

张成奇与学者在 IJCAI 现场交流

另一个角度来看, IJCAI 是综合性会议,强调涵盖更多、更丰富的 AI 垂直领域,不像 CVPR、ICML 这些只关心一个研究领域的垂直会议。

综合性会议的特点是,文章接收量的范围相对宽一些,但想要办出大名气就比较难。

二、应用大模型要注意“领域的错误敏感度”

AI 科技评论:您怎么看待今天的大模型?

张成奇:大模型叫生成式模型,生成式模型最大的优点是它生成效果很靓丽,“脑子”很发散,像人一样很聪明。但是最大缺点是有幻觉,而且幻觉无法被克服,如果克服了幻觉,那么生成式模型也就没有那么靓丽了。

人的聪明之处在于解决问题,人算 38的平方是算不过计算机的,计算机在这种传统、有标准的东西范围是不会出错的,大模型反而会出错。这就是大模型的优缺点。

AI 科技评论:我们应该如何利用现在的大模型?

张成奇:要注意区分大模型在不同领域的错误敏感度。

举三个例子:

第一个场景,核电站维修完全不能容忍错误,任何概率包括 0.01% 的错误都不能容忍,这种情况的错误敏感度较低;

第二个场景,写诗作画可以随意发挥,写错、做错没有坏的影响,这种情况的错误敏感度就较高;

第三个场景,股票交易可以出错,因为股票没有 100% 赚钱的,只要赚钱超过50% 就可以,这种情况的错误敏感度就是中性。

因此,大模型很发散、很聪明,但是它不保证全部对,也不保证没幻觉。所以这时使用者要考虑不同领域的错误敏感度,中性敏感度只要它正确率超过 50%,是可以被使用的。很多人吐槽幻觉问题,说有幻觉就不能用了。但其实并不是这样,写诗作画、股票交易等领域都是可以用的。

99.9% 的人都是大模型的使用者,很难决定或左右大模型是否拥有幻觉。但我们可以判断各种领域对错误容忍的敏感度,什么领域能用,什么领域不能用。不仅要考虑模型能力好不好,还要考虑是否和对应的领域适配。

但需要知道的是,大模型的幻觉问题不能从根上解决,否则的话它就不是大模型了,也不是生成式了。所以不能只盯着难以被解决的幻觉问题,要扬长避短、趋利避害。

AI 科技评论:在您的判断中,目前阶段有哪些适合大范围应用大模型的领域?

张成奇:导游行业。比如规划一条路线,多绕几分钟没有太大关系,只要别发生危险就可以,所以这个领域容忍度很高。从这个角度开发垂直大模型是值得尝试的。

智能养老也很适合做大模型应用,中国的养老,有两个刚需,分别是健康和饮食。于健康管理而言,需要精准控制吃药的时间、药量、频率等;于饮食管理而言,比如糖尿病的人哪些食品不能吃?身体寒寒的人哪些食物不能吃?食谱怎么给千人千面的搭配?这些是大模型能够帮助实现智能化和个性化的方面。

除此之外,情感陪伴,也可以使用现在的生成式模型来实现,无论是外在的形象、实体陪伴,还是语言、情感的陪伴都也可做得很丝滑。

社交层面,也可以通过大模型匹配到不同的兴趣爱好圈,加入不同的话题。还有运动管理,比如一位70岁老人是走 5,000 步还是走1万步呢?是早晨走,中午走还是晚上走?是分开走,还是和别人一起走?都可以从大模型上去寻找答案。

开发通用大模型无需过度考虑领域问题,但要是做垂直领域大模型,一定要选好领域。

AI 科技评论:大模型发展的下一步趋势是什么?

张成奇:一方面是减少算力,提高效率;另一方面是应用领域会越来越宽。沿着这两个方向改进,都是渐进性的进步,至于之后能不能有 break through,就需要看底层架构有没有突破,需要有像 GPT 这样革命性的变革。

因此,在通用领域上,大模型比 99% 的人都聪明,但是在专业领域中,他们始终无法超越专家。

大模型的技术专家都在研究怎么解决幻觉、怎么提高效率。但还有一个层面,也需要站在普通老百姓用模型的角度看,怎样去把现有的大模型能力更好地发挥出来,怎样能够让技术更普惠人类社会。我认为更多要从上往下走,从现象中将本质抽象出来后,再往下落。

AI 科技评论:具身智能也在今年掀起了一波热度,你认为这是泡沫吗?

张成奇:人的智能大致可以分成感知、认知、行为三个方面。深度学习解决了感知问题,GPT + 深度学习在很大程度上解决了认知问题,而行为智能方面一直没有很大突破,所有机器人控制都是属于行为智能。

现在要做的事,是把感知、认知、行为等多种智能的层面融合起来。早期人工智能为什么没法用?就是因为它感知上不过关,认知层面在前进,但是还没有到达终点,后边有好多东西要做,但也能实现很多工作了。

所以为什么家庭机器人还要需要时间?就是因为他的行为执行还是有难度。现在有了GPT,它的能力会上一个大台阶,这些台阶已经够消化 5 年 10 年了。

AI 科技评论:具身智能下一阶段将如何发展?

张成奇:具身智能这个方向一定能得到长足的发展,原因是现在的智能,不管感知、认知,单独拿出来都是没法用。

AI 科技评论:如何看待 Agent?

张成奇:Agent 原来就是一个方向,很多年了一直火不起来,后来热度到低谷,现在又升上去了。原因是之前对环境的感知判断做得不好,现在环境感知已经提高了很多,剩下需要做好协调工作。

原创文章,未经授权禁止转载。详情见 转载须知 。

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

全局中部横幅
360趋势

360趋势是以360产品海量用户数据为基础的大数据展示平台,可通过搜索关键词,快速获取热度趋势、理解用户真实需求、了解关键字搜索的人群属性。

电脑知识入门基础知识,文员必会的电脑知识

对电脑一窍不通零基础从哪开始学,小白买电脑怎么不被坑,文员必会的电脑常用知识,提高你的工作效率,基础的电脑故障维修方式,如果你对计算机知识感兴趣,欢迎来到电脑知识网!

食品品牌网

食品品牌网是食品行业有影响力的资讯门户网站,为你提供绿色食品品牌,保健食品品牌,有机食品品牌,营养食品品牌,宠物食品品牌等内容。

调压器线圈

浙江红日电源有限公司专业生产防水变压器,墙暖变压器,控制变压器,调压器线圈,环型变压器等,是专业的变压器厂家,公司始终坚持“诚信立业,质量为本”的原则,在未来我们将一如既往.开拓创新,致力于产品质量的不断优化,服务措施更加完善,欢迎来电咨询。

网友推荐必看攻略,旅行社跟参报团

网友推荐必看攻略,张家界旅游官网-湖南张家界大峡谷玻璃桥门票官网预约,天门山风景区门票售票价格,张家界旅行社2,3报团购预订,张家界春节旅游攻略三四五天游旅行网跟团公司旅游参团接待中心服务。

对辊,四辊破碎机,小型双齿辊破碎机,大型液压对辊制砂机价格

河南吉宏机械制造有限公司生产是民用级|对辊破碎机、大型液压双辊破碎机、双齿辊破碎机、四辊破碎机及高效细碎机等破碎设备,对超细粉破碎机厂家电话0371-64087888

福客手游问吧

福客手游问吧是专业分享游戏百科、游戏知识、手游资讯等相关游戏的百科问答

SEO
SEO

迅捷云SEO优化平台立足于江苏常州,主要为全国企业提供SEO推广服务,系统采用多项技术,对网站各大维度进行健康度检测,使网站的排名更快速更稳定。

新商纪

新商纪,聚焦5G、AI人工智能、云计算、大数据等互联网科技驱动下的数字化商业创新及新潮生活,科技不仅是一种社会生产力,更是一种潮越平凡的生活态度。新科技、新商业、新趋势。

正能量的句子经典语录

8号励志句子网提供正能量的句子经典语录以及励志短句霸气的句子,为奋斗打气,为生活励志!精选正能量的励志语录与励志的句子,是您鼓舞您前进的好句子

全局底部横幅