ChatGPT CEO 张朝明 做不跟 对话圆代码 用更少的数据达到更好的效果 对抗的企业大模型 (chatgpt官网)

文章编号:40858 资讯动态 2024-12-03 小样本行业knowChatGPThow

对话圆代码 CEO 张朝明:做不跟 Chat 对抗的企业大模型,用更少的达到更好的效果

通过统一的自然语言指令调用大量知识,ChatGPT 改变了人与 AI 交互的方式,并将进一步改变更多软件的交互模式和底层架构。

例如,现实生活中,各行各业都与海量的数据处理有关,比如把企业的季度营收数据填进报表中,记录证券市场交易数据和市场趋势波动,处理保单医疗图文数据等等,但将数据从非结构化的图文信息中抽取、整理出用户需要的信息,往往需要耗费相当的人力和时间。

近日,《连线》杂志创始主编 Kevin Kelly 在接受媒体采访时表示,他很认同一个观点,就是:在未来,人们需要放大自己身上 10% 的技能,因为剩下的 90% 将被 AI 取代。例如,在医疗领域中,AI 特别擅长搜索和分析,可以协助人类医生进行诊断。

业界对大模型的需求呈井喷之势。基础大模型的优势在于它的通用性,通过强大的图文理解能力和交互方式,目标在于追求最终的通用人工智能(AGI),但与此同时,通用大模型在满足阶段性的、细分场景下的 B 端需求上也体现出“牛刀小用”的短板,在工程优化、降低成本等方面有很大的提升空间。

对于这一问题,近日 AI 科技评论与深圳市圆代码互联网有限公司的 CEO 张朝明进行了探讨。

张朝明指出,今天的大模型有非常强的话语权,甚至可以决定一个生态的生死;从资金、技术和人才等角度体系思考,创业公司入场的门槛正在降低。小公司要参与大模型的浪潮,张朝明认为最大的机会还是在 To B 市场上。

“首先,不是去做一个跟 ChatGPT 对抗的大模型,而是聚焦私有化部署,做一个具备行业 Know-How 的企业大模型;第二,ChatGPT 给出的结果是对是错,需要交给专业的人用专业的知识去判断。”

以下是 AI 科技评论和张朝明的对话:

大模型也需要专业知识参与

AI 科技评论:您怎么看小公司在大模型产业变革中的机会?

张朝明: 今天大模型在任意领域的问答生成表现都非常好,但它在需要专业知识的领域问答上还是有不足之处的。专业知识的数据在网上不好获取,训练也就不够充分。

比如保险行业中的核保,关于核保的规则往往很难在公开渠道中获取,这属于保险公司的核心机密,我们只能通过在案例里去学习,因此也就存在不够精准的问题。大模型在专业知识领域大概只能做到百分之六七十的准确率,外行人看着可能觉得效果不错,但在内行人看来是无法使用的。

在行业里,95% 是一个生产标准。什么意思?也就是说做到 80% 也好、70% 也好,对生产环节而言没有区别。行业的判断标准之所以是 95%,是因为人的准确率大概在 92% 到 98% 之间,95% 刚好是个中位数,差额的几个点默认是人为也会出现的损失,这是一个容忍度的问题。而越在生产环节,对模型效果准确率的容忍度越低。

在 To C 的场景里,比如娱乐行业、泛娱乐场景,我们用 ChatGPT 聊天、写文章、生成图画、写文案,达到 60% 就觉得效果非常好、很满意,但进入金融行业或其他一些行业,没有 95% 准确率,基本上可认定为它没有任何意义。因此在生产环节里,模型的生成是容忍度非常低、但精度效率要求非常高的一件事情。

我们能看到的一个趋势是,大模型在 To C 方面很难超过 ChatGPT,这是由 To C 特殊的环境决定的,当一家中国企业做出一个 ChatGPT 后、美国人会不会使用,这是个很重要的问题,这也从语料、用户数量等等方面决定了国内厂商的模型很难达到 ChatGPT 的水准,但中国人自己使用是可以实现的。我认为 ChatGPT 和以前的淘宝搜索等不一样的地方在于,它是跨语言的。以前在淘宝上想使用英文搜索、或在谷歌上使用中文,都存在语言问题,但 ChatGPT 很好地处理了跨语言的问题。

因此,最大的机会还是在 To B 的市场上。

首先,不做一个跟 ChatGPT 对抗的大模型,我们看到的市场是在私有化部署上,具备行业 Know-How 能提供专业知识结果的企业大模型。私有化部署解决的是两个问题,一个是数据隐私的问题,这是私有化部署的核心,另一个则是专业性,所以这个大模型用户要自己训练;ChatGPT 给出的结果是对是错,需要通过人专业的知识去判断,且无法矫正数据的准确率,并不是将专业知识灌进去,就可以得到专业的结果,因此,企业也需要训练自己的大模型。

AI 科技评论:用小模型来实现 95% 的生产标准和用大模型来做,思路差异是什么?

张朝明: 它是两个概念。小模型的优势是,它是在专业领域里一定是超过大模型的,知识图谱对知识的提炼和数据的获得,都属于小模型的优势,而大模型的优势在于它 60% 左右的通用性。比如说我想写一篇调查报告,写一个调查报告框架描述这件事、肯定是大模型写的好,但里面数据的填入是小模型更专业。所以这件事情需要大模型配合小模型来完成。

AI 科技评论:大模型配合小模型来完成,这么做的核心逻辑是什么?

张朝明: 在大模型还没有起来之前,人们很难看到行业知识图谱背后的价值,只看到了完成它所需要付出的巨额成本。直到大模型火爆后,知识图谱成为了生成报告的数据内容,可以为多轮问答提供支持等等,才展现出它的价值。

从商业逻辑上看,在仅用小样本就能完成一个行业知识训练的情况下,使用几个亿、几十个亿的成本来训练行业知识的人、即便将这部分成本平摊到各个业务环节中,也肯定是赔钱的。核心的逻辑就在于,知识整理、储备整理和这个成本是多少?而这件事情过去很少有人去做。

过往知识图谱很多只能售卖一次,但好的商业模式应该具备可持续的续费能力。小模型的问题在于它构建知识图谱的成本太高。当一个做小模型的公司,构建知识图谱需要花费高达一两个亿,就又回到了不挣钱这件事。而大模型提供的能力是,写文章的时候让你怎么写得更优美、问答更通顺,而核心的知识来源一直没有解决。也就是说,无法使用大模型来指导工作,因为成本太高了。

为此,圆代码之所以能够极大地减少成本开支,是基于我们从小模型时代就基于自研技术、所提出的核心抽取模型。通过核心抽取模型所具备的复杂语义抽取能力,可实现用小样本解决构建知识图谱的成本问题。

AI 时代需要新的“操作系统”

AI 科技评论:圆代码所做的是提供基础大模型,还是帮助客户训练大模型?

张朝明: 我们提供的是一套基础的东西。前几年零代码特别火,但其大家都非常清楚它的价值有限。在我看来,它并不是一个跨时代、变革的产品,而只是在原有生态体系下减轻工作量的一个工具,难以使用它跨任何行业去做无代码,但现在 AI 我们认为它已经是一个全新的生态。

PC 时代是操作系统为王,到互联网时代浏览器成为了入口、入口为王,再到移动互联网时代又是操作系统(iOS 和安卓)为王,发展路径十分清晰,非常简单的道理是、操作系统没有强势地位就会被剥削掉。

因此我们认为,大模型跟零代码的区别就在于,大模型一定是个基础设施,有非常强的话语权,甚至可以决定一个生态的生死。我们想做的就是一套操作系统,任何玩家都可以用,我们把这套东西提供给企业,企业的人不需要会编程,而是只要会业务、把他的业务数据放到这套东西上就可以使用,任何领域的人都能非常简单地完成相应的工作,这是我们对这套“操作系统”的定义。

比如一个公司要做研报解析,需要派 100 个人完成这件事,现在交给了 AI 公司,但如果 AI 公司也需要用 80 或者 90 个模型工程师来完成这件事情时,那么它所发生变化很小,赔钱的人从原来的公司变成了 AI 公司,这是一个核心的问题,只有解决了它,AI 公司才能够是赚钱的。

解决问题的关键在于,怎么通过使用我们所提供的这套操作系统,让 AI 公司仅需要用 1 个模型工程师和算法就能把问题解决到 95% ,这才是有价值的。

AI 科技评论:圆代码目前客户群体主要是哪些行业?

张朝明: 目前我们只聚焦教育和医疗保险两个行业。

以医疗为例,圆代码做的主要对病例报告的解析,但我们不对影像报告的内容做解读,而是解析影像报告解读出来的文字内容。这部分需求放在医疗行业里,很难看到它的生态,但保险行业对这部分内容的需求很大。用大模型做医疗的事情,把保险行业的需求平移、解决保险人员对报告数据的需求问题。

跟银行不同,银行大多数的数据都是结构化的,因此在日常的运转过程中对数据解析的需求并不大。银行在正常运转下,使用 IT 软件就能处理 90% 左右的事情,剩下 10% 是由人在处理,例如贷款审核等等,因此报告解析在对应的工作内容体量中非常少。而保险公司从一开始就是人为处理的事情居多,其业务内容中人为占比达到 90% ,AI 只支持 10% 的信息存取、数据的流转,根本原因是,二者的数据源不一样,一个就是结构化的数据,一个就是非结构化的数据。

当 AI 巨大变革来临,或许银行在审核环节也会有变革,但其绝没有 AI 对保险行业的影响直接。

AI 科技评论:有了体检报告和这个表格之后的话,圆代码会对数据进行解析,那是否会进行下一步的分析处理?

张朝明: 我们不进行下一步的分析处理,因为能处理这些数据的人全国能找出来不止 1 万个。但是能将这些数据它进行结构化、给到这 1 万个人的公司或机构很少。

当今天保险行业需要处理医疗的数据内容,通过人工来处理报告的数据输入、往往需要花费一天时间,结构化成本非常高;而借助我们的模型和平台、可以实现秒级速度迅速完成资料的结构化,这就是我们的技术实力。

AI 科技评论:数据样本的问题怎么解决?

张朝明: 举个简单的例子,医疗行业的体验报告样式各不相同,当使用 AI 模型对体检报告进行结构化处理,几万篇同一模板格式的报告数据、对圆代码的技术研究作用不大。当体检报告样式有十几万种,要将这十几万种报告都找齐、再进行模型识别训练,这件事也并不现实。此外,如保险等此类隐私数据,我们也很难通过网络途径获取,隐私数据禁止买卖,上述均是十分现实的情况,如果问题无法解决,很难进行后面的训练。

对此,圆代码的思路是,在找不到一千份、一万份前提下,我们能否找到二十份小样本数据,基于二十份数据加上我们的技术,将适用于整个行业的模型训练出来,把图文信息转化为结构化数据,走自研底层技术、用更少的数据达到更好效果的模式。

小公司创业能做、但难度很高

AI 科技评论:小公司想做大模型创业,今天还有机会吗?

张朝明: 有机会,但也很难,看的就是谁先能跑出来。

今天小公司想做大模型创业,我觉得其创业门槛相比小模型时代已经极大地降低了,但同时我们也要看到它最终能做成功的难度非常高。非常难的原因在于,首先一定需要有极强的科研能力,这对创业公司来说要在技术和人才上迅速拉平需要非常大的成本,这是第一点。

第二点,在现在这个情况下,不管做大模型也好、做小模型也好,一个公司手里如果没有四五十块显卡,连模型都跑不起来。显卡的投入轻易在几百万、上千万,这也意味着,一笔投资两三百万的种子轮融资,难以支撑一家企业购买硬件设备的钱。

可以说,上述两个问题就已经把绝大部分的创业公司都杀掉了,所以我认为,当前创业公司已经很难能够跑出来,在这个纯技术的赛道上,窗口已经关闭了。

AI 科技评论:AI 公司和 “AI+”公司的区别在哪里?

张朝明: 区别在于 AI 为二者的服务、业务提供了哪些方面的能力。很多 AI 大模型的创业公司会使用开源模型,在开源模型上建模,但我们要看它建的是哪种模。

举个例子,做 AI 的公司把证券公司需要的数据给到证券公司,使用了它在 AI 上的能力来解决证券公司的人的需求,这叫做 AI 公司;而使用 AI 能力解决证券问题,体现的是公司在证券方面的建模和分析能力,这种我们称之为 AI +证券公司。大多数做 AI 公司会采用开源的解法来解决一个行业的具体问题,但它的核心能力是在金融建模上的能力,而并非 AI 建模上。

AI 科技评论:做什么模型跟细分行业的相关性大么?

张朝明: 在大模型之前,我们做的是行业通用小模型,即对任何文本都可以进行非常结构化的处理。比如律师怎么看合同、想从哪些层面来使用数据等等,这些问题都可以完成。再比如医院的体检报告,通过我们的模型,可以把所有的数据都提供给客户去做任意的筛选分析,也可以向企业提供定向化数据。

AI 科技评论:它跟行业垂类大模型的区别在哪里?

张朝明: 垂类大模型并不是针对具体某一个细分领域,它解决的也是行业性的问题。以医疗病例和体验报告的结构化问题为例,假设一家做糖尿病垂类大模型的公司,我可以输入糖尿病病人的病情数据、借助糖尿病垂类大模型解决相关的问题,也可以基于通用大模型基础上、就任意一个疾病种类,用同一套技术去解决新的病情。

这是商业模式的设计,而非技术的设计。也就是说,当你解决了数据源的问题,其实并没有解决别的问题。但在我们看来,大模型应该是一种基础技术,并不是说数据加模型的服务,就能够成为一个大模型。圆代码用大模型提供了一种数据处理的方式,最终也并不参与解决具体的行业问题。

正如前面提到的例子,保险行业需要处理好的、结构化的医疗数据,同时他们也拥有大量的优秀的核保人员和理赔人员,这种高级人才在中国并不稀缺,我们做的事情是,把这些结构化数据给到这些专业的人、擅长的人去分析,而不是去做分析的事情。

原创文章,未经授权禁止转载。详情见 转载须知 。

对话圆代码 CEO 张朝明:做不跟 Chat 对抗的企业大模型,用更少的达到更好的效果

全局中部横幅
黄历2023年黄道吉日查询

查黄历网(chahuangli.com)提供专业的黄历查询,万年历老黄历查询2023年黄道吉日,根据黄历选择结婚吉日,搬家吉日,开张吉日,领证吉日,订婚吉日等等。

画舫船

珠海俊捷船艇科技有限公司-画舫船,景区观光船,游览客船,游钓快艇,钓鱼船,房船,执法公务艇,游艇,为用户提供从方案设计、产品生产到售后服务等全方位个性化服务。

北京华德

无锡新立液压有限公司主要经营:北京华德,上海立新,油研电磁阀,YUKEN油泵,YUKEN电磁阀,齿轮泵,叶片泵,上海立新电磁阀,北京华德液压阀,机电设备机械与传动高低压电器PLC与工控液压与工具等。我们一定将客户利益放在首位,保证产品质量和供货周期及各项服务,紧密把握产品信息和行业动态,以市场为导向,以产品为根本,不断改革创新,与时俱进。

经典网名大全

内名网提供经典网名,个性网名,游戏名字,非主流网名,男生网名,女生网名,宝宝取名,公司名字等,为您提供最具个性的网络名字!

海角旅游网

海角旅游网由深圳市运通国际旅行社有限公司创办运营于2004年,获得国家旅游局特许旅游经营资质,是一家致力于提供马尔代夫旅游、普吉岛、苏梅岛等海岛旅游的旅行服务提供商。20年来,我们在泰国、香港、马尔代夫、巴厘岛等地区建立了地接服务网络,始终如一为上万家庭的旅途提供保姆级、管家式的旅游服务,深得消费者的信任与喜爱。

长裕玻璃

烟台长裕玻璃有限公司(以下简称“长裕玻璃”)成立于1999年1月1日,生产基地位于烟台福山经济开发区,占地600余亩,一、二期项目6座窑炉,18条生产线已建成投产,年产成品玻璃50万吨,三期投产后预计产能将达到80万吨以上。

江苏盛矽电子科技有限公司002

江苏盛矽电子科技有限公司是一家集科研、生产、销售为一体的国家高新技术企业。公司结合实际生产需求,立足于自身发展优势,致力于打造千级无尘生产车间及公用系统、研发中心、检测中心等配套机构。

周公解梦大全查询

周公解梦大全查询是中国古代流传下来的一种解梦方法,起源于周朝时期,由著名政治家和文化人物周公所创立。周公解梦通过象征和符号的方式,对梦境中的各种元素进行解读。

心理咨询师证怎么考报考条件报名入口在哪里

心理咨询师培训网为考生提供2022年心理咨询师证报名入口、报考费用、考试时间、报名指南、考试题库等信息,是心理咨询师培训考证一站式服务平台。

全球采购网

全球采购网(globalbuy.cc)是汇集全球企业供求信息的B2B电子商务网站和B2B电子商务平台,免费为全球企业提供发布供求信息、企业信息、招商加盟、商业服务、行业展会、人才招聘等服务的B2B电子商务网站和B2B电子商务平台,做全球好生意,就上全球采购网。

新侨光电

新侨激光是一家专注于研制、开发和生产于一体的CO2激光器及其核心部件的现代化企业,也是国内目前单类单品规模最大、品质最好,最具稳定性中功率二氧化碳玻璃激光管厂家,公司推出的800W中功率二氧化碳玻璃激光器属于国内首创,填补了国内单品市场的空白。依托于华中科大拥有目前国内最好的技术研发团队和经验最丰富的工艺团队,产品性能相对于同类厂家更佳,具备很大的竞争优势。公司的主要产品有:300W、450W、600W、800W等中功率激光器。

幂学教育

幂学教育全新推出全日制会计专业硕士辅导课程,会计专业硕士考研资料,会计硕士考研分数线,mpacc复试分数线,会计硕士招生院校等信息,2015年会计硕士考研

全局底部横幅