开放代码又如何资源集中成本昂贵大规模语言模型的民主化越来越难 (开放原代码许可)

5月初，Meta发布了一个可以执行多个不同任务的大型语言模型：Open pretraining Transformer (OPT-175B)。在过去几年里，大型语言模型（large language model，LLM）已经成为人工智能研究的热点之一。

在OpenAI发布包含1750亿参数的深度神经网络GPT-3之后，就引发了一场LLM的「军备竞赛」，OPT-175B是这场竞赛的一个最新参与者。GPT-3已经表明，LLM可以无需额外训练就能执行许多任务。后来，微软将GPT-3集成到它的几个产品中，不仅展示了LLM在科学研究上的前景，也展示了LLM在商业上的应用潜力。

而OPT-175B的独一无二性在于Meta对「开放」的承诺，正如这个模型的名字（OpenXX）所暗示的那样。Meta已经向公众提供了这个模型，并且公布了训练和发展过程中的大量细节。在Meta AI博客上发表的一篇文章中，Meta将OPT-175B的发布描述为「大规模语言模型的民主化访问」（Democratizing access to large-scale language models）。

Meta这种朝着透明化方向的发展是值得称赞的。然而，在大型语言模型的激烈竞争下，民主化已经变得难以实现。

1750亿参数的OPT

开放代码又如何？成本昂贵、资源集中，大语言模型的民主化越来越难

Meta发布的OPT-175B有一些关键特征。它包括了预训练的模型以及需要训练和使用LLM的代码。训练神经网络比运行神经网络要消耗更多的计算资源，所以，对于没有计算资源来训练模型的组织来说，预训练模型特别有用。通过减少训练大型神经网络所需的计算资源，它还会有助于避免造成巨大的碳足迹。

与GPT-3一样，OPT也有不同的规模，参数从1.25亿到1750亿不等，参数越多的模型学习能力越强。目前，所有300亿参数及以下的版本都可以直接下载。完整的1750亿参数版本的模型将提供给部分研究人员和机构，只需要填写一张申请表。

“为了保证学术诚信和防止滥用，我们将在非商业许可下发布我们的模型，以专注于研究用例。该模型将授权学术研究人员使用，与政府、民间社会和学术界有关的组织，以及世界各地的行业研究实验室。”

除了模型，Meta还发布了一个完整的日志，提供了大型语言模型开发和训练过程的详细技术时间表。通常来说，经发表论文只包含关于最终版本模型的信息。Meta表示，该日志提供了一些有价值的信息，包括「用于训练OPT-175B的计算量，以及当底层基础设施或训练过程本身在规模上变得不稳定时所需的人力开销」。

Meta：GPT-3不够透明

开放代码又如何？成本昂贵、资源集中，大语言模型的民主化越来越难

Meta在其博客文章中还表示，大型语言模型大多可以通过「付费API」来访问，对LLM的访问进行约束「限制了研究人员去理解这些大型语言模型如何工作以及为什么能工作，阻碍进一步提高模型的鲁棒性和减少模型的偏见和有害性等已知问题」。

这是对OpenAI的一种抨击，OpenAI发布GPT-3只是提供了一种黑箱API服务，而不是将其模型的权重和源代码公开。OpenAI宣称没有公开GPT-3的原因之一，是为了控制有害应用程序的滥用和开发。

而Meta认为，通过将模型提供给更广泛的受众，会有利于研究和预防它们可能造成的任何伤害。

Meta这样描述他们所做的工作：

我们希望OPT-175B将为大型语言模型创建的前沿领域带来更多的声音，帮助社区共同设计负责任的发布策略，并为该领域大型语言模型的开发增加前所未有的透明度和开放性。

大型语言模型的成本

然而，需要注意的是，大型语言模型的「透明和开放」并不等同于「民主化」。训练、配置和运行大型语言模型的而且未来可能还会继续增加。

根据Meta的博客文章，研究人员已经成功地大大降低了训练大型语言模型的成本。他们表示，该模型的碳足迹已减少到GPT-3的七分之一。之前也有专家估计，GPT-3的培训成本高达2760万美元。

这说明，OPT-175B的培训成本仍然高达数百万美元。幸运的是，预训练的模型将避免训练模型的需要，并且Meta表示，将提供「只用16块NVIDIA V100 gpu」来进行训练和部署完整模型的代码库。这相当于一台Nvidia DGX-2，成本约为40万美元，对于资金紧张的研究实验室或单个的研究人员来说，这仍不是一笔小数目。根据一篇提供了更多关于OPT-175B细节的论文显示，Meta使用了992块 80GB A100 gpu训练了自己的模型，比V100明显更快。

Meta AI的日志进一步证实，训练大型语言模型是一项非常复杂的任务。OPT-175B的开发时间表上，充斥了诸如服务器崩溃、硬件故障和其他需要高级技术人员来解决的并发症。研究人员还不得不多次重启训练过程，调整超参数，改变损失函数。所有这些产生的额外费用，都是小型实验室所无法承担的。

民主化的阻碍：权力集中在少数公司手中

开放代码又如何？成本昂贵、资源集中，大语言模型的民主化越来越难

语言模型如OPT和GPT都是基于transformer架构。transformer的关键特性之一，是它能够并行和大规模地处理大型顺序数据(如文本)。

近年来，研究人员已经证明，通过在transformer架构中添加更多的层和参数，可以提高语言任务的表现。一些研究人员认为，达到更高的智力水平只是一个规模问题。因此，资金充裕的研究实验室，如Meta AI、DeepMind （Alphabet旗下)和OpenAI（微软赞助)，都在致力于创建越来越大的神经网络，比如DeepMind最新推出了多模态AI系统Gato。

去年，微软和英伟达创建了一个价值5300亿参数的语言模型，名为Megatron-Turing (MT-NLG)。上个月，谷歌引入了语言模型 Pathways Language Model (PaLM)，这是一个包含了5400亿参数的大规模语言模型。更有传言称，OpenAI将在未来几个月发布GPT-4。

然而，更大的神经网络也需要更多的财政和技术资源。虽然更大的语言模型会有更多新花哨（和新的失败），但它们也会不可避免地把权力集中在少数富有的公司手中，较小的研究实验室和独立的研究人员在大型语言模型的研究上更加艰难。

在商业方面，大型科技公司将拥有更大的优势。运行大型语言模型是非常昂贵和具有挑战性的。像谷歌和微软这样的公司都有专门的服务器和处理器，所以他们能大规模运行这些模型并盈利。对于较小的公司来说，搞出一个自家版本的LLM（如GPT-3）的开销太大了。正如大多数企业都使用云托管服务而不是建立自己的服务器和数据中心一样，随着大型语言模型变得越来越流行，像GPT-3 API这样的开箱即用系统将会更具有吸引力。

而这反过来又会进一步地将AI集中在大型科技公司手中。更多的人工智能研究实验室将不得不与大型科技公司合作，以获得研究资金。这将赋予大型科技公司更大的权力来决定AI未来的研究方向（与他们的经济利益相一致的方向）。那些没有短期投资回报的研究领域，可能就会成为这其中的代价。

一个底线是，当我们庆祝Meta为LLM带来透明度的时候不要忘记，大型语言模型的本质仍是不民主的，它们只是更多地对宣传它们的公司有利。

版权文章，未经授权禁止转载。详情见转载须知。

开放代码又如何？成本昂贵、资源集中，大语言模型的民主化越来越难

谷普下载提醒您

本文链接：http://www.gpxz.com/article/94c4bd97048065e8d82f.html

上一篇：能让你选择想听到的声音未来的耳机能让你选

下一篇：位CXO3来了场头脑风暴围绕个问题7自动驾驶

55海淘

55海淘(www.55haitao.com)成功登陆新三板，（证券简称：五五海淘证券代码：871840）55海淘网是目前值得信赖的专业海淘站,包括美国主流的海淘网站,详尽的海淘网址大全,更是目前国内早期的中文海淘返利网,让海淘族尽享海淘购物乐趣，55海淘，带你去官网买正品！

网站模板 2024-07-10 15:43:18

首页

Baklib是一款优雅的云端知识库建设平台，企业“帮助中心”全场景解决方案提供商。致力于企业帮助中心设计、产品说明书、常见问题手册、在线知识库、企业文档制作。

网络应用 2024-07-04 14:40:02

找茬小游戏,找茬游戏大全,4399找茬小游戏全集,4399小游戏

4399找茬小游戏大全收录国内外找茬类小游戏、美女找茬游戏、大家来找茬小游戏、找茬游戏下载。好玩就拉朋友们一起来玩吧！

游戏网游 2024-07-03 15:51:14

南京水磨石翻新

南京得得环境工程公司是一家专业石材翻新、石材结晶、大理石抛光、水泥起砂固化处理、水磨石翻新、染色固化地坪，水泥地面打磨的工程公司，电话：18951908373

电影视频 2024-07-06 22:03:42

泰国落地散拼

泰国落地散拼|出发散拼|常规团|私家团|小包团|定制小团

电影视频 2024-07-11 13:30:35

天津市昊天橡塑制造有限公司

天津市昊天橡塑制造有限公司天津市昊天橡塑制造有限公司蝶阀阀座橡胶密封件-阀座,橡胶阀座,蝶阀,蝶阀阀座,橡胶密封圈,D341衬胶阀体,挂胶,中线法兰蝶阀,丁腈阀座。

电影视频 2024-08-17 19:08:32

鼎润云平台

电影视频 2024-08-18 00:00:26

深圳市迈志豪餐饮实业有限公司

深圳市迈志豪餐饮实业有限公司于2001年10月30日成立，是一家专门从事对企事业单位和各社会团体的员工食堂进行承包经营和管理服务的专业性公司。

商业服务 2024-07-11 13:43:44

超声骨密度仪

南京科进致力于超声骨密度仪\检测仪\测试仪的研发、生产与销售，公司旗下的骨密度检测仪类型涵盖国产胫骨\桡骨、韩国进口根骨、便携式、双能X射线等。咨询热线：13382071609

管理咨询 2024-08-18 18:56:14

便携式X射线光谱仪

广州仪德(www.ydjmyq.com)是能量型荧光光谱仪,便携式X射线荧光光谱仪,便携式X射线光谱仪,台式X射线荧光光谱仪,手持式X射线荧光光谱仪,手持式X射线光谱仪供应商,广州仪德精密科学仪器股份有限公司创立于2005年,十三年来坚持服务于国内实验分析领域,欢迎来电洽谈

商业服务 2024-12-05 18:24:09

假负载定制

德阳瑞泰科技有限公司是一家定制生产交流和直流阻性、感性、容性、机架式负载箱的生产厂家。此外,我公司全国接高低压电厂和船厂发电机组、UPS、变压器和假负载带载租赁测试服务。

商业服务 2025-02-02 14:23:33

吉林省东志教育咨询有限公司

专业从事婚姻情感问题咨询疏导、心理咨询、青少年心理成长教育咨询的机构。

管理咨询 2025-02-14 17:23:54

中国象棋软件合集中国象棋app有哪些 (中国象棋软件手机版)

象棋文化深入人心，一直都是有许多的朋友对于提升自身的棋艺有着较高的追求，而这时候就需通过中国象棋app来帮助各位了，在现如今的市面上同类的应用可谓是层出不穷，象棋方面的自然也不在少数，若是朋友们对于此方面较为感兴趣，不如就一起来接着往下看看，1、，象棋大师，这里汇集了超多的热门象棋入门教程，内容丰富的同时也提供了大量的视频讲解，涵盖了...。

2025-02-10 00:39:45

适合小本加盟吗新疆驼奶那拉丝醇怎么样 (小本加盟好项目)

乳制品含有丰富营养价值，长期饮用可以很好地补充身体所需的各种维生素，现在的消费者健康养生意识越来越强烈，因此在乳制品选择方面也有很高的要求，新疆驼奶那拉丝醇一直专注为消费者带去营养美味的驼奶系列产品，严把质量关，在市场上拥有一群忠实顾客粉丝，那么新疆驼奶那拉丝醇怎么样，适合小本加盟吗，新疆驼奶那拉丝醇怎么样公司在产品生产销售过程中，有...。

2025-01-31 18:13:37

5.5元休闲食品怎么加盟 (5.5元休闲食品在哪可以进货)

提到零食，这可真是吃货的世界，其实零食包含的种类有很多，不管是一些饼干、点心啊、零食蜜饯儿、或者是面包蛋糕等各种系列，都是零食中的一种，5.5元休闲食品相信大家都是耳熟能详的，它基本可以说是遍布了城市的每个角落，今天就由小编来简单的跟大家讲一下关于加盟的问题，那么，5.5元休闲食品怎么加盟，5.5元休闲食品在2016年成立，总部是在河...。

2025-01-31 17:35:27

自媒体的价值越分享越赚钱 (自媒体的价值主张是什么)

对于我来说，写作最重要的一点，务必要提供一些价值，而且得真实一些，不夸大其应有的成分，更不想弄虚作假，有时候没办法坚持日更确实是不知道写什么，而且每天时间有限，写不了长篇幅的，这也是提升的难点之一，但，写了一百多篇文章后对我的感悟是，一、最好的学习方式，就是主动输出，这就像为什么你光听课，好像都听懂了，也很简单，但你不去实践，对于做题...。

2025-01-31 01:54:52

采用的 iPhone 6s Touch技术带来了什么 Force (现实中许多小型组织大量采用的)

9月9日，新一代的苹果手机iPhone6s即将发布，一直作为智能手机风向标的iPhone，总是在上市前一个月就引发很多猜测，最大的程度的勾起果粉的求购欲望，尽管，我们依然要承认，目前为止，能够对iPhone造成挑战的手机产品，还并没有出现，但这并不能代表苹果从iPhone5s起到如今的iPhone6s，有了足够的创新，甚至从iPhon...。

2024-12-09 23:20:05

谷歌又推出全新世界模型助力导航继LSTM之父用世界模型来模拟2D赛车后就问你怕了没 360度无死角 (google全)

近年来，世界模型，WorldModel，在机器人、模拟与强化学习中均取得了出色的研究结果，2018年，JürgenSchmidhuber与DavidHa首次以无监督的方式训练世界模型，使模型能快速学习环境中的压缩时空表征，再将世界模型中的特征作为智能体的输入，训练出了一个非常压缩与简单的策略来解决模拟2D赛车等任务，今年2月，Goog...。

2024-12-03 23:55:36

新华视点·提早退休革新如何实施提早多久 (新华视点2021)

新华社北京9月13日电题，提早多久、如何实施——解读提早退休革新文件新华社，新华视点，记者9月13日，全国人大常委会会议表决经过了对于实施渐进式提早法定退休年龄的选择并对外发布，退休年龄详细怎样延，何时开局实施，能不能被迫选用弹性提早退休，新华视点，记者第一时期采访威望专家，梳理政策要点，[要点一，男职工、女干部、女工人区分延至63...。

2024-11-13 08:34:15

怎样下载华为手机助手 (怎样下载华为运动健康app)

下载装置华为手机助手倡导按如下方法，一、Windows系统下载装置华为手机助手，在光盘镜像下载器下载，介绍您经常使用这种方法，1.请经常使用原装USB数据线将您的手机衔接至电脑，2.关上桌面，此电脑，，在设施和驱动器下可以检查到如下图标，关上Hisuite磁盘驱动器，如下图所示，3.双击，华为手机助手装置导游，，弹出如下图，点击，下载...。

2024-07-10 23:16:21

确定了！出名男艺人被判7个月缓刑3年 (出名的定义是什么)

据台媒，炎亚纶2017年经过社交媒体意识未成年的耀乐，双方进而来往、出现性行为，他用手机拍下环节后外流，法院考量他与耀乐达成调停，并已实行局部款项，给予缓刑，因为2日为上诉期限最后一天，检方并未对他提起上诉，因此，炎亚纶获判缓刑确定，此前，台湾士林地方法院5月30日一审宣判，依照，拍摄少年猥亵行为电子讯号罪，等罪，判处中国台湾艺人炎亚...。

2024-07-03 18:55:03

WingetUI下载-WingetUI(Windows软件安装更新工具)v2.1.1免费版

WingetUI是一个非常出色的开源程序，用于Windows使用Windows包管理器winget在WindowsPC上安装、卸载和更新程序。

2023-11-11 12:39:05

【深圳公司注册服务公司黄页】

顺企网深圳公司注册服务公司厂家大全列表，包括深圳市天搏检测技术有限公司、港牌宝商务服务（深圳）有限公司、深圳合泰企业咨询服务有限公司业务部、广东省国瑞企业综合服务有限公司等在内的127家深圳公司注册服务公司厂家的地址电话法人代表和联系电话等信息。2页，当前显示第1页结果，按照产品多少和注册时间排名

2023-10-02 13:33:22

存量房贷降息一周倒计时：已有借款人签协议，利率下调至4.2%|贷款|严跃进|存量房贷利率

存量房贷降息一周倒计时：已有借款人签协议，利率下调至4.2%,贷款,降息,严跃进,存量房贷利率

2023-09-19 01:00:31

文章推荐

共享休息仓共享单车共享汽车共享雨伞...共享马扎 (共享休息舱)

共享单车、共享休息仓、共享汽车...共享雨伞和篮球、充电宝，越来越多的事物扯上了共享经济，这不有媒体爆料，在北京长虹桥公交站出现了共享马扎，并且屁股底下都是码，网友们表示，承包了我的笑点....不用扫码就可以坐啊，马扎是非常方便的一种生活用品，因其具有可折叠的特点，所以易于携带，散步的老人、旅行者、乘车者有很多都喜欢自带马扎，供休息时...。

2025-01-30 18:23:52

网络百科

华为智慧城市可期 (华为智慧城市概念股)

华为近些年闻名遐迩的除了市场份额稳步上升的手机终端业务，还包括，智慧城市，的快速落地，对于此前全球范围内的智慧城市建设，部分人认为，干货不足、概念偏多，在他们看来，智慧城市所谈蓝图与自身的日常生活还有些距离，殊不知，在经过几十年的技术演进后，如今智慧城市已经环绕在人们四周，像空气一样形影不离地存在着，昨天，在德国杜伊斯堡市政府代表团...。

2024-12-09 20:49:26

资讯动态

云启商途·睿享视界 (云启商贸有限责任公司)

3月13日，，云启商途睿享视界，——2021年大华股份渠道合作伙伴大会在杭州主会场及全国各地分会场顺利举办，本次大会吸引了全国2000多家渠道生态合作伙伴参与，分享企业在数字化转型中的探索与实践，尤其是对中小企业市场的洞察和理解，解读市场发展方向，并对渠道业务转型升级深入探讨，大华股份董事长兼总裁傅利泉向与会的全体合作伙伴表示欢迎和致...。

2024-12-04 00:12:50

资讯动态

进口母婴店加盟哪家好成功快人一步天天一族 (进口母婴店加盟排行榜)

由于国产的婴幼儿奶粉、纸尿裤等母婴用品，经常被媒体爆出有质量问题，所以，现在，很多年轻的父母基本上都是购买进口产品，给自己的孩子使用，不少智慧之选者从消费者的这一举动中，发现了商机，决定也开家进口母婴店，但是，他们并不知道进口母婴店加盟哪家好，天天一族，成功快人一步，天天一族，是宁波保税区天天一族电子商务有限公司旗下的品牌，公司成立于...。

2024-12-02 21:55:01

创业加盟

小米10是什么时候上市的 (小米10是什么处理器)

小米10于2020年2月上市，小米公司于2月发布了全新的旗舰手机小米10系列，这款手机是该公司在追求极致性能和高端市场定位上的重要尝试，小米从长期技术研发和创新经验的积累出发，不断精进生产工艺和核心技术，力求为中高端用户群体提供更加优质的产品和服务体验，小米10的发布标志着小米公司在智能手机市场的进一步发展和壮大，以下是关于小米10上...。

2024-11-29 18:12:07

资讯动态

开放代码又如何 资源集中 成本昂贵 大规模语言模型的民主化越来越难 (开放原代码许可)

1750亿参数的OPT

Meta：GPT-3不够透明

大型语言模型的成本

民主化的阻碍：权力集中在少数公司手中

相关文章

文章推荐

开放代码又如何资源集中成本昂贵大规模语言模型的民主化越来越难 (开放原代码许可)