大模型最新突破帮科学家读论文 AI 小菜一碟 (大模型 ai)

自人类迈入信息时代开始，信息资源总量越来越多，信息过载的现象非常严重。

英国学者带姆·乔丹曾说：“拥有太多信息使信息的利用变得不可能。” 美国工程师 Vannever Bush 也观察到信息过载的情况，在上个世纪就提出通过计算机来解决日益庞大的信息量问题。

Meta AI 新近推出的语言大模型 Galactica，正是在这样的背景下诞生。

由于语言模型可以潜在地储存、组织和推理科学知识，所以语言模型可以作为一种工具帮人类处理大量的信息。例如，语言模型可以在一个文献训练中发现不同研究中潜在的联系，并让这些见解浮出水面。Galactica 通过自动生成二次内容来整合知识，将论文与代码连接起来，为科学研究提供动力。

目前，Meta AI 已开放了 Galactica 所有模型的源代码。

精心设计的语料库

近年来，大型语言模型在 NLP 任务上取得了突破性的进展。这些模型在大型通用语料库上进行自我监督训练，并在数百个任务中表现良好。

但自监督的一个缺点是倾向使用未经整理的数据，模型可能反映语料库中的错误信息、刻板印象和偏见等。对于重视真理的科学任务来说，这是不可取的，未经整理的数据也意味着会浪费更多算力预算。

Galactica 用一个大型科学语料库训练一个单一的神经网络，以学习不同的科学语言。Galactica 的语料库包括了论文、参考资料、百科全书和其他学科资源的 1060 亿个 token 组成，集合了自然语言来源，如论文、教科书和自然序列，如蛋白质序列和化学公式，能够捕捉到 LATEX 并对其进行处理，同时还用学术代码捕捉计算科学。

与其他规模更大、未经策划的大型语言模型项目相比， Galactica 使用的数据集规模更小，而且是经过精心策划的，这很关键，即我们能否在一个经过策划和规范的语料库上制造一个好的大型语言模型。如果可以，我们就能通过设置语料库的内容，更有目的性地设计出大型语言模型。

研发者们主要通过专业化标记来设计数据集，这会形成不同的模态，例如：蛋白质序列是根据氨基酸残基来写的。研发团队还对不同模态进行了专门的标签化。在处理好了数据集后，研发者们在 Galactic 的解码器设置中使用了 Transformer 架构，并进行了以下修改：

GeLU 激活——对所有模型的尺寸都使用了 GeLU 激活；

上下文窗口——对所有的模型尺寸都使用了 2048 长度的上下文窗口；

无偏差——遵循 PaLM ，不在任何密集核或层规范中使用偏差；

学习的位置嵌入——对模型使用学习的位置嵌入，在较小的尺度上试验了 ALi Bi ，但没有观察到大的收益，所以研发者们没有使用它；

词语——使用 BPE 构建了一个包含 50k 个标记组成的词汇表，词汇量是由随机选择的 2% 的训练数据子集中产生的。

实验效果

研发者们还对大型语言模型作为科学模式和自然语言之间的桥梁的潜力进行了初步调查，展示了 Galactica 可以通过自监督来学习 IUPAC 命名等任务。他们发现，增加连接自然语言和自然序列的数据及数量和大小可能进一步提高模型的性能。

研发者们认为语言模型有更多潜力承担目前人类所擅长的事情。

而且为了考察 Galactica 吸收知识的情况，研发者们还建立了几个知识探针的基准，并用于确定语料库内的知识差距，并告知如何确定语料库内的知识差距和迭代语料库。

另外，Galactica 在推理方面表现十分出色，在数学 MMLU 上的表现优于 Chinchilla 41.3% 至 35.7%，在 MATH 上的 PaLM 540B 得分分别为 20.4% 和 8.8%。

AI 大模型最新突破：帮科学家读论文，小菜一碟

在经过四个 epoch 的训练之后，最大的 120B 参数模型从第五个 epoch 才开始过度拟合。

AI 大模型最新突破：帮科学家读论文，小菜一碟

尽管没有接受过一般语料库的训练，但 Galactica 在 BIG-bench 上的表现优于 BLOOM 和 OPT-175B。根据评估，Galactica 的毒性也明显低于其他语言模型。

AI 大模型最新突破：帮科学家读论文，小菜一碟

Galactica 犹如自动驾驶

Meta AI 发布 Galactica 后，在 AI 领域引起广泛注意，并收获了一众好评。

yann LeCun 评论： 这个工具（ Galactica ）于论文写作而言，就像 辅助 驾驶之于驾驶一样，它不会帮你自动写论文，但它会在你写论文的时候大大减轻你的认知负担。

AI 大模型最新突破：帮科学家读论文，小菜一碟

太神奇了！Galactica 甚至可以针对某个领域写评论，推导 SVM ，告诉我什么是线性回归算法！只是生产内容的长度好像有限制？

AI 大模型最新突破：帮科学家读论文，小菜一碟

真是太神奇了！我只是用这个来帮我写“选择性注意研究”评论——它看起来很不错，也许下一步它就可以产生真正的想法！

AI 大模型最新突破：帮科学家读论文，小菜一碟

50 多年来，人类获取科学知识的主要方式一直是通过存储和检索，信息的推理、组合、组织无法依靠机器，只能通过人的努力完成，这导致知识吞吐量存在瓶颈。在 Galactica 的实践中，研发者们探讨了语言模型可能如何破坏这种旧的形式，带来人与知识的新接口。

从长远来看，语言模型的上下文关联能力可能会给搜索引擎带来显著优势。在 Galactica 的实践中，研发者们还证明语言模型可以是一个精心策划的知识库，执行知识密集型的问答任务。

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

版权文章，未经授权禁止转载。详情见转载须知。

AI 大模型最新突破：帮科学家读论文，小菜一碟

谷普下载提醒您

本文链接：http://www.gpxz.com/article/2196d14fdcc0630d02ce.html

上一篇：周志华等等China高文大牛出席2022IJCAI张正

下一篇：宗成庆IEEE姬水旺2023Fellow宋厚冰等入选欧

军事频道

爱奇艺军事频道及时披露热的军事新闻头条视频，包含军事热点、新武器、国防等热门视频，另有热门军事节目、军事报道等在线观看。内容类型具体有军事时事热点、武器知识、兵器讲解、军事历史、航空航天、战争、国际军情、国内军情、台海军情等。拥有《军情解码》、《军情直播间》、《海峡新干线》、《沙场》、《点兵》等军事热门节目。

电影视频 2024-09-15 01:50:50

美食台的所有菜谱视频

这里有所有篇，美食台的菜谱和视频，以及所有的故事

电影视频 2024-08-17 00:39:29

蚌埠木箱

安徽成双包装有限公司是一家专业从事各类木质、纸质包装企业，专业生产各种钢带箱、出口木箱、国内木箱、出口托盘、国内托盘、珍珠棉、蜂窝箱、纸护角等产品。

企业品牌 2024-07-07 18:16:57

宿州鼎元园林石业

电影视频 2024-08-17 22:29:24

真空和面打粉机

【18678066785】山东诸城市春秋食品机械有限公司,产品分为真空和面打粉机、斩拌机、冻肉绞肉机、真空拌馅机、制冷真空滚揉机、定量注馅机大类。产品货真价实,真材实料！

电影视频 2024-08-18 01:03:16

北京通联天地科技有限公司

北京通联天地科技有限公司成立于2002年10月，注册资本1000万，是一家专业的移动通信增值服务提供商，也是中国首家专注于向普通百姓提供医疗卫生信息咨询服务的专业公司，是工信部下进行大众中高端医疗服务咨询的公司，拥有强势运营商的优势资源。

下载资源 2024-08-18 14:58:09

www.cqnewsw.cn―文化网站门户媒体

新华文化网（www.cqnewsw.cn）是文化网站,以文化,城市文化,书画展览,收藏资讯等精品和丰富雅趣,力争为网友提供权威丰富专业的文化资讯,打造具有具有核心竞争力的文化平台。

新闻资讯 2024-08-18 16:43:26

北京连年胜科技有限公司

连年胜贸易有限公司为一家合资企业，致力于精密仪器制造技术和计算机图象处理软件的研发，从事发展尖端光学仪器、精密机械、计算机相结合的（光、机、电一体化）光学仪器开发和销售。

手机软件 2024-11-30 23:32:08

盐池县九道农业科技有限公司

盐池县九道农业科技有限公司，成立于2008年，注册资本800万元，是一家集滩羊养殖、收购、加工、储备、销售、推广、综合服务为一体化的农业企业。2021年8月在盐池县花马池镇北塘新村建设可存栏量5000只以上的盐池滩羊可视化生态智慧养殖牧场1座，现有滩羊存栏量1万只;公司计划筹建可储存1万吨盐池滩羊饲草料加工厂1座;可存栏量5000只以上的盐池滩羊可视化生态智慧养殖牧场7座;可日加工20吨盐池滩羊精深加工厂1座，截止到2021年10月，公司总资产3500万，销售收入9100余万元，其中信息化建设资金投入约1050万元。

商业服务 2024-12-04 13:33:35

河南亲协科技有限公司

河南亲协科技以工业产品设计、销售为主。主营业务为工业控制器、物联网产品、工控仪表的开发与销售。河南亲协科技有多名技术强、经验丰富的设计工程师，专业敬业，能刻苦攻关，能设计出稳定可靠的工业产品。安控电子以为中国电子工业的发展做出一点奉献为终身目标，立足郑州，服务全国，奉献光热，多出精品。四年来，公司已经为全国几十家中小企业提供了定制化的产品开发服务，产品应用于各行各业。

网络应用 2024-12-22 00:52:23

北京安熠健康

北京安熠健康，北京好安森糖尿病治疗仪体验中心。好安森糖尿病治疗仪，发明名称：一种糖尿病治疗仪，申请号/专利号：2019219746568。专为2型糖尿病（二型糖尿病）及并发症的辅助治疗而研发的快速控糖利器。无创无痛、无副作用，适合糖友在家庭长期使用，家庭控糖新选择。

健康医疗 2025-02-01 23:46:37

花园工具

浙江省永康市园林工具有限公司主要生产各种园林工具、剪刀，具有十多年的生产经验。公司拥有一套完整的生产流水线，先进的生产设备和一批优秀的技术人员。

查询工具 2025-02-03 01:00:40

刚需 2023年出货量预计同比增长18.6% 智能门锁走向 (刚需2023年建议买房吗)

9月25日消息，据IDC咨询官方公众号发文报道，2023年上半年中国智能门锁市场出货量为368万台，同比增长13%，IDC认为，出货量增长的原因主要是由于产品功能升级，进而使智能门锁逐步契合用户对家庭入户安全性与便捷性的诉求，从而激发了智能门锁市场需求的释放，IT之家发现，IDC据此预计，2023年中国智能门锁市场全年出货量将达到83...。

2025-02-02 19:07:32

禾小树麻辣烫加盟费多少 (禾小树麻辣烫好吃吗怎么样)

麻辣烫不仅好吃而且价格比较优惠，不仅不会给消费者带来多大的心理压力和经济负担，由于市面上麻辣烫品牌出现的越来越多，如今消费者也更容易挑选到自己喜欢的口味，禾小树麻辣烫十分注重提供给消费者的味道，同样也是一家在一年四季中没有销售淡季的加盟项目，禾小树麻辣烫加盟费多少，这个问题让很多人都想前去咨询，禾小树麻辣烫加盟费麻辣烫品牌禾小树不仅在...。

2025-01-31 17:18:18

加盟三个先森的韩式炸鸡有市场吗 (加盟三个先森炸鸡怎么样)

餐饮市场上出现越来越多的特色美食产品，每种产品在价格方面、营养方面各不相同，为广大食客带来更大的选择空间，三个先森的韩式炸鸡是大名鼎鼎的美食品牌，采用自主研发的技术打造出口感正宗、营养健康的炸鸡产品，在价格方面不高，吸引到越来越多新老顾客前来购买，也吸引到一些创业者的关注，大家想要了解加盟三个先森的韩式炸鸡有市场吗，加盟三个先森的韩式...。

2025-01-16 01:17:23

谷歌无人车早期团队为什么纷纷出来创业了答案令你意想不到 (谷歌无人汽车)

雷锋网消息，美国当地时间2月13日，大众汽车宣布将与Mobileye联手布局未来自动驾驶系统，从2018年起，大众旗下车辆将装配Mobileye基于摄像头的测绘和定位技术，这些配备Mobileye传感器系统的数以万计的车辆，将在未来成为实时数据的收集和共享终端，而大众也会与Mobileye共享采集到的数据，为需要海量、实时数据的自动驾...。

2024-12-10 00:43:09

他们从无人区探索走到计算的黄金时代致敬传奇中国并行处理四十年 (从无人区开始小说)

时代造英雄，或英雄造时代，是历史记录中的一个经典，耦合，问题，如同，先有鸡还是先有蛋，的讨论般，奇人与奇世的关系往往难解难分，但当我们着眼于现代科技史的变迁，这个吸引思辨学家数千年的哲学问题又往往能够得到一个如公式定理般的答案——人才先于技术，更直接点，就是先有创新人才的出世，而后才有科技传奇的诞生，近十余年来，人工智能的突破离不开算...。

2024-12-03 19:53:03

他山科技创始人马扬触觉传感芯片是机器人必经之路 (他山科技创始人简介)

我们都没做过芯片，但我们觉得这事必须要做出来，2016年，第一波机器人浪潮翻涌而来，马扬发现，触觉传感器是一片被忽视的蓝海，对机器人而言，触觉传感器能让机器人像人一样，通过触觉感知物体形态、材质、压力等信息，机器人一旦要执行具体任务，不可避免要与物体接触，触觉在此时起到重要作用，既然触觉传感器如此重要，马扬与另外两位联合创人孙滕谌...。

2024-11-30 15:53:29

发表在投影固件2022，4，413，28极米H3S固件最新V2.14.264版是目前极米H3S最新的固件版本，2022年4月，，此版本更新了部分新的功能，还发布了全新的极米用户协议，如果你的极米H3S固件存在问题，可以尝试下载固件包进行刷机，下面分享极米H3S固件最新V2.14.264版并附带极米H3S的刷机教程，极米H3S固件最新V...。

2024-11-28 13:52:55

同洲飞看K1通过U盘安装软件教程 (同洲飞看盒子)

前言，下面为大家分享，同洲飞看K1机顶盒安装第三方软件看电视直播教程，这款盒子可以直接安装第三方软件，不受任何限制，具体方法如下，一、首先从电脑里下载好当贝市场apk，点击立即下载，并复制到U盘；二、将U盘连接机顶盒的USB接，然后打开同洲飞看K1机顶盒主界面，选择上方菜单栏，用户，；三、进入后选择，家庭多媒体，，然后打开U盘设备，将...。

2024-11-25 14:00:01

海信电视通用教程通过U盘安装软件教程 (海信电视家用实用型)

01、将当海信版贝市场安装包拷贝到U盘中，解压后的两个apk都要装进U盘02、打开海信电视，设置，通用设置，商场模式，，将商场模式开启03、将U盘接入电视，打开，我的，我的应用，媒体中心，，再打开U盘，找到当贝市场安装包04、打开后，选择当贝市场点击安装即可完成...。

2024-11-25 13:18:24

俄将回应若美准许乌用远程导弹打击俄纵深佩斯科夫 (俄国防部回应美国)

乌克兰危机2022年2月更新后，美国等西方国度向乌提供少量武器装备，且重型武器和先进武器越来越多，关于美国或者进一步解除乌克兰经常使用远程武器的限度，俄方11日作出了最新回应，俄罗斯总统资讯秘书佩斯科夫11日示意，美国方面或者曾经经过了准许乌克兰经常使用远程导弹打击俄境内指标的关系选择，目前正经过媒体透显露一些信息，假设美国准许乌克兰...。

2024-11-13 07:50:40

荣威RX9及2023款iMAX8的引见 (荣威rx9价格及图片大全)

荣威RX9及2023款iMAX8的引见上汽荣威发表，，家享大6座SUV，全新荣威RX9及，7x24温馨移动家，2023款荣威iMAX8正式上市，全新荣威RX9共推出4款车型，官网指点价17.58万元—24.38万元，2023款荣威iMAX8共推出5款车型，官网指点价18.58万元—25.58万元，颁布会上，上汽荣威携全新荣威RX9与2...。

2024-07-07 13:37:54

金龙海狮15座面包车驳回什么刹车系统 (金龙海狮15座)

前碟后鼓式的刹车系统，经过查问丰田官方得悉，丰田金龙海狮15座面包车驳回了前碟后鼓式的刹车系统，婚配ABS防抱死制动系统，EBD电子制能源调配系统，大大优化行车的安保性，金龙海狮发起机冷车异响您要问的是金龙海狮发起机冷车异响的要素是什么吗，要素如下，1、气门间隙过大或过小，造成气门不反常封锁或关上，从而发生异响，2、发起机进行时，气门...。

2024-07-06 16:02:05

文章推荐

投影仪对比度越高越好吗 ANSI对比度和FOFO对比度区别一览 (投影仪对比度越高越好吗)

投影仪作为新兴的大屏设备，是众多用户居家观影的新选择，在购买投影仪时，对比度也是部分用户考虑的因素之一，那么，投影仪对比度越高越好吗，产品详情页提到的ANSI对比度和FOFO对比度区别在哪，下面我们就来详细看看，投影仪对比度是什么，投影仪对比度指图像当中明暗区域最亮的白和最暗的黑之间不同亮度层级的测量，对比度比值越大，说明投影画质从黑...。

2025-02-02 18:20:21

资讯动态

五粮玉酒代理难不难需要哪些条件 (五粮玉酒代理怎么样)

白酒作为我国传统的饮品种类，几乎每家每户有会购买，因此白酒在市场中一直都保持着不错的销量，不少创业者看到了白酒行业所具有的商机，产生了加盟其中的想法，五粮玉酒是白酒行业中口碑不错的品牌，自2018年在四川省诞生以来，已经在白酒行业中稳定的发展了6年的时间，凭借着不错的酒水品质，赢得了各地消费者的青睐和认可，那么五粮玉酒代理难不难，需要...。

2025-01-31 21:57:15

创业加盟

亲爱的创意韩国料理加盟费多少 (亲爱的创意韩国料理老板)

随着一股韩国风的传入，韩国的美食也在国内的市场中受到了消费者的信赖，现在市面上还出现了很多韩式料理的店面，店内的就餐环境好，还会有丰富多样的韩式的料理，食物都是非常新颖的美食，还会有独到的制作手法，受到了广泛的消费者的信赖，亲爱的创意韩国料理就是一个实力雄厚的餐饮品牌，还吸引了很多的创业者，一些创业者就想要了解，亲爱的创意韩国料理加盟...。

2024-12-21 16:46:19

创业加盟

抖音怎么设置打字自动推荐表情包 (抖音怎么设置字幕)

抖音APP作为国内最热社交平台之一，相信很多伙伴都有体验过，大家在这里不仅能观看各种趣味视频，了解国家时政，同时自己也能创作内容获取收益哦，那么你知道抖音怎么设置打字自动推荐表情包吗?下面就是小编带来的介绍，你可以跟着学习一下哦~...。

2024-12-02 20:03:35

技术教程

蚂蚁金服十四郎 (蚂蚁金服p12)

2019年12月19日，蚂蚁金服董事长井贤栋宣布了蚂蚁金服的组织架构调整，其中，蚂蚁金服总裁胡晓明接任CEO一职；CTO程立出任阿里巴巴集团CTO；副CTO胡喜升任为蚂蚁金服CTO，并向胡晓明汇报，本次调动于蚂蚁金服而言意义非凡，尤其是，80后，胡喜的上任，使得蚂蚁金服的技术管理团队更加年轻化，成立已14年的蚂蚁金服，如今已经成为全球...。

2024-11-30 19:52:52

资讯动态

大模型最新突破 帮科学家读论文 AI 小菜一碟 (大模型 ai)

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

相关文章

文章推荐

大模型最新突破帮科学家读论文 AI 小菜一碟 (大模型 ai)