我用GPT (我用gpt编写maya脚本)

听到这段台词，相信很多朋友都会不由自主地接上一句.......

我们是穿梭在银河的火箭队！白洞！白色的明天在等着我们！

就这样~喵~

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

没错，它就是《神奇宝贝》中火箭队每次出场都让人忍不住发笑的经典台词。

1997年上映的《神奇宝贝》已经陪伴了我们二十年之久，给不少80、90后的童年留下了美好的回忆，尤其是那800多只宠物小精灵。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

会放电的皮卡丘、经常酣睡的妙蛙种子、不好惹的小火龙，还有喵喵、超梦、可达鸭。

这些可可爱爱又奇奇怪怪的动漫小精灵让人记忆犹新，相信很多人小时候都幻想过拥有一支属于自己的精灵宝贝。

最近，一位名为MatThew Rayfield的程序员就满足了自己的愿望。他用《神奇宝贝》中的788只动漫形象作为原型，通过AI生成了3000个全新的宠物小精灵。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

而这个AI正是自然语言模型GPT-2.

GPT-2：「精灵制造机」

提到NLP模型，我们印象最深的可能是GPT-3。今年该模型因1750亿超大参数量和超强应用，在各大媒体平台频频刷屏。GPT-2，与GPT-3师出同门，都是OpenAI研发的自然语言处理模型，两个模型最大的不同是它的参数量，GPT-2仅为15亿。

但这并不影响它的应用范围。与GPT-3类似，GPT-2也可以用来写故事、画图表，或者玩国际象棋。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

最近Rayfield受到GPT-2在国际象棋和民间音乐上应用的启发，也想来搞点不一样的事情。

他突发奇想决定用GPT-2来生成全新的宠物精灵形象，结果效果还不错。Rayfield从3000个生成图像中挑选出了6个，如图：

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

emm...看起来，小精灵原型还不错，但就是清晰度太差。Rayfield又邀请了业内知名动漫设计师雷切尔•布里格斯（Rachel Briggs）来帮他完成这些精灵的“重绘”工作。

最终，基于GPT-2生成的原型，这些宠物小精灵就变成了这样：

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

感觉第二个和第六个可以直接成为《神奇宝贝》的一员了，你觉得呢？

Rayfield简单介绍了他利用GPT-2创建这些精灵的实现过程。大致就是：搜寻了788张小精灵图片（均为64x64像素）作为数据源，然后：

在这个过程中也出现了一些问题。比如在文本格式转换时，出现了很多嘈杂的像素，因此最终调整成了如下格式。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

不过，用文字训练GPT-2的过程还相对简单，最棘手的环节是通过代码将输出结果变成规范化的图像格式。这部分代码Rayfield已将其在Github 开源，感兴趣的朋友可以了解一下。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

Image GPT：语言模型处理图像任务

需要说明的是，上述Rayfield用GPT-2语言模型来学习图像表征的方法，早已被OpenAI验证。

无监督和自监督的学习，或没有人为标记的数据的学习，在自然语言处理领域取得了令人瞩目的成功，因为像BERT、GPT-2、RoBERTa、T5 等 Transformer 模型，在广泛的语言任务中取得了最佳成绩，但同类的模型在图像分类任务中，不能生成较为有用的特征。

出于这一目的，OpenAI尝试利用GPT-2处理图像分类任务，以探究用 Transformer 模型在学习图像表征方面的可行性。

他们发现，当用展开成像素序列——被称为 iGPT（image GPT）的图像来训练 GPT-2 模型时，模型似乎能够捕捉二维图像特征，并且能够在没有人类提供的数据标注下，自动生成各种逻辑连续的图像样本。实验结果如图：

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

人类提供上半图（第一列），GPT-2自动补全下半图，右侧为原始图像

同时，该模型的特征在多个分类任务的数据集上也取得了不错的成绩，尤其是在 ImageNet 上取得了接近于最优的成绩，如下图。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

在自然语言处理中，依赖于单词预测的无监督学习算法（如 GPT-2 和 BERT）之所以成功，一个可能的原因是下游语言任务的实例出现在训练用的文本中。但相比之下，像素序列并不直接地包含它们所属的图像的标签。

而即使没有明确的监督，图像上的 GPT-2 仍然起作用。OpenAI研究团队认为其原因是足够大的 Transformer 模型，通过训练来预测下一个像素，最终它能够学会根据清晰可识别对象来生成具有多样性的样本。

我用GPT-2创造了3000个宠物小精灵，完美复刻《神奇宝贝》！

他们采用一种通用的无监督学习算法—生成序列建模进行了测试。具体来说，他们在 ImageNet 上分别训练包含 76M、455M 和 1.4B 参数的 iGPT-S、iGPT-M 和 iGPT-L Transformer；还在来自 ImageNet 和互联网的图像的混合数据集上训练 iGPT-XL ——一个 68 亿参数的 Transformer。由于对长序列采用密集注意力（dense attention）的建模计算成本高，他们用 32x32、48x48 和 64x64 的低分辨率进行了训练。

最终实验结果表明，通过计算量来代替二维知识，以及通过从网络中选择的特征，序列 Transformer 可以与最优的卷积网竞争，实现无监督图像分类。此外，通过将 GPT-2 语言模型直接应用于图像生成的结果，也进一步表明由于其简单性和通用性，序列 Transformer 在足够的计算量下，有可能成为学习到不同领域的特征的有效方法。

更多OpenAI团队实验内容可参见论文：

引用链接：

原创文章，未经授权禁止转载。详情见转载须知。

谷普下载提醒您

本文链接：http://www.gpxz.com/article/1776b3aa923af74a44f8.html

上一篇：3用救济金买神奇宝贝卡男子因电信诈骗被判

下一篇：365365Microsoft云新功能抢先预览官宣更名

新大正物业集团股份有限公司

新大正物业集团股份有限公司成立于1998年，专注于智慧城市公共空间与建筑设施的运营和管理，构建以基础物业为主体，城市服务和创新服务两翼协同发展的三大版图。通过不断深化研究客户需求、作业场景及服务标准，让客户专注于主业，创造服务价值和优质体验，成为公建物业服务专家。新大正是中国物业管理协会名誉副会长单位、重庆市物业管理协会副会长单位、国家级服务业标准化试点单位，于2019年成功在深交所挂牌上市，股票代码002968。

商业服务 2024-08-06 19:18:46

统一社会信用代码查询

全国组织机构统一社会信用代码数据服务中心职能为：会同国家标准化管理部门、登记管理部门制定统一代码国家标准，负责管理统一代码资源，建设和运行维护统一代码数据库，为各部门提供信息服务，加强统一代码赋码后的校核，定期通报赋码和信息回传情况。

下载资源 2024-08-17 00:48:15

日历官网

日历官网(rili.cn)是专业的日历网站，可以在手机、网站之间同步数据。同时还提供各种日历日程信息，包括新闻资讯,工具查询,天气预报,黄道吉日、农历、黄历、星座运程、体育赛程、电视节目等。

星座灵异 2024-07-04 23:39:13

台车炉

江苏恒力炉业有限公司是专业设计制造各种工业电炉的专业公司,主要产品有台车炉、箱式炉、井式炉、热处理炉、回火炉等工业电炉产品。

设计美化 2024-07-14 00:20:01

傲蓝珠宝软件

傲蓝珠宝软件|珠宝管理软件|饰品管理软件|首饰管理软件|珠宝批发软件-专注研发珠宝首饰销售管理软件，珠宝首饰商城系统，珠宝移动互联网商城，珠宝手机报表查看等。

互联资讯 2024-08-18 00:35:28

商城

电影视频 2024-07-14 20:44:45

普罗米修斯价值加速器

普罗米修斯科技服务（南通）有限公司是一家专注于普罗米修斯价值加速器的技术服务公司。我们的产品是一款独具特色的企业价值加速器，能够帮助企业实现价值增长，提升核心竞争力。欢迎访问我们的官网了解更多产品信息。

网站模板 2024-08-18 15:40:27

集设屋设计网分享最新的设计案例、施工图、节点图、CAD图库、CAD教程、3dmax模型、3dmax贴图、ies光域网、Vary材质、3dmax脚本插件、3dmax教程、Su模型、SU教程、草图模、Su模型网站、设计软件下载、是设计师办公首选网站,集设屋资源网

手机软件 2024-07-17 12:19:33

义乌市睿昝贸易商行

水彩大全网(www.glfpw.com)是全网最全的水彩图库,提供最火水彩大师作品大全和美女水彩直播视频,附日本水彩购物网站和创作者水彩图片大全。查看全网最美水彩画师名单大全,发现更多水彩创作灵感！

电影视频 2024-11-18 20:16:22

上海代理记账服务

旌沃咨询是一家专注于上海代理记账和注册公司代理服务的财务公司，我们提供专业的财务解决方案，助您实现财务管理效益最大化。旌沃财务公司具备《代理记账许可证》资质，专注于企业登记代理、财务外包和财税咨询等服务，同时是国家商标总局核验备案的商标注册专业代理单位。

商业服务 2024-11-19 15:03:11

合肥康芯威存储技术有限公司

合肥康芯威存储技术有限公司（以下简称“康芯威”）成立于2018年11月，主营业务为“前沿存储技术开发、方案输出、芯片设计、半导体器件分销”，产品应用于电视、机顶盒、手机、智能汽车、数据中心等领域。

网络应用 2024-12-21 21:11:50

汽车主页

ZOL中关村在线汽车频道为您提供专业的汽车报价、评测、新闻、导购、行情。全面解读汽车领域，同时覆盖新能源，电动车，后服务等汽车用品、车载电子，以及科技改变生活的服务类项目等内容，为您购买汽车提供有价值的参考。

新闻资讯 2025-02-22 21:05:08

利用虚拟资源做项目！月赚2万很简单 (利用虚拟资源的好处)

今天将为大家详细讲解一下虚拟资源项目玩法分为几部分来讲解，大家去实操落地，我也不废话，直接上干货，既然大家来了解到这个项目，目的都是为了赚钱，我说的玩法都是我自己实操过的，不知道有没有人混过这个圈子，好多人都是别人的东西，大家心态要平稳，互联网鱼龙混杂，好多人看不到效果就放弃了，三五天就见效果的不建议大家去做，细品，我说的都是长期操作...。

2025-01-30 23:25:04

而Linux赢得整个世界 Windows赢了桌面

最坚决推行Linux桌面系统项目的城市正在转回Windows阵营，但Linux的命运已经不再与PC休戚相关，慕尼黑的Linux项目只是开源软件故事中的一小部分，在实施从Windows系统迁移到Linux系统这一项目接近十年之久后，慕尼黑却突然走上了一条戏剧性的转弯，据说是到2021年，该城市的地方议会就会开始用Windows10替换运...。

2025-01-30 17:39:30

身形千变万化！MIT开发出太空探索神器 (身形千变万化什么意思)

如果你想将一大批机器人送入太空，那么你面临两种选择，一是选择全尺寸的、形态各异的机器人，二是选择微型模块化机器人，显然，后者是更优选，如电影，超能陆战队，BigHero6，中大反派所使用的微型磁力机器人就是一种模块化机器人，它们在自组装和重构方面的能力尤有前景，图注，电影，超能陆战队，中的微型模块化机器人，图源，cg99.CN30多...。

2024-12-03 20:36:53

伙伴云零代码平台获4000万美金B 轮融资 (伙伴云操作教程)

近日，零代码应用搭建平台伙伴云完成4000万美元B，轮融资，由某知名投资机构和某战略投资机构共同投资，老股东红杉中国和五源资本持续加持；同时，伙伴云还获得了新股东挚信资本、亦联资本和百丽消费基金跟投，义柏资本担任独家财务顾问，在此之前，伙伴云已完成1700万美元B轮融资，由红杉中国、五源资本共同领投，挑战者资本跟投，此次全新一轮400...。

2024-12-01 01:49:22

狗急减速闪退 (狗急加速test)

狗急减速闪退处置方法闪退，把输入法切成中文，开大写锁定试试，输入法加一个英文，出来的时刻开英文就不会闪退了，狗急vp减速器下载是一款能够稳固优化你以后环境的减速器软件，狗急vp减速器官方操作十分繁难，没有复杂的操作，为玩家稳固优化，让用户可以轻松经常使用，提供多种盛行的游戏主题供用户随时失掉，更好的来优化目前的网络环境，烧饼哥减速器最...。

2024-07-16 05:08:40

电脑如何下载杀毒软件 (电脑如何下载歌曲到u盘)

下载杀毒软件的方法有很多种，上方以金山毒霸为例，1、首先，返回金山毒霸的官方网站，，在网站首页找到下载链接，点击即可开局下载，假设您经常使用的是Windows系统，可以选用下载装置包或许间接在MicrosoftStore中搜查金山毒霸启动下载，假设您经常使用的是Mac系统，可以在AppStore中搜查金山毒霸启动下载，2、下载实现后...。

2024-07-13 18:20:26

外地官员被象群围住踩死一游客在南非公园不顾劝止下车拍照母象试图包全幼象 (外地官员被象棋杀死)

外地期间7月7日早上，一名43岁的西班牙游客在南非家养生物包全区下车拍摄象群照片时，被大象踩死，据悉，这名43岁的女子与未婚妻和另外两人一同旅游南非的匹林斯堡国度公园时，遭逢袭击，他们先是不时开着自己的车到处观赏，而后发现了3头大象和3头小象，随后，女子从车中爬进去，走向大象，想要拍照，南非西北省公园和旅游局在申明中称，，虽然他的同行...。

2024-07-10 17:13:41

周公解梦偷东西 (周公解梦偷东西被发现)

做梦偷东西是什么暗示梦中很多人都会梦见偷盗相关的事，其实这些就是自己心坎关于事实中的一些事物、感情的得失所构成的，梦见他人偷东西或许自己偷东西，并不是说自己或许他人有什么偷窃的心思，只要自己心里对一些东西的得失十分在意特意是感情、姻缘等，梦中的偷窃更多的是由于感情的得失而构成的，当然也会心味着一些投机之事，梦见偷盗、偷盗、偷钱、偷东西...。

2024-07-10 01:40:11

雪佛兰乐风2010款一款经典的家庭用车 (雪佛兰乐风2009年1.4手动挡)

雪佛兰是一家领有百年历史的汽车品牌，自成立以来不时努力于为生产者提供高质量、高安保性的汽车产品，而作为雪佛兰的家庭用车代表，乐风2010款则是一款经典之作，首先，乐风2010款在外观上的设计繁复大气，正面线条流利，车尾丰满有力，全体看起来十分温馨，而内饰方面，车内驳回了彩色和银色搭配，给人一种繁复、高质感的觉得，车内座椅也很温馨，允许...。

2024-07-07 16:36:00

请问在网上看见的那些招聘消息为什么他们的电话都是当地的比如58同城网.上班却是成都啊 ? (请问在网上看诊赵国秀的药能报销吗)

自己看看这类网站，是团体都能发广告自称招聘，给点小钱就替骗子张目，能不能稍微用脚趾头想一下，这些消息是不是比路边电线杆更牢靠，合理的行业反常的公司，连去正轨路径发招聘广告的那点银子都舍不得出，来这类网站捞廉价，成都58同城公司在哪里，咨询电话是多少，你好，58同城成都分公司惟一地址，四川省成都市锦江区东御街19号茂业天地29楼，这是我...。

2024-07-03 00:55:18

2023“护网双城”成渝网络安全联合实战攻防演练在重庆渝中举行

2023-11-09 05:40:48

【国泰君安证券富易下载】2022年最新官方正式版国泰君安证券富易免费下载

腾讯软件中心提供2022年最新2.3.1.806官方正式版国泰君安证券富易高速下载，本正式版国泰君安证券富易软件安全认证，免费无插件。

2023-09-19 02:01:05

文章推荐

腾讯成立腾讯影业子公司万达影业高管加盟 (腾讯成立腾讯公司了吗)

腾讯成立腾讯影业子公司万达影业高管加盟9月11日消息，相关人士向松松小编透露，腾讯已成立全资子公司上海腾讯影业文化传播有限公司，简称，腾讯影业，腾讯互娱相关人士向TechWeb确认，将于9月17日召开发布会宣布这一消息，全国企业信用信息公示系统的信息显示，上海腾讯影业文化传播有限公司注册于2015年2月5日，法人代表为腾讯集团副总...。

2025-01-30 18:55:28

网络百科

开冷饮店需要些什么加盟冷饮店需要多少钱 (开冷饮店需要什么手续和证件)

炎热的夏日一律是冷饮畅销的季节，尤其是市场上众多多变的口味，超高的产品品质，都能够给每一个消费者带来全新的饮食享受，在健康，快捷，低脂，低糖饮食特色的基础上，不同的产品档次和不同的经销项目，都能够打开相应的市场营销空间，给众多智慧之选商一次成功创业的机会，那么，加盟冷饮店需要多少钱，开冷饮店需要些什么呢，下面就来了解一下，加盟冷饮店需...。

2025-01-15 21:45:08

创业加盟

Arm宣布推出其下一代处理器架构 (arm发布)

Arm今天发布了其下一代芯片架构Armv9，它的前身Armv8于10年前推出，此前尽管已经看到了Armv8有相当多的更改和更新，但新架构为该平台带来了更多重要更新，从而保证了版本号的变化，毫不奇怪，Armv9建立在V8上并向后兼容，但是它专门引入了新的安全性，AI，信号处理和性能功能，在过去的五年中，全球已经出货了超过1000亿个基于...。

2024-12-09 19:07:06

资讯动态

爱普生tw5700怎么看电视 (爱普生tw5210投影机参数)

发表在专业问答2021，7，816，45展示机型信息，品牌型号，爱普生tw5700、iPhone12系统版本，nunaiOS、iOS14.6软件版本，当贝助手3.4.5打开爱普生5700上的当贝助手，选择文件快传，然后在手机上输入相应ip地址打开文件传输界面，接着传输安装电视家，最后通过电视家观看电视即可，爱普生tw5700怎么看电视...。

2024-11-29 02:26:22

网络百科

hdmi是什么接口 (hdmi是什么意思)

发表在专业问答2022，7，615，27展示机型信息，品牌型号，当贝F5系统版本，当贝OS3.0hdmi也叫做高清多媒体接口，是一种全数字化视频和音频发送接口，支持发送为压缩的视频以及音频信号；hdmi接口一般会用在电脑，游戏机，功放音响等支持hdmi接口的设备上，目前hdmi接口有hdmi1.4、hdmi2.0以及hdmi2.1，h...。

2024-11-28 23:50:23

网络百科

我用GPT (我用gpt编写maya脚本)

GPT-2：「精灵制造机」

Image GPT：语言模型处理图像任务

相关文章

文章推荐