有详细论文 DALL·E 现实主义画师 我跪了!OpenAI AI 化身 发布 2 (论文详细要求)

文章编号:46016 资讯动态 2024-12-09 OpenAIAI画像2.0DALL·E

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

大家还记得去年 1 月 OpenAI 发布的

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

只要「阅读」文本,DALL·E 就能根据文本的内容「自动」生成栩栩如生的大师级画像。因此,当时一经发布,DALL·E 就火遍了 AI 圈,吸粉无数,也让 Language-Vision(文本-视觉)方向又火了一把。

就在今天!时隔一年后,OpenAI 结合 CLIP,又发布了 DALL·E 的第二个版本——

相比 DALL·E 1.0,DALL·E 2.0 可以生成更真实和更准确的画像:综合文本描述中给出的概念、属性与风格等三个元素,生成「现实主义」图像与艺术作品!分辨率更是提高了4倍!

比如,当提示文本中分别包含「概念」“An astronaut ”(一个宇航员)、「属性」“riding a horse”(在骑一匹马)和「 风格」“in a phtprealistic style”(超现实风格)时:

文本提示:An astronaut + riding a horse + in a phtprealistic style(一个宇航员+骑马+超现实风格)

DALL·E 2可以生成如下这些同时包含三种元素的图像:

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

在满足三种给定元素的基础上,它可是充分发挥了自己的「想象力」,不仅马的姿态各不相同,而且给宇航员穿上了样式各异的服装,场景也是十分丰富,草地上、山顶上、星空中......

神不神奇!牛不牛!



让我们来欣赏 DALL·2.0 的大师作品!

如果你想要变换文本中概念、属性和风格三个元素中的一个或多个,比如保留「概念」“一个宇航员”和「属性」“在骑一匹马”,而将超现实主义风格替换为波普艺术家安迪·沃霍尔的风格,DALL·E 2也可以「轻松」转换它的绘画风格:

文本提示:An astronaut + riding a horse + in the style of Andy Warhol (一个宇航员+在骑一匹马+安迪·沃霍尔的风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:An astronaut + riding a horse + as a pencil drawing(一个宇航员+在骑一匹马+铅绘风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:An astronaut + lounging in a tropical resort in space + in a vaporwave style( 一个宇航员+在太空热带度假胜悠哉地躺着+蒸汽波风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears + mixing sparkling chemicals as mad scientists + as a 1990s Saturday morning cartoon(泰迪熊们+正在像疯狂的科学家一样混合着冒泡的化学物质+20世纪90年代的周六早间卡通片风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears+shopping for groceries+in the style of ukiyo-e(泰迪熊+购买杂货+浮世绘风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:Teddy bears+shopping for groceries+in ancient Egypt(泰迪熊+购买杂货+古埃及风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+that is a portal to another dimension+as digital art(一碗汤+通往另一个维度的门户+数字艺术风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+as a planet in the universe+as a 1960s poster(一碗汤+宇宙中的一个星球+1960年代海报风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本提示:A bowl of soup+as a planet in the universe+as digital art(一碗汤+宇宙中的一个星球+数字艺术风格)

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文




DALL·E 2.0 的其他功能

1、图像编辑

DALL·E 2 可以根据自然语言描述的标题对现有图像进行逼真的编辑,比如,在考虑阴影、反射和纹理的同时增加或删除图中的某个元素。示例如下:

文本描述的编辑需求:选择一个位置在图中添加火烈鸟。

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

文本描述的编辑需求:选择一个位置在图中添加柯基。

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

2、风格变体

DALL·E 2 可以拍摄一张图片,然后根据原图制作出同一个风格的不同画像。示例如下:

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

对于AI从文本生成的图像,我们非常看重的一点当然是图像的分辨率了,图像的分辨率越高,像素数量就越多,图像也就越清晰和逼真。与DALL·E 1相比,DALL·E 2的分辨率提高了4倍!

比如,对于同样的文本提示:

文本提示:a painting of a fox sitting in a field at sunrise in the style of Claude Monet(一只狐狸坐在日出时的田野里+克劳德·莫奈风格)

下面两张图分别是DALL·E 1 和DALL·E 2所生成图像的对比:

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

对比之下,DALL·E 1 生成的图像可以说是很模糊了,甚至根本看不出「日出」在哪里,「狐狸」只显露出它的头部,「田野」也不太有田野的样子,而且在整体风格上与画家莫奈的印象派风格相去甚远。

而在DALL·E 2的魔法手笔下,图像质量显著提高,「日出」和「田野」都很生动,小狐狸端坐在草地上,姿态可爱。这幅画作色彩更加丰富,使用了更多的复色,对光影的描绘更加接近莫奈的风格。

总体来说,相比 DALL·E 1.0,DALL·2 显然能 hold 住元素更丰富、色彩更饱满的图像。不再是简单的单一物品描述,而是对一个场景的整体表达,故事更完整,想象力也更丰富!

更详细的内容,可以查看 DALL·E 2 的相关研究论文:

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

版权文章,未经授权禁止转载。详情见 转载须知 。

我跪了!OpenAI 发布 DALL·E 2,AI 化身「现实主义画师」,有详细论文

全局中部横幅
【官网】

闪剪是国内领先的AI数字人口播视频在线创作平台,同时拥有移动端APP版本,平台有丰富的数字人视频模板,你只需输入关键词,AI自动创作文案一键生成数字人视频,还可在线定制专属数字人形象及声音;内含200+国际化数字人模特、24+国家AI配音、AI文案创作、智能成片、照片数字人、直播快剪、视频订阅号等功能,让企业团队轻松实现矩阵营销引流,降本增效。

感恩网

感恩中国网站是目前最有影响力和公信力的一对一爱心助学捐赠和图文故事网站。

许昌腐竹,许昌豆宝宝食品有限公司

许昌豆宝宝食品有限公司是一家生产销售许昌腐竹的公司,欢迎咨询许昌腐竹相关问题。

沈阳淘智猎头【沈阳猎头公司】专业的猎头公司

淘智猎头,沈阳猎头公司,沈阳猎头,沈阳猎头网,沈阳市猎头公司,沈阳的猎头公司,沈阳猎头排名,猎头,中国猎头,猎头加盟,猎头合伙人,猎头创业,合伙人,合伙人创业,辽宁沈阳猎头公司,辽宁沈阳猎头,辽宁沈阳猎头网,辽宁沈阳的猎头公司,辽宁沈阳猎头排名

湖南强泰环保科技有限公司

湖南强泰环保科技有限公司是一家集“三废”治理工程的设计、生产、施工、调试及售后服务为一体的股份制高科技企业,公司专业从事各种污水处理、黑臭水体治理、废气处理、噪音治理及环保器材设备和环保药剂的销售。咨询热线:400-007-3067

广州市明静科技有限公司,金刚控台,明静灯光,明静舞台灯光,控台,舞台灯光,灯控

广州市明静科技有限公司,是一家集开发、设计、生产、销售、服务为一体的综合性,专业舞台灯光设备生产企业.公司拥有灯光控制器和灯光设备两大产业.旗下有灯光控台

安全内参

安全内参,专注于网络安全产业发展和行业应用的高端智库平台

265上网导航

上网导航,网址导航,网站导航,网址之家,网址大全,网址,搜索,音乐,娱乐,图片,小游戏,短信,社区,日记,相册,K歌,通讯簿,BLOG,天气预报,实用工具.最方便,最快捷

阔曼自动化科技(上海)有限公司

阔曼自动化科技(上海)有限公司是专业从事焊接安防设备生产与服务的机构,是焊接安防服务商。公司针对焊接弧光的特点开发了防弧光板材、焊接防护屏、电焊遮光帘、焊接防护围挡、焊接工作站快速门等一系列焊接安防设备与产品。立足上海,辐射全国,致力于打造中国焊接安防大品牌。因为专注,所以我们更专业。期待与您携手向前,合作共赢!

四川金通信息技术有限公司

四川金通信息技术有限公司是一家专业IT服务的科技型民営企业,公司始创于2009年4月15日,注册资金600万,在成都、泸州都拥有一支专业的研发队伍近几年,金通先后投资成立了“四川临港物流信息服务股份有限公司“、“泸州智慧城市投资运营有限公司”和“国久大数据有限公司”。

全局底部横幅