原创 分享生活的灵感 Voicer汽车在纽约上空飞行、中世纪居民头戴VR眼镜、宇航员在火星表面跳街舞、大卫雕塑爱打碟、古埃及的动物壁画玩电脑……欢迎来到AI绘图的世界!
输入文字就能得到你想要的任何画面,无论多么荒诞无理的要求,无论定制Edward Hopper画风还是宝丽来胶片,AI都能使命必达。
听上去如此梦幻的跨时代工具,似乎是下一波新技术浪潮的抬头,2022也被称为AI绘图元年。但是它就像任何一项新技术一样,难免伴随争议:究竟是开启了一个全新绘画时代,还是打开了潘多拉魔盒?无论你做何感想,AI绘图时代已经不可逆转地到来。
??
!ATTENTION!
以下图片纯属AI虚构
如有雷同,纯属巧合● 一个人坐在办公室隔间里,用键盘打字,压力重重的样子 – 文艺复兴绘画风格● 金毛寻回犬小狗坐在小餐馆里喝咖啡,看起来很忧郁 – Edward Hopper风格● 战斗中戴着士兵头盔的猫猫特写 – 二战历史摄影风格,黑白● 一张非常细节、复古、颗粒感的纽约市汽车飞行照片(1936 年)● 宇航员b-boy组合在火星上表演 – 宝丽来风格● 用柯达专业Portra 400胶卷拍摄的外星人肖像 – 由Annie Leibovitz掌镜● 米开朗基罗的大卫雕塑正戴着耳机打碟● 在太空边缘奔跑,奔向星球,平静,抵达深渊 – 数字艺术风格
以上这些画面都来自今年最热门的AI绘图平台DALL·E 2(ig:@openaidalle),AI制作它们的时间,可能不到一分钟。
不管是照片还是绘画,你想到什么,AI就能呈现什么。真有那么神奇吗?今天我们就先从DALL·E 2聊起。
创造奇迹的DALL·E 2
到底是何方神圣?● DALL·E logo
作为AI绘图的大势平台,DALL-E 2的火爆常常让人忘记这个程序今年4月才刚刚推出。
初代DALL-E诞生于去年,在此基础上进行了升级的DALL-E 2图像分辨率更高,对指令的理解也更准确。● 输入日出时狐狸坐在田野上的画作,莫奈风格,左右分别为第一代和第二代AI交出的作业
DALL-E的名字来自《机器人总动员》中的机器人瓦力(WALL-E)和超现实主义画家达利(Dalí)。它也确实在功能上兼顾了两者:一个能制作超现实主义图像的机器人。● 左:半人半机器版达利,右:瓦力版蒙娜丽莎,都由DALL·E 2绘制
在DALL-E 2宇宙里,脑洞有多大,世界就有多大。
你只需要给它一些描述语,包括画面内容、参考画风/画家、形式(摄影/绘画/雕塑)、工具(xx胶卷/镜头),剩下的就全部交给它。● 古埃及壁画上的动物神明正在使用计算机● 数千个星系的超深场天文学照片?灵感来自韦伯望远镜拍下的图像
比如说,可以画成什么样?DALL·E 2官网给出了两组词条:
A组词条描述行为:
像狂热科学家一样混合化学物质
购买杂货
从事AI研究?
B组词条描述风格/状态:
儿童蜡笔艺术?
1980年代在月球上
和90年代科技产品一起待在水下
浮世绘风格
……
把A组和B组连词成句,就能得到以下这些奇妙结果。●
不过,DALL·E 2不仅会创造图像这么简单,还可以在现成图片上施展魔法。它能在照片里加入任何元素,并对阴影、反射和纹理进行细致处理,让新照片毫无违和感。
比如,我们要求DALL·E 2在美术馆照片上加一只柯基,并要求它分别出现在二次元画作上和三次元展馆里,AI就会自动计算柯基应该出现的样子。● 在照片的1??2??3??位置分别加入柯基会是什么效果?
当然你也可以丢给DALL·E 2一张画作,让它以此为灵感去创作,《戴珍珠耳环的少女》从此便有了多个模样。● DALL·E 2版《戴珍珠的少女》● 给蒙娜丽莎换个莫西干头发型,或是狗狗换小猫,都不在话下
DALL·E 2究竟是如何工作的?
OpenAI曾对此做过视频解释。和大多数AI一样,DALL·E 2的根本原理是算法。通过深度学习大数据,从而掌握内在逻辑。运用在绘图领域的话,就是对海量的主题图片作归类总结。
比如成千上万的考拉图片构成一个网络,而摩托车图片则是毫不相干的另一个。当用户输入考拉骑摩托车时,AI就把这两个网络交叉组合,并从中选出符合要求的图片。● 如果对DALL·E 2生成的结果不满意,用户可以进行修改,这些修改也在不断帮助DALL·E 2变得更准确
AI绘画正在占领赛博世界● 机器人梦见电子羊(cr:Sam Altman)
看到这里,如果你已经迫不及待要上手感受下DALL·E 2,那么很遗憾:DALL·E 2目前并未对大众开放。虽然可以申请加入waitlist,但大多情况下你只能拿着爱的号码牌,陷入无尽的等候。
远水解不了近渴。一款与DALL·E 2极为相似、且对公众开放的免费工具DALL-E mini引起了大家的兴趣。
它与DALL·E 2并无直接关系(现已改名Crayon),功能却基本一致。只要提交描述,它就能在极短时间内生成图片——虽然质感与DALL·E 2存在肉眼可见的差距,但是对于图个新鲜的网友们来说已经足够。● 泳池派对的黑客(cr:weirddalle)● 当黑武士遇见pingu(cr:weirddalle)● 腹语人偶版扎克伯格(cr:weirddalle)
对于更资深一点的玩家来说,AI绘画工具早已是任君挑选。除了DALL·E 2,如今受到关注的AI工具还包括:Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。
这些工具使用起来难易程度不一,比如CogView是国内团队开发的AI工具,仅支持中文搜索。而Disco Diffusion充满代码的界面略为赶客,需要跟着教程一步步操作。
我们也玩了一把!
在AI绘图appdream by wombo(可免费下载)上,我们试着以voicer为关键词,分别生成了吉卜力蒸汽朋克浮世绘达利风格的图片。● 你最中意哪个?
当然最终效果也大多与AI工具的操作难易程度成正比。CogView生成的图片多少带点AI痕迹,而Disco Diffusion的玩家社区,早已成为浪漫想象力与美术功底的竞技场。
这些原本就是高超画手的用户们,与Disco Diffusion不断磨合调教,创作出无数难以辨别AI绘画痕迹的优秀作品。● Father Time(cr:@noah__proctor)● 比起DALL·E 2,Disco Diffusion似乎更擅长描绘恢弘的场景(cr:@discodiffusion)● Disco Diffusion社区用户总结了在同一描述下,各个画家的关键词会生成的不同风格,截图为其中一部分
虽然2022被成为AI绘画元年,但AI绘画绝非一个全新概念。
只是在这项技术发展早期,人们对此态度并不乐观。而当时算法也还没有那么强大,AI的作品停留在学龄前儿童水平。● 即便是现在,DALL·E 2还是会生成两个手掌长在一起这样视觉错乱的图片
不过人们对于AI作画的探索并未就此停止,反而奋勇向前。在互联网流行AI作画之前,实体AI作画就已经受到不小的关注。
根据2018年的报道,当年国际机器人艺术大赛的获奖名单里有不少对AI作画的实验。
加拿大艺术家Joanne Hastie制作了由编程控制绘画的机械臂;美国艺术家Pindar Van Arman创造的AI机器人,可以模仿所给图片绘画;泰国机器人实验室CMIT Robotics则可以捕捉人类在绘画时的每一个动作轨迹,机器人通过精准复制动作,从而完整复刻人类的画作。● Joanne Hastie创造的抽象作品● 只要人类先画一遍,CMIT Robotics就能近乎完美地复刻● Van Arman的AI机器人可以根据动态热力图来调整作画
而在四年后的今天,AI机器人作画显然又向前迈进一大步。在今年威尼斯双年展上亮相的AI艺术家Ai-Da,是一个拥有机械臂、外形酷似人类的机器人。
和街头画家一样,Ai-Da用机械臂绘制人物肖像,并且配置了和人类对话的智能程序及发声器,可以边作画边与绘画对象攀谈。● Ai-Da和她的自画像● Ai-Da的肖像作品● 世界上第一幅由AI机器人绘制的英国女王肖像
天才画手还是恐怖黑箱?● 人们戴着VR眼镜的中世纪画作,由DALL·E 2生成
当AI绘画的实力越来越强劲,问题也随之而来:它会替代传统绘画吗?画手们是否会面临集体失业?
有人对此保持乐观。毕竟虽然AI很强大,但本质上还是依赖人类的原创。它没有独立创造某种风格的能力,而Edward Hopper有。● 无论美漫风格、数字艺术风格还是宝丽来,DALL·E 2都是参照人类创造出的现有风格
也有人对此非常悲观。虽然高端画师暂时还不会被取代,但是普通画手的创作却可能变得越来越不值钱。
此外,AI绘图还面临着更多问题。
一个月前,DALL·E 2发布了一张AI图片,描述语为一个男人举起双臂和双手,用手势表示‘这么多’。● DALL·E 2生成结果
这张生成图片里的男子,有点像每年苹果发布会上的乔布斯,立刻引发了网友不满:为什么一个男人=年轻的白人男性?难道AI世界也奉行白人中心主义吗?
但是考虑到DALL·E 2的运行逻辑,它也许只是这个充满偏见的世界的缩影。
它的学习素材都来自人类的图片——如果人类的图片世界本身就充满偏见和刻板印象,又怎么期待AI能根据A man的描述语生成黄种人或黑人?或者根据护士的描述语,生成男女比例对等的图片?● DALL·E 2生成的建筑工人图片● DALL·E 2生成的空乘人员图片
更严重的问题可能来自法律纠纷。
AI绘图是否会重蹈AI换脸技术的覆辙,被用来做一些侵犯他人权利的事情?如果AI能够随意生成他人的照片,那么狗仔们是否从此有了造谣利器,而政客们也有了陷害对手的把柄?
(亚利桑那州立大学计算机技术教授)
图片版权是一个更难厘清的问题。关于AI生成图片能否商用,各平台众口纷纭。通过学习他人画作生成的作品,是否会侵犯到原作者权益?这给知识产权领域提出了新的思考。
如果AI绘图有一天完全成为大众工具,那么现实与虚拟的边界无疑将被进一步模糊。● 网友Aditya Ramesh使用DALL·E 2将维多利亚式房屋改造成现代房屋,把特斯拉变成老爷车,把iPhone变成老式电话
200年前摄影技术诞生时,给绘画带来的最大冲击即是真实感——我们可以不相信绘画,却不能不相信一张真实的照片。然而200年后蓄势待发的AI绘图技术反其道而行之,进一步消解了图像的真实性。
等到AI绘图真的占领互联网的那一天,我们还能相信眼睛看到的任何一张图片吗?
原标题:《AI绘图到底是天才画手,还是潘多拉魔盒?》