Kory Bieg

OTA+ 建筑、设计和研究办公室负责人兼 UT 奥斯汀建筑学院项目主任,使用 AI 生成工具的创意人员之一,使用 Midjourney 制作的建筑设计以其杰出的视觉效果在 Instagram上获得了大量关注。


人工智能正在戏剧性、根本性地改变创意过程,计算机已经在建筑、设计和美术等领域发挥关键作用。DALL-E 2、Imagen和Midjourney等文本到图像生成软件的出现表明,人工智能机器和计算机已经被用作画笔和画布。虽然有些人选择专注于人工智能的好处,比如提高速度和效率,但也有人担心,人工智能最终会取代整个设计师。

日前,Designboom就文本到图像的AI生成器、Midjourney以及AI的未来问题,对建筑设计师Kory Bieg进行了采访,以下是对此次采访部分内容的整理。

建筑师眼中的Midjourney

Midjourney是一个文本到图像的人工智能,使用者可以通过键入的文本(称之为提示)来构建想要的任何东西的图像。

根据输入文本快速输出相关图像

AI擅长以几乎任何风格生成图像,因而对于想要模仿别人风格的人来说,使用确切名词提示如文森特·梵高或者哈迪德去描述就能够获得足以惊喜的效果。但对于Kory Bieg(后简称Bieg)这类设计者来说,则偏向于使用更加通用的词语如“有机”等,既可能产生与某些具体风格相似的定性元素,又不会将AI的提取数据库限制在特定的词汇之中,这样将有利于发现更多要素的重叠空间,从而开发新的设计风格领域。作为一名建筑师,Bieg尝试使用Midjourney等AI系统来对建筑的形式进行控制并不断开拓新风格
在其Vault系列作品中,Bieg使用了常见的类型学和建筑学术语的同时,也加入了一些自然模式和结构的词汇进行辅助,从而输出一些介于人类建筑和自然风格之间的合成混合体。
VAULT系列作品
在其Text系列作品中,Bieg则尝试用字母来控制建筑形式。由于字母由直线、角度、曲度、拱形、圆点和弯曲等多种元素组成,因而通过命令Midjourney以字母的形式来创建建筑物设计,可以预想到输出图像所具有的一些字母相关特定的结构模式。

TEXT 系列作品

Midjourney 是一个富有创造性的AI,这也是此类AI的一个特点,它会理解并根据提示检索相关对象、与这些对象类型相关联的参数,甚至是提示中的要素对象有哪些其他的关联对象,因此不会完全按照使用者的预期来输出图像。无论在文本中包含哪些提示,Midjourney都将填充一些空白并添加一些使用者没有提到的细节,这也是让创作者非常感兴趣的一点,通过个人预先填入的要素和一些AI填充的意料之外的要素结合,能够以超出自己舒适区的方式去探索更加丰富的领域。
以生物为灵感设计的Pavilion 系列作品
Bieg谈到在自己在考虑提示中所需要包含的参数时会考虑Midjourney可能添加的对象以及是否想要在文本中包含一些更加具体的要求。同时,也会考虑这些标准要素会怎样被非标准替代物甚至是不相关的要素代替,从而诞生更加有趣的重叠部分。
在其sponge系列作品中,Bieg将建筑物的屋顶描述为海绵,Midjourney不只是抹去屋顶并在原有位置放置一张海绵的图片,而是将海绵的结构映射到屋顶的形式中去,甚至将其融入窗户和屋顶通风口等的周围,于是输出的图像能够将输入的要素与建筑物的整体形式综合在一起。
Sponge 系列作品
Midjourney的应用问题
在Midjourney的使用上, Bieg提到自己经常从少数几个词开始,来尝试一两个词对输出效果产生的可能影响,再不断加入新的词汇进行反复尝试直到一些词汇的混合方式和影像输出感到满意为止。根据多年设计经验, Bieg认为最精彩的效果往往需要在同一线程上耗费大量时间进行调整,当达到积累的一个临界点后,就会不断涌现出非常优秀的成品。因而,Midjourney非常适合设计师快速地迭代和测试想法,以寻求最佳效果,同时节省时间和精力
基于“伪装”这一线索生成并不断改进而来的Camouflage 系列,最初生成的图像只是一张迷彩图
针对图像转换3D建筑模型问题,Bieg认为建筑师大都接受过 2D 正交绘图到3D 模型之间的转换学习,因此大多数设计师应该熟悉从 2D 迁移到 3D 的过程。随着尝试将这些工具集成到工作流程中,快速对复杂形式进行 3D 建模的能力将在未来几年变得更加有用。然而,这并不像看起来那么容易。Midjourney 创建的 2D 图像可能看起来像广角照片或渲染,但实际上,它们是多个图像的合成,这些图像通常具有不同的没影点或焦距。当试图构建它们的 3D 模型时,设计师很快就会意识到这是一件不可能的事情。这也是只能将这些图像视为草图的另一个原因——它们如今仍然是需要转化和完善的启发性素材。
随着使用经验的增加,Bieg不再将AI生成的图像视为一个完全形成的完整项目,而是使用正在探索的提示为自己的每个系列作品命名,认为当只用简单的解释描述且不规定确切用途时能够探索更加广阔的可能性。他很少会根据图像制作整个的建筑模型,而是提取其中的精华部分并舍弃剩余的部分。
作为延续的VAULT 3.0 系列作品
目前Bieg正在构建一个庞大的数据库来存储所有具有潜在价值的建筑部件,这些部件可以组合供给真实建筑项目设计使用。且这一数据库的丰富潜力可以继续扩大到与朋友和同事的内容储存链接起来,从而开启一种全新的协作形式。
Bieg搭建的素材库网站OTA+
但Midjourney 的一个缺点在于一旦启动一个工作线程,就无法在中途进行关键词修改。要更改某些内容或添加其他文本,就必须编辑原始提示并运行新的工程。然而,Midjourney 制作的图像不需要额外的后期制作,因为光照、饱和度和情绪等内容都嵌入在它创建的图像中。也就是说,可以在任何图片编辑软件中轻松修改这些标准图像文件。
对比下的Midjourney
针对Midjourney与其他类似用途的AI以及插件的使用区别,Bieg给出了自己的看法。
Midjourney和DALL-E,包括其他此类AI如Disco Diffusion、Imagen、Stability AI,都是用同样的基于扩散的方法来生成图像。但它们之间也各有特色,因而在结果输出上有着较大的差别。DALL-E有一个优秀的功能,即可以擦去一个图像上的一部分并使用新的要素代替。此外DALL-E允许用户上传一张图像,只需要点击按钮,就可以产出三张该图像的变体。虽然Midjourney也有这一功能,但在表现效果上与DALL-E仍有一定差距。
但从另一方面来看,不同于DALL-E这一较贴合原图的变体产出功能,Midjourney则能够给使用者更多对于图像生成控制的自由度:定义图像的尺寸和构成、增减AI赋予图像的“风格”成分、规定AI能背离输入文本发挥的程度。
基于已生成图片,Midjourney能够快速调整生成变体
总而言之,Midjourney是一个能够优秀地帮助设计师构建结构、开拓新设计领域的工具,而DALL-E则擅长编辑、调整已有图像。当然,DALL-E也可以依据文本生成全新的图像,但相对来说不足以适应富有新奇性的建筑设计。
另外,与Garsshopper类参数化/算法建模工具相比,Midjourney这些由文本生成图像的 AI 将成为设计过程中不可或缺的一部分,但它们是一种全新的工具类别,不会取代目前设计师使用的任何工具
Bieg认为Midjourney 和参数化建模工具之间的唯一重叠区间是如果 Midjourney 用户想要创建具有参数质量的图像,可以在文本中加入模块化、重复性和参数化等词汇,它们会影响图像输出结果,使其看起来有些像使用 Grasshopper 等插件设计的建筑物。
除此之外,Midjourney 也可以识别其数据库中由各种软件程序(如 VRay 或 Octane Render)创建的图像,并且会尝试将使用它们制作的图像风格用于自己的图像生成。
拥抱科技的未来
科技与艺术的关系一直是广泛争议的问题,面对“是否会向建筑/设计专业的学生推荐这个AI?”的提问,Bieg给出了非常积极的回答。他认为由文本生生成图像的AI易于上手且获取结果非常快速,适合学生们在从事任何工作的时候使用,通过它来不断尝试发现更多创造的可能性。但同时他也强调,自己不会将这些图像作为最终的设计成稿,形式不是建筑物的全部,在设计中还有许多Midjourney无法考虑到的相关要素
当提到知名设计师Sebastian Errazuriz在INS上发表的“AI将会取代艺术家,首当其冲的将是插画师”观点时,Bieg对这种担忧表示理解。但他认为艺术家和建筑师并不会被取代,即便AI毫无疑问会从根本上改变设计工作流程
设计师Sebastian Errazuriz在ins上发表视频讨论AI可能代替艺术家相关问题
漫长历史中每次出现新的颠覆性技术时,都会引发同样的担忧,但艺术家和建筑师至今仍然存在,从某些方面来说,他们变得更加珍贵,并且与当代文化和社区联系得更加紧密。学院和实践经历将继续传承富有悠久历史的知识,外行人不经过多年的学习就无法获得这些知识。AI 可以访问这些历史知识,但它无法完全策划图像选择,因为观众的偏好是动态且不可预测的。专家需要通过他们的专业知识来提炼、识别和塑造人们的社会观点和经验。
眼下有一些亟需我们解决的问题,比如偏见、劳动力和能源等等。如果人们袖手旁观,未来将很有可能无法控制人工智能如何发展以及它如何在各种各样的领域中被使用。技术的应用有着风险,但也蕴含着巨大的机遇。建筑师不仅可以与机器合作,还可以与其他专业人士、其他学科的研究人员以及客户以全新的方式进行合作。期待人工智能能够开启一个全新、开放、共享和扩展的创造力生态系统。

访谈全文地址:https://www.designboom.com/design/interview-kory-bieg-text-to-image-generators-future-ai-design-08-17-2022/
图文来源:Designboom
举报/反馈

数艺网

1633获赞 332粉丝
发现、分享、交流与新媒体艺术有关的一切
苏州数艺网络科技有限公司
关注
0
0
收藏
分享