文心一格作为百度的AI绘画大模型,已经早早的面向国内外的开发者使用了,也是经受住了万千用户的拷打。在国内的AI绘画模型来说,百度已经是TOP了。而对于新崛起的通义万相,也已经对外邀测了一段时间。那达摩院的力推AI绘画大模型和百度的AI绘画大模型孰强孰弱呢?
最近上线比较火的国产动画电影《长安三万里》中有很对的耳熟能详的唐诗,看着动画电影,听着李白高声吟诵的“两岸猿声啼不住,轻舟已过万重山“看哭了多少成年人。小编想想自己的房贷,也是有点渴望李白此时的潇洒惬意。回到正题,看到这两句诗的时候,脑海中的画面会是:江上一条小船,两岸是绵延不绝的高山,山中时不时的会传来猿啼之声。这是作为灵长动物人的想象的画面。那机器,AI绘画大模型会怎样理解这两句诗,又会给出怎样的生成结果呢?
因为本次主要是对古诗的绘画生成,所以小编就选择了通义万相的中国画风格和文心一格的中国风 输出风格。
一、输入的文本内容是:两岸猿声啼不住,轻舟已过万重山
阿里通义万相:
因为通义万相默认输出的是4张结果,小编选择了2张图以供参考。
百度文心一格:
看来这两句古诗还是有难度的,通义万相输出的结果应该是关键词命中了舟和山,最终生成的效果还是可以采纳的。但文心一格就很直接了无法理解。这个应该是根据各自大模型对于prompt的语义理解问题。基于这样复杂的诗句看来通义万相略胜文心一格一筹,那下面小编就使用简单的诗句对比下各自的生成效果。
二、输入的文本内容是:十里荷花,三秋桂子
阿里通义万相:
百度文心一格:
本次对”十里荷花,三秋桂子“的理解,两个模型都命中了荷花,对于”桂子“都为理解到。但通义万相也很好理解了十里荷花的效果,生成的是成片的荷花,可能文心一格的中国风注重写意吧。这句古诗的理解,个人感觉通义万相的效果更加符合小编的理解。
三、输入的文本内容是:牡丹,花之富贵者也
阿里通义万相:
百度文心一格:
这次的”牡丹,花之富贵者也“的生成效果来看,通义万相和文心一格都很好的理解了文字内容,牡丹的效果很好,牡丹本身就比较雍容华贵。所以整体看结果符合这句古诗的内容。
四、输入文本内容:桃之夭夭,灼灼其华
阿里通义万相:
百度文心一格:
本次是:“桃之夭夭,灼灼其华”表面的意思是:桃花怒放千万朵,色彩鲜艳红似火。当然也有暗喻少女的美丽。通义万相基于这句诗的字面意思理解的很好,生成的图是桃花的繁盛,鲜艳。文心一格输出的结果就有些难以评价了,输出一张人像和一个桃子的图片,这是将字面和暗喻都进行分别的生成吗?如果是这样的理解,文心一格是真的牛了。基于这样的情况,小编不太好对比,这个可以留给读者自行判断,写意和写实哪个更加符合脑海中的画面。
五、输入的文本内容是:红豆生南国,春来发几枝
阿里通义万相:
百度文心一格:
最
后一组对于”红豆生南国,春来发几枝“的生成效果,小编感觉两家也是打平手,以红豆为主的图像。如果详细来说,万相在色彩方面可能更加符合小编的理解。但这个是基于模型选择的输出图片风格决定的。
基于上面五组古诗生成的效果来看,小编给出的对比是通义万相更胜一筹。当然这只是小编的个人意见,仅供读者们参考。小编后续还会继续测试多个风格的生成效果,欢迎小伙伴们关注指导。