年初,ChatGPT掀起了大模型的热潮。

王慧文一封“AI英雄榜”揭开了大模型创业的序幕,王小川、周伯文、李开复等大牛紧随其后;百度发布文心一言、阿里推出通义千问,大厂在面向大众的同时也在疯狂布局企业端,大模型之战一促而发。

经过几个月的疯狂,ChatGPT、大模型和VC都逐渐冷静下来。

根据网站数据分析工具SimilarWeb数据,ChatGPT的访问量环比增长率从今年1月份的131.6%跌落至5月份的2.8%,6月更是首次出现下降,环比降幅达到9.7%。

同期,王慧文被曝因身体原因,从其大模型创业公司光年之外离岗就医。随后,美团宣布王慧文辞去美团董事职务。6月30日,美团官宣20.65亿元收购光年之外100%股权,王兴接棒王慧文。

此外,猎豹移动CEO傅盛与金沙江创投董事总经理朱啸虎在朋友圈围绕“创业者到底该不该逐鹿大模型,能创造什么价值?”互怼。

在过去半年内,国内百余家大模型相继问世,大模型有没有过剩?未来发展趋势如何?如何实现商业化落地,创造价值?AIGC能否带来新的“工业革命”?

硅基智能创始人兼董事长司马华鹏,在接受头部科技CEO张晶晶专访时分享了自己的见解,大模型会呈现行业脑、多模态和中交三大趋势;AIGC产业是将算力、财力、电力高度统一的优秀场景,而硅基生命崛起之势必不可挡;AIGC还将引领服务领域的下半场“工业革命”

硅基智能创始人兼董事长司马华鹏

硅基智能成立于2017年,是一家致力于机器视觉和智能语音等人机交互技术以及商业场景推广的独角兽企业。截至2020年12月的C轮融资,硅基智能已获得腾讯投资,招银国际,国新央企,红杉资本等9轮融资,估值近10亿美元,拥有80余项授权发明专利。

无论是此前爆火的元宇宙亦或是现在AIGC,硅基智能的“数字人”都押中了风口。今年5月硅基智能推出的炎帝大模型,使其数字人在直播、短视频、电影生成等商业化场景中进一步下沉。

数字人可手持产品数字直播、数字人佛陀可表达情绪

目前,硅基智能已经生产近百万数字人。在硅基智能成立之初,司马华鹏就设立了2025年为全球提供1亿硅基劳动力的目标。

对于眼下大众“AI取代人工”的担忧,司马华鹏认为,整个人类的生产、文明,都会因为AI有巨大的发展。当务之急是大家应该尽快找到自己在 AI领域的硅基伙伴,把自己训练成一个半人马座,将碳基和硅基结合形成一种新的战斗力。最终,硅基文明将会到来,这将是一个新的时代。

在AIGC的浪潮下,头部科技作为经历者、记录者,打造【AIGC新纪元】专栏与各位读者共同见证AI带来的社会变革。来到【AIGC新纪元】,这里有你想知道的一切。

专访全文(有文字调整):

AI大模型三大趋势:行业脑、多模态、中交互

头部科技:AI大模型正风靡全球,硅基智能也于5月28日发布了自己的“炎帝”大模型。您曾谈到AI大模型的三大趋势,请与我们分享一下?

司马华鹏:《道德经》里有一句话叫夫唯不争,故天下莫能与之争。2017年,大家都想在AI领域做改变人类的事的时候,我们选择了打电话的机器人。这个方向当时被很多同行嘲笑,觉得没有技术难度。

回到2018、2019年,我们做数字人的时候也被嘲笑。但我认为,一直追寻的不被嘲笑的事情未必是好事情。今年的“百模大战”,我们推出了炎帝大模型,它与众不同,不像ChatGPT那样生成文本,而是生成短视频、直播、电影,甚至生成一个人陪伴你。

我们的炎帝大模型一直定位于视频、直播生成领域,不是为了挑战ChatGPT,我们也会利用GPT4以双引擎状态完成AIGC视频、直播生成。我们和它们是合作而非竞争的关系。这是一个良性发展,特别是能够代表中国特色的人工智能领域的这么一个创新和崛起。

在这个领域,我们提出来三个趋势:

第一个是行业脑。这些ChatGPT是通用的,类似于通识教育法。我们可能在大一的时候,对人间大方向的事情都有所了解,但不是专业性教育。比如说,如果我们进入中医、银行私人客服或证券领域,这些领域的知识沉淀在组织内,而不是组织外。我们可以通过爬虫或其他方式获得这些知识训练成大模型,开发一个行业脑出来。比如说在理财客户经理方面,我们可以利用他们团队的支持数据来训练大模型,从而生成一个优秀的数字员工。明天我们可以在直播运营领域,用类似的方式训练出一个行业脑。

第二个是多模态。在《思考,快与慢》一书中,作者提出了大脑有系统一和系统二的概念。系统一是快速思考,它能得出一些结论并做出一些分析。但是系统一还需要调用多模态的功能,比如说策略选择、策略执行和策略回收,来完成更复杂的任务。例如,当大模型发现摄像头里有个老人摔倒了,它可以选择三个策略中的一个并执行:给老人的儿子打电话、报警或者在门口发出警报。如果第一个策略失败了,它可以切换到第二个或第三个策略。这样的大模型就像我们大脑里的系统一,是一个很重要的部分。但是如果要成为一个完整的生命体,还需要结合四肢和手脚的协调动作。所以我们的硅基智能多模态不仅包括了这些,还加上了形体、形象、情绪等要素,最终形成一个完整的生命。这就是我们多模态的含义。

第三个是中交互。现在很多人都在用ChatGPT做一对一的交互,比如问它一些数学或逻辑问题,但是这样的交互方式并不能充分发挥大模型的价值。因为ChatGPT现在非常优秀,但它每个月只能收到20美金,这与它实际产出的价值不相符。相比之下,如果我们把大模型用在短视频、直播或其他领域生成内容,它能产生的价值就会非常高。所以我们选择了中交互,也就是一对N的交互,让大模型能够为更多的人提供服务。

例如,当我们用大模型画一幅画时,我们不是只给一个人看,而是要展示给很多人看,就像达芬奇画蒙娜丽莎时也是这样。我认为这种一对N的交互模式是未来的发展趋势,因为它能提高投入产出比和性价比,带来更大的优势。

所以,行业脑、多模态、中交互是我认为大模型发展未来必须要经历的三个趋势

硅基生命体三大核心要素:算力、财力、电力

头部科技:硅基智能的数字克隆人有很多的不同的应用场景,在您说的这么多的应用场景里,最核心的有哪些?或者说什么样的、一些更大的需求在驱动着硅基智能的数字克隆人项目进步和发展?

司马华鹏:硅基智能提出的硅基生命、硅基劳动力、硅基文明背后很多核心要素。比如碳基生命的核心要素一是碳基的能源,如石油、煤等。

二是碳基的食物,比如我们中午不吃饭可能就熬不过去。土地,能源,食物都是碳基所必需的。而硅基生命的核心要素是算力、电力和财力,这是它的底层逻辑。我们要开发更多的场景来消耗和产出这些要素,这是我们的市场策略。比如说,能够消耗和产出算力、电力和财力比较多的场景,就是比较好的场景。

我们现在做的短视频、直播、电影生成等,都是消耗和产出算力、电力和财力的场景,我认为这些都是非常重要的。我们也在做虚拟偶像,比如把一些头部艺人做成虚拟男友,每天陪伴用户,这也是有价值的场景。

头部科技:这些场景肯定离不开计算资源和数据,硅基智能在这方面有什么积累?

司马华鹏:我们的目标是通过市场行为把算力赚回来。我们不是像其他公司一样拼命融资去买大量的显卡,而是用我们的商业模式让每一块卡都能产生回报,这样我们就把卡赚回来了。这个过程是财力和算力的双驱动,我认为这是一个良性的过程。比如说,到今年年底,我可能有2万张A 100,那是我赚来的,而不是我一开始就投资了很多钱去买的。

数字人直播,新的商业蓝海

头部科技:听说硅基智能的数字人甚至可以拿着商品类来进行直播,这块技术您可以跟我们聊聊吗?

司马华鹏:我们从2020年年底开始做数字人的直播,到2022年年底才在本地生活领域取得一定的突破。但是现在有很多山寨者、抄袭者,他们只是在数字人前面放两个商品,就说是直播,其实是在割韭菜。我们的数字人不一样,第一它一定是一个情绪非常饱满的数字人,很逼真,很多人都认可,像刘润老师等,我们的数字人可以通过图灵测试。

第二是抖音规定直播中要拿商品,这是基本的要求。我们的数字人可以拿商品、介绍商品、在黑板上写字等,这些都是基本的能力。但是现在有很多山寨同行,他们连这些基本的能力都没有,所以让我们的数字人显得很先进。其实这是一个行业发展得好、有趣或无奈的现象。

第三就是我们有了炎帝大模型之后,硅基智能的数字人不光是有一张皮,而是有真正的大脑了。我们的数字人有三个层次,我们叫数字孪生、数字原生和数字永生,内部称为画皮、画骨和画心。我们的数字人现在已经不是画皮,它有大模型的支撑,它能根据场景、销量、观众反馈等去调整自己的内容,它也能根据用户的情绪去调整自己的情绪,这样就有了共情力和高情绪的表达,这是我们的特点。

图灵测试“死生相契”、乔布斯未竞的第三步,人机交互天花板在哪?

头部科技:现在竞争这么激烈,硅基智能一直能走在行业的前列,有哪些技术优势?

司马华鹏:图灵很早就提出了图灵测试,我们把它扩展成了三层能力测试,这是硅基体的理论。第一层是交互中人和机器难以区分,第二层是不仅难以区分,还能双向的情感交互,我觉得它是真实的,甚至可以跟它产生深厚的情感。

第三层图灵测试是死生相契,就像钢铁侠和贾维斯那样,这个AI和你长期相处,它了解你、学习你,然后成为你的灵魂伴侣,你跟它之间可能达成一种死生相依的关系,甚至你可以把很多东西托付给它。

这是我们在2017年提出来的图灵测试的三层这样一个新的理论。那我们整个的技术架构,包括我们的产品架构都是沿着三层的理论来展开的。

我们的数字人很逼真,很难区分真人和数字人,这是第一层。我们的数字人还能在直播间和短视频里帮客户带货、创造价值,这是第二层,就是双向的情感交互很深刻了。

我们还在做数字人永生,我们也希望达到第三层,就是你的数字人会一直陪伴你,并且你和它之间的情感会很深厚。我曾经在一个论坛上被问到,孩子的工作被AI抢走怎么办?我说我们更应该关心,孩子以后会不会跟AI谈恋爱?这个可能很快就会发生。

头部科技:现在数字人的制作如何能做到人机交互?智能化地制作数字人在未来可能是一个蛮有趣的技术。

司马华鹏:其实交互是整个科技发展的核心的脉络。我们一直讲乔布斯三次改变世界,第一次通过鼠标图形界面改变世界,改变了交互,才有了整个PC互联网,这是一个几万亿美金的产业。

第二次是用手机触屏,这么小小的一个交互改变,诞生了移动互联网这么大的一个产业。第三次Siri被发明出来,但很可惜Siri出来同时乔布斯身体恶化,然后很遗憾地去世了。

这三次革命都是巨大的机会,像Siri这种变革就是我们硅基和ChatGPT在做的,就是用真实的自然语言和人交互。我觉得这才是真正的发展,所以我们团队的愿景是把乔布斯没能完成的事业继续推进,他走了0.5步,我们要走更远。我们要把Siri人格化、智能化,变成能通过图灵测试的贾维斯和我们的灵魂伴侣。现在iPhone里的Siri很鸡肋,这很可惜,我们愿意替乔布斯圆梦。

若AIGC是座皇冠,那电影就是这座皇冠上的明珠

头部科技:近期有消息称硅基智能和头部的艺人公司会达成一些合作,可能计划进军电影行业,您如何看待这个消息?

司马华鹏:我觉得我们从那个年代走过来,年轻的时候喜欢追星,喜欢一些有才华、有魅力的人,这个过程是很正常的。

现在在这个领域,我们和头部的艺人公司合作,把他们的艺人克隆出来,实现艺人方向的平权,就是为了让粉丝每天都能和自己喜欢的艺人实时互动、交流,这是一个很大的需求。

同时我们还有另外一个产品,也是和头部的艺人公司合作把孩子克隆出来,陪伴老人和父母,这也是很重要的。因为我和公司的其他联合创始人都是创业者,经常没有时间陪家人和孩子,我们想要一个能代替我们和我们的父母沟通、交流的孩子的克隆,这是一个很大的需求。

头部科技:硅基智能在电影方面有什么更进一步的市场的一些计划或者战略的发展布局?

司马华鹏:如果说每个科技都有它最难摘的王冠,AIGC的王冠我觉得是电影。电影可以说是整个人类所有的艺术里面的集大成者,它包含了文本生成、图片生成、视频生成等多种技术。我们现在做的短视频、直播、产品等,其实都是电影的一部分,我们的目标是把它们整合起来。

我毕业于南航,我们南航所有的航空航天发射都有一个总工程师,比如说今天有一个登月计划,总工能调动全国非常多的科研院所一起,你生产这个零部件,他生产那个零部件,最后大家运到比如说西昌或者酒泉发射中心,我们按下那个按钮,咱们看到3、2、1发射的时候,其实它就出来了。

数字人最开始的时候,我们先做的是他的听说读写能力,再做外表,最后合成一个有大脑的数字人。电影也是一样,它需要很多能力,我们现在分开做,最终还是要合成一个完整的电影,因为电影是AIGC的最高要求,这个领域有很多大师和世界级的人才。

科技平权,解放人类

头部科技:您在很多访谈上都提到了科技平权,您能给我们再详细地阐释一下科技平权吗?

司马华鹏:我们提出一个逻辑就是先有文艺复兴,才有工业革命,因为文艺复兴他提出来的人的自由、民主、平等,它对应的就是去贵族化,因为在那个时代,贵族所得到的东西和平民得到的东西完全不一样,那么怎么实现自由、民主、平等呢?有一派就是走的革命道路,还有一派走的就是我们今天的科技道路。其实就是德先生和赛先生。在这个领域,我们发现工业革命实际上实现了非常大的平权,工业革命上半场使得每个人,比如说今天,我们都可以吃到过去只有皇上才能吃到的,贵族才能吃到的这些山珍海味,买到很多他们那个时代的贡品,景德镇陶瓷。从商品的选择上面已经实现了平权,这个实际上是一个非常重要的工业革命的成果,就是我们一直讲的,发展才是最好的民主和自由。

工业革命上半场虽然在商品领域实现了平权,但下半场我们看到,在服务领域还是分为三六九等,比如说银行、税务、医疗等等,都是按照客户的财富和贡献来区别对待的。这就是二八原则,即80%的资源集中在20%的客户身上。我们期待人工智能能够引领服务领域的下半场革命,把服务行业也能够实现一次平权,让每个人都能享受到高品质的服务,比如说无论存款多少,都能有一个虚拟的私人银行经理,而且是模仿最优秀的私行服务。

头部科技:您个人对AIGC的发展有什么样的愿景?您希望硅基智能在当中承担一个怎样的角色?

司马华鹏:我们的口号是让人回归人的价值,让AI承担99%的汗水,让人专注于1%的灵感。这是我们的核心理念。我们知道,很多人对AI的发展感到担忧,担心AI会抢走我们的工作和生活。但是我认为,从我们过去,像我小时候是一周休息1天,后来发展成2天,很快我觉得我们一周休息3天、4天,甚至5天,我觉得都是可能的。因为AI其实给我们带来了更多的机会和可能性,让我们可以享受更多的休闲和创造,让我们可以躺平赚钱。所以我觉得大家不要恐慌于目前AIGC带来的一些职业上的挑战,我认为接下来整个人类的生产、文明,都会有一个非常大的发展,我们大家要期待这样的时刻到来,希望大家对于这样的发展,我们更多的是拥抱,我觉得在这个事情上,我希望大家能够跟硅基一起来迎接硅基文明的到来。

头部科技:请您对未来的AIGC新世界说一句话。

司马华鹏:我希望大家真正的拥抱AIGC新时代,迎接硅基文明的发展。这个对于所有人而言,最后一定不是AI打败了你,而是使用AI的人打败了不使用AI的人,所以大家尽快要找到自己在AI领域的partner,就是你的硅基伙伴,然后把自己训练成一个半人马座,碳基和硅基结合形成一种新的战斗力,这是我对这个时代的期待,也希望大家能够迎接新时代。

硅基智能创始人兼董事长司马华鹏(左)、头部科技CEO张晶晶(右)

如果您有什么想说的,欢迎屏幕前你们在评论区留言讨论!我们将为点赞、评论、关注的同学们送上红包🧧不限量哟~

举报/反馈

头部科技

8821获赞 815粉丝
科技推动未来,头部率先启航!
智瓴清创(北京)科技有限公司
关注
0
0
收藏
分享