12月13日,《Nature》公布了2023年度十大科学人物。
与以往不同的是,今年的榜单上除了科学领域的10位学者,还首次出现了一个非人类——ChatGPT。
《Nature》特写部主编表示,这一做法旨在承认“生成式人工智能给科学发展和进步带来的巨大改变。”
毫无疑问,下一个时代是属于人工智能的时代。
2023年,以ChatGPT为首的生成式AI以迅雷不及掩耳之势,引爆了全球人工智能产业的浪潮,从算法到算力,从机器学习到深度学习,无数人把目光投向了大模型。
而就在上周六(12月16日)的极客公园创新大会2024上,百度李彦宏给出了他对于AI行业的思考——
“卷AI原生应用才有价值,大模型的进展对绝大多数人都不是机会。”
11月的深圳西丽湖论坛上,李彦宏也说过,“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”
当前的人工智能技术架构,大约可以分为芯片层、框架层、模型层和应用层四层。如果把AI看作一个人体,算力芯片和框架系统就相当于维持人体运作的细胞和血液,大模型则像一个“超级大脑”,负责各种复杂的调度,最后交由应用层来完成相应的动作。
从这个角度来看,大模型似乎比AI应用更加重要,为什么李彦宏要一再强调AI原生应用才是机会所在?
01
12月6日,谷歌发布大模型Gemini,惊艳了全世界。
在那段6分钟的互动视频里,Gemini会猜拳、识别物体,设计游戏,还会生成音频和图片来辅助回答,被认为是谷歌“迄今为止最强大、最通用的模型”。
然而仅仅一天之后,Gemini就被质疑造假,谷歌官方也承认,演示视频有夸大宣传的部分。
姗姗来迟的谷歌,显然有点着急了。
在大模型领域,海外市场有OpenAI的GPT-4、Meta的LLaMA2等大模型,苹果被曝正在开发Apple GPT,强势入局;国内市场上,截至2023年10月,中国10亿+参数大模型的供给方已达254家,百度的文心4.0、智谱AI的ChatGLM3等国产大模型也正以一日千里的速度狂奔。
对于通用大模型的发展,现在已经不是“最好的时候”,更要命的还有芯片管制和训练成本。
在芯片层,美国更新出口管制,英伟达A100/800、H100/800等AI芯片被限制销售。
哪怕芯片不受限制,大模型训练的天量投入,同样令人望而却步。
硬件方面,一颗A100(80GB)芯片的售价高达1.5万美元,H100的单价更是炒到了4万美元,而训练一个千亿级参数的大模型,通常需要上万颗A100的算力。
这还不包括实际训练过程中的,GPU的平均利用率不足50%。
大模型训练成本中,还有60%来自电费。斯坦福人工智能研究所(HAI)发布的《2023年人工智能指数报告》显示,1750亿参数的GPT-3在2022年耗电量高达1287兆瓦时,相当于120 个美国家庭1年的用电量,即便是Hugging Face更为高效的BLOOM模型,耗电量也达到了433兆瓦时,足够为一个美国普通家庭供电41年。
数据来源:Luccioni et al., 2022,图源:虎嗅
算力规模越大,成本越高昂。根据国盛证券估算,GPT-3的单次训练成本高达140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。
而与高昂投入相对应的,是充满不确定的变现之路。
以OpenAI为例,开发 ChatGPT和GPT-4亏损了约5.4亿美元,仅维持运行ChatGPT,每天就要投入大约70万美元。但在商业化方面,今年2月,Open AI推出AI聊天机器人订阅服务,每月收费20美元;8月又发布了企业版ChatGPT,面向B端和G端用户。尽管奥特曼(OpenAI创始人)声称公司平均每月收入超过一亿美元,但实际盈利能力如何,并没有确切答案。
难怪印度媒体Analytics India Megazine危言耸听地表示,“如果不能尽快获取更多资金,OpenAI或将在2024年底被迫申请破产”。
而支撑openAI的资金,大部分仍然来自于外部投资。
根据《金融时报》报道,微软今年早些时候已经向OpenAI投资了100亿美元(约730亿元人民币),在被问及微软是否会继续投资时,奥特曼也表示“从现在到AGI之间还有很多计算能力需要建立……训练费用非常高”。
大模型是一场不折不扣的氪金游戏,OpenAI这样的超级头部尚且如此,其他中小企业的处境可想而知。
因此卷大模型已经没有意义,而AI原生应用还大有可为。
02
11月30日,A股上市公司信雅达股价突然大涨,截至收盘报11.04元/股,上涨9.96%。
相关股票论坛里,有投资者就股价上涨给出了简要答案:女儿厉害。
原来,信雅达实际控制人郭华强的二女儿郭文景,是新晋大热的AI应用Pika的创始人之一。
据报道,郭文景是一名95后天才少女,早在2015年就作为浙江第一个被哈佛本科提前录取的学生被央视报道,她在哈佛拿到数学本科和计算机硕士学位后,又到斯坦福大学攻读博士学位。
读博期间,郭文景发现了AI工具对于电影制作的巨大潜能,于是今年4月,她和同学Chenlin Meng选择从斯坦福退学,共同开发AI视频工具Pika。
郭文景(左)Demi Guo 和 Chenlin Meng(右)
据报道,成立仅6个月,Pika便完成了三轮融资,总金额5500万美元,估值约2-3亿美元。
到11月29日,旗下第一款应用Pika1.0上线,凭借简单的文字交互、惟妙惟肖的视频生成、电影级别的光影效果,成为AI应用领域炙手可热的新星。
“女儿概念股”的风,也吹到了A股AI应用板块,昆仑万维、万兴科技先后涨停,汤姆猫、福昕软件、国脉文化等强势上涨,为AI应用板块注入了一股快活的气息。
受到青睐的不止Pika。今年以来,几乎每隔一段时间,就会有一个爆款应用横空出世,刷新着我们对于AI的认知。
10月,一段泰勒•斯威夫特说普通话的视频在各大社交媒体上疯传。
在这段视频中,泰勒操着一口地道的中文,声调、音色与原声几无二致,就连嘴型也能完美对上,堪称最强视频翻译。
随后的视频中,艾玛・沃森、憨豆先生也都掌握了一口纯正的中文,而郭德纲、赵本山则说起了英文段子,蔡明甚至还即兴来了一段英文脱口秀。
除了中英互换,还有人尝试将英语翻译成日语等其他6种语言,效果同样拔群。
支持这些视频语言“无缝切换”的,是一款名叫Heygen的AI视频软件,创作者只需要上传视频并选择要翻译的语言,就可以实现自动翻译、调整音色、匹配嘴型。
同时Heygen还支持主播换脸、文字转口播视频、创建虚拟主播等功能,只要上传一段2分钟的视频,就能创作一个和真人一样的数字人,连手势、面容、口型这种细微的肢体语言也能调整。
Heygen创始人Joshua Xu推出了自己的“分身”
更令人欣喜的是,Heygen的母公司是国内的AI初创公司诗云科技,依靠向个人/企业服务收费,Heygen上线178天,公司经常性收入已经达到了100万美元;上线7个月,就实现了盈利。
从早期的AI聊天机器人,到后来的AI图片生成,再到今天,AI应用已经向着难度更高的图文、视频创作发展。
只用20张自拍,妙鸭相机就能实现AI写真;
只需一句话,百度文库就能帮你做出一份配图、图表完备的PPT;
只用两个关键词,Pika就能做出动画版本的马斯克登陆火星……
新技术的真正繁荣,一定是应用的繁荣。
一年前的今天,我们还很难想象AI具体能干什么,而一年后的现在,AI不仅可以创作文字、图片、视频,还应用到了办公、医疗、法律各个行业,且正在以一往无前的态势,颠覆着我们的未来生活。
03
移动互联网时代,中国诞生了像微信、抖音这样的国民级app,到人工智能时代,在基础大模型领域,中国与美国旗鼓相当,而在应用层,我们还在等待下一个超级应用。
那么未来的AI原生应用,具体应该怎么做?
李彦宏的答案是,把所有的产品,用AI思维重做一遍。
在他看来,生成式AI颠覆了既往的人机交互模式,在文心大模型的基础上,百度所有的产品都可以基于AI思维再做一遍,“不是整合,不是接入,是重做,重构。”
比如百度地图,升级版的AI向导只需一句话就可以智能规划路线,还可以导航、打车、订酒店、买机票,一句话实现过去六七步才能完成的操作。
还有百度文库,基于文心大模型重构之后,百度文库从“内容工具”变身“生产力工具”,一句话生成PPT、文档智能总结、文章润色、修改等功能大受欢迎,新功能上线两个多月,累计用户突破1300万人。
不止百度,很多传统企业都在尝试用AI思维重构产品。
像Photoshop,原来只是图像处理工具,而在AI的加持下,新增的Generative Fill(生成式填充)可以根据文本生成新场景,还可以智能扩图、删除对象,大幅提升了用户的生产效率,这一新功能也带动Adobe在美股市场增长71%,其市值从年初至今,增加了1000亿美元。
像Windows,原来只是一个操作系统,在AI助手Copilot的助推下,微软的Word、Excel、PowerPoint、Outlook和Teams等软件被智能协同起来,颠覆了办公场景,其订阅费用达到30美元/月,较此前的Office 365上涨了83%。
或许有人会觉得,AI时代门槛高,机会都在大厂,对广大中小企业和创业者来说,没有足够的资金支持,再好的想法都无法实现。
对此,百度在今年5月推出了“文心杯创业大赛”,以百度的技术积累、资金优势和行业影响力,推动AIGC在医疗、教育、金融、法律等行业应用的重构与改造,其中,智能电商购物助手Buysmart.AI、文档智能助手ChatDOC等15款AI原生应用脱颖而出,加速了国内大模型生态的繁荣。
很多人可能不知道,作为国内最早一批投入人工智能的公司之一,百度在2012年就成立了深度学习研究院。
在一本题为《Genius Makers: The Mavericks Who Brought AI to Google, Facebook, and the World》(《天才制造者:那些为谷歌、脸书和这个世界带来人工智能的独行侠们》的书中,讲过这样一个故事:
2012年12月,太浩湖畔哈拉斯赌场酒店的731号房间举行了一场特殊的拍卖会。
那场拍卖会的主角,是一家只有3名员工,没有产品,也几乎没有任何历史的初创企业,甚至没有几个人听过这个公司的名字。
但参与拍卖的4家公司,分别是谷歌、微软、Deep Mind,以及百度。
他们争夺的,正是现在如日中天的深度学习技术,以及被称为“深度学习”之父的杰佛里·辛顿(Geoffrey Hinton)。
经过多轮加价,DeepMind和微软先后退出,最后只剩下谷歌和百度,百度一直在跟进,价格被推到了4400万美元,双方仍然没有停止的迹象。
最后,辛顿因为太困了,叫停了竞价。第二天,他决定将自己的公司出售给谷歌——
因为身体原因,这位65岁的学者已经长达7年无法坐下来,平时出差要躺着,办公要站着,而长途跋涉往返中国,对他来说不可承受之重。
然而,百度或许错过了辛顿,却没有错过人工智能与深度学习的机会,10年来,李彦宏和百度一直在关注人工智能产业的发展,这才有了今年百度密集性的动作,以及李彦宏对于AI行业的深刻洞见和观察。
他说,大模型时代的来临,真正的价值在于原生应用,而原生应用无论对于大厂来说,对于中小企业来说,对于创业者来说,都是很大的机会。希望大家及早的去把握,尽量多的去尝试,我认为一定能够找到一条符合自己发展的道路。