摘要
帮你速读文章内容
王田苗教授分享了对具身智能的见解,认为其将引领科技新潮流,推动智能设备和自动驾驶等领域发展。然而,具身智能也面临隐私、技术成熟度及成本等挑战。同时,机器人技术与大型模型的深度融合将成为提升国家竞争力的基石,机器人行业市场规模增速超越全球平均水平。具身智能虽取得显著进步,但仍需解决通用基础大模型、智能进化协调等问题。
摘要由作者通过智能技术生成
有用

面对具身智能的发展热潮,企业在积极投身其中的同时,理应秉持审慎态度,理性地评估潜在风险,以规避不必要的损失。

人工智能已成为当今时代的科技焦点,而具身智能作为其在物理世界的进一步延伸,正逐步展现变革性潜力。通过融合尖端AI技术与物理实体,具身智能不仅推动技术应用进入新时代,更预示智能科技将深度融入社会生活。它将为智能设备、自动驾驶等领域注入新活力,引领生活方式变革,开启人类生活新篇章,同时也将为企业带来空前的发展契机。

然而,具身智能的飞速发展也伴随着隐私、技术成熟度及成本等挑战。为深入探讨其影响并推动可持续发展,四为“All in AI丨人工智能范式变革”课程第四模块课程暨毕业典礼中,特别邀请北航机器人研究所名誉所长、中关村智友研究院院长王田苗教授,分享独到见解,全面解析具身智能的前沿动态,共同迎接具身智能新纪元。

01.科技脉动中的变革力量

大模型+机器人技术的深度融合

根据权威官方信息,机器人技术与大型模型的深度融合将成为提升国家未来可持续发展综合竞争力的基石。历史发展脉络清晰地揭示了科技产业的更迭:2010至2020年间,智能手机产业蓬勃发展;而2015至2025年,智能汽车产业掀起新的科技热潮。展望未来,从2020年至2050年,具身智能产业有望崭露头角,成为引领科技潮头的“弄潮儿”。

除了“大模型+机器人”所起到的基石作用,智能机器人的进一步发展往往受社会需求推动,并紧密跟随这些需求的演变。这些需求可归结为三大核心驱动力:

首先,工业化与城镇化的快速推进,深刻改变了智能机器人的未来发展格局。出于提升效率、保证质量的迫切需求,以及应对劳动力减少和成本上升的压力,推动了机器人在多个产业领域的广泛应用。特别是在“一带一路”战略背景下,机器人工业化生产线的作用日益凸显,有望为经济建设注入更多活力。与此同时,伴随着大城市对农副产品、预制菜和生鲜产品的需求增长,以及对环保问题的持续关注,结合自动驾驶与智能交通的迅猛发展,共同推动了AIoT安全监控、危险救灾机器人以及服务型机器人在各领域的广泛应用。

其次,老龄化社会的趋势和娱乐需求的持续增长,为机器人技术开辟了新的发展方向。随着老龄人口比例的增加,人们对陪护、养老、康复等多功能机器人的需求愈发迫切。同时,年轻人对娱乐科技机器人的兴趣也在不断提升,如虚拟人代理交流、人机混合智能等多样化机器人正逐渐赢得市场青睐。

最后,特殊场景服务需求的增长也推动着机器人技术的进步。在局部战争环境中,军事机器人的需求日益凸显。同时,随着人类对太空探索与移民的渴望,以及医疗健康领域的深入探索,前沿科技叠加特殊场景的需求正在推动机器人技术迈向新的高度。

截至目前,机器人行业发展态势呈现出稳健的上升趋势。官方数据显示,机器人市场持续增长,预计到2024年,全球机器人市场规模有望达到650亿美元,同比增长12%。在各类机器人市场中,工业机器人、服务机器人和特种机器人市场均呈现出强劲的增长势头。

从全球视野来看,中国机器人行业的市场规模增速展现出超越全球平均水平的增长态势。预计到2024年,中国机器人市场规模有望突破251亿美元,同比增长率将达到19.5%。这一增长速度在全球范围内尤为瞩目。

02.从微光到华光

具身智能的“破界定义”与“蜕变进展”

具身智能这一概念,虽早在1950年便由图灵率先提出,但其深远意义直至AI大模型的广泛应用与发展才日渐凸显,成为学术界和产业界关注的焦点。此种融合先进技术的智能形态,正在逐步引领人工智能领域迈入新一轮技术发展的浪潮。简而言之,具身智能代表着一种能够实现思考、感知与行动三者智能融合的机器或系统。它不仅具备人机交互与自然语言理解的能力,更能通过感知、认知、决策等过程与环境及其中的对象进行实时校准互动,以协助人类完成决策与行动任务。此技术的实现,将有力推动现有机器人的智能化升级,加速人形机器人的研发进程,进而为通用机器人生态体系的建立奠定坚实基础。

王田苗教授深刻地指出,具身智能有望成为未来最具影响力的生产工具。其不可替代性不仅将有力推动我国实体经济的高质量增长,更有望构筑起新质生产力的发展格局,对未来国际产业竞争格局与我国综合新质生产力产生深远影响。

具身智能的核心在于深度融合AIGC大模型,探索机器人的规模通用泛化与迁移应用能力。这涵盖了大脑、小脑、肢体、视觉、力觉、触觉以及灵巧手工具等多个维度的研究。其终极追求在于显著提升机器人的环境适应性及智能化水平,从而极大地拓宽其应用范围。

具体而言,具身智能展现出两大显著特征:其一,它基于AI多模态大模型,融入了“人机交互”的核心元素,赋予机器人按照人类意图行事的能力。通过机器学习或大模型,机器人能够将目标分解为一系列子目标或思维链,从而精准完成任务;其二,它强调感知垂直模型的应用,使机器人在非结构化环境中能够进行实时在线学习、识别或修正补偿时变环境,从而提升机器人在多元化场景下的作业能力。

截至2024年,具身智能研究已硕果累累。诸如Figure AI、斯坦福的Mobile ALOHA机器人以及波士顿动力的电驱版Atlas等案例,均彰显了具身智能的巨大潜能。与此同时,具身智能机器人的研究也逐步由过去的符号推理、连接感知、行为交互,演进至更为前沿的文本大模型、多模态大模型、时变感知模型、人机交互思维链以及人机交互传感器与软体机器人的研究阶段。

以谷歌研发的PaLM-E大模型为例,该模型凭借5620亿巨大参数,展示了卓越的任务规划与执行能力。在现实环境中,机器人面对一连串的动作挑战时,往往难以一步到位地完成,而思维链的引入则使机器人能够根据环境变化,将复杂动作分解为多个简易步骤来逐一完成。例如,在向PaLM-E机器人发出“从抽屉中取出零食并交给我”的任务指令时,机器人能够智能地将此任务分解为五个步骤来执行。即便在执行过程中遭遇人为干扰,如将机械臂抓取的零食打落回抽屉,搭载PaLM-E的机械臂仍能灵活调整任务目标,最终成功完成任务。这充分彰显了具身智能在提升机器人智能化水平和环境适应性方面的巨大潜力。

03.行而不辍,唯变不变

具身智能挑战性问题解析

尽管具身智能在近年来取得了显著进步,然而其发展道路上依然充满不少挑战。

首要挑战在于构建机器人通用基础大模型。目前,我们尚未探索出一种既能适应高度动态变化,又具备通用性与可泛化能力的机器人通用基础大模型。同时,AI大模型的培养亦面临多重困境:一是制造生产过程中的高容错率要求,增加了模型开发的复杂性;二是算力模型训练和在线学习的成本持续居高不下,导致实际开销巨大;三是感知大模型在应对多变的非结构化环境时仍存在局限性,复杂畸变动作的大数据完备性和训练问题也成为一项亟待解决的挑战。

其次,智能进化与大小模型的协调问题亦不容忽视。鉴于人类的行为智能进化先于语言智能,这提示我们在脑图谱中,语言、视觉、触觉感知及行为等智能可能受不同模型调控。因此,在推动具身智能的泛化与迁移基础大模型的发展过程中,如何有效连接思考、感知与行动三大智能空间,成为我们面临的关键问题。这不仅关乎对智能行为概率的精准预测,更是决定具身智能未来发展方向的核心议题。

第三个问题聚焦于具身智能的体系结构,其核心要素涵盖环境感知、自身运动及意图任务等。研究者首先需要探讨的是,具身智能是否具备思考、感知、动作三大智能向量空间,以及是否存在逻辑层次的引导与推理,这些问题的答案对于具身智能的体系结构设计与功能实现具有直接影响。

最后一个问题涉及劳动型具身智能的研发与应用领域。当前,劳动型具身智能在商务、工业、农业及消费等领域的应用研发已初见成效。然而,在其他领域的应用仍尚显不足。为推动具身智能的全面发展,我们需要不断拓展其应用领域,并针对各领域需求进行定制化的研发与优化。此举不仅有助于提升具身智能的技术水平与应用效果,更为其未来发展开辟广阔前景。

04.迎风而上,顺势而为

具身智能前沿探索与思考

随着科技的持续进步,具身智能新工业正展现出巨大的发展潜力,其市值有望进一步攀升,有望突破28万亿美元的里程碑。这一前沿产业横跨了无人物流、低空经济、清洁、农业、建筑、生物科技以及资源回收等多个领域。其中,人形机器人和无人驾驶出租车等创新应用备受瞩目,预示着具身智能新工业蕴藏着无限的商业机遇。

王田苗教授对于具身智能的未来持期待而谨慎乐观的态度。他指出,我们正步入具身智能的新纪元,机器人的演变趋势尤为显著。机器人正从过去的关注“硬核”方向,向更关注智能化、软化的方向转变,这一转变得益于机器人大模型的研发。该研发极大地推动了机器人的智能化水平和环境适应性。同时,政策的大力扶持以及社会资本和产业基金的积极投入,为全球范围内的具身智能技术,特别是人形机器人的研发注入了崭新的活力。随着技术的不断进步和供应链的逐步完善,人形机器人的制造成本有望进一步降低。预计未来国外人形机器人的价格将从25万美元降至15万美元,而中国的人形机器人则有望率先将价格控制在30万元人民币以内。

然而,在乐观地看待具身智能前景的同时,我们也必须清醒地洞察到可能存在的挑战。首先,我们尚未探索出一种能够适应高度动态变化、具备通用性和广泛适用性的机器人通用基础大模型。此外,真实、有效且海量数据依然稀缺,这在很大程度上将可能成为制约机器人智能化发展的瓶颈。

从经济视角来看,人形机器人在工业界的应用亦面临多重挑战。尽管它们在某些危险或非结构化环境中展现出显著优势,但其高昂的维护成本、复杂的动态平衡安全控制、有限的电池续航能力以及对基础设施的特殊需求等问题仍需得到有效解决。此外,人形机器人的核心部件,如执行器、驱动器、传感器等,在制造成本中仍占据较大比例,且技术上仍有待突破。

因此,面对具身智能的发展热潮,企业在积极投身其中的同时,理应秉持审慎态度,理性地评估潜在风险,以规避不必要的损失。通过综合考量技术、经济和市场等多方面的因素,中国的创新企业有望更加稳健地把握具身智能新工业的发展机遇,实现可持续发展。

王田苗

北京航空航天大学教授/博导、北航机器人所所长,北航校学术委员会副主任、中关村智友人工智能与机器人研究院院长

现为北航机器人研究所教授博导,机械工业服务机器人重点实验室主任与智能技术与机器人工程技术中心主任,校学术委员会副主任委员。曾获得国家教育部特聘教授长江学者,国家杰出青年基金获得者,国务院学位委员会学科评议组成员及国家自然科学基金信息领域评审专家组成员,国防科技机器人创新团队带头人,“新世纪百千万人才工程”国家级人选,突出专家国务院政府津贴获得者等,曾聘为国家863计划“十五”机器人主题专家组组长、“十一五”先进制造技术领域专家组组长及中国制造业信息化专家组副组长,“十二五”服务机器人重点项目专家组组长,北航机械工程及自动化学院院长,北航机器人研究所所长。

举报/反馈

四为高管教育

167获赞 1.9万粉丝
致力于成为全球高管教育领域的创新典范
关注
0
0
收藏
分享