“认知智能”是人工智能技术发展的高级阶段,旨在赋予机器数据理解、知识表达、逻辑推理、自主学习的能力,使机器能够拥有类似人类的智慧,甚至具备各个行业领域专家的知识积累和运用的能力。
认知智能的实现离不开知识图谱技术[4]、自然语言处理技术的支撑。富含实体、概念、属性、关系等复杂信息的知识图谱,是机器认识和理解世界所依赖的知识体系(三观),是认知智能的“大脑”;
它赋予机器联想能力,能从一朵花,关联到颜色、形状、所属科目、能泡茶等信息,真正让机器认识花这个实体。自然语言理解技术是机器认识和理解世界的方式,是认知智能的“神经系统”,其结合知识图谱、持续学习、因果推理等研究领域,并借鉴心理学、脑科学以及人类社会的发展历史,模拟人脑的思考、推理过程,进一步解决复杂的阅读理解问题和少样本的知识图谱推理问题,提高非结构化的语义理解与推理的可解释性,实现基于自然语言理解的认知智能。
知识图谱的数据构建工作繁琐复杂,如何对海量冗杂无序的知识进行建模、转换、关联,至今仍是一项非常具备挑战性的任务。例如谷歌词库、百度百科、维基百科等都可以转换为知识图谱,但工作量大、内容庞杂、关联密度不足。目前小范围内的行业知识图谱表现出不错的效能,如电商、公安行业等; 我们相信,以更好地认知用户需求为目标的电商认知图谱,将助力搜索推荐等从基于行为的方式迈向基于行为与语义融合的认知智能时代,这也是下一代搜索引擎技术的关键。此外,知识图谱获取、建模、融合、计算等各个环节涉及算法的泛化能力差、算法鲁棒性差、算法多样化,缺乏统一的评测指标、算法可解释性差、基础知识库融合困难等,也是当前制约知识图谱技术发展的重要问题。
智能时代下,人们对智能化生活的要求越来越高,海量智能应用需求层出不穷,如智能围棋、智慧搜索、智能推荐、智能人机交互、精准预测等。但仅有感知智能,机器只是能感知世界,拥有简单、预设逻辑的交互能力,却不能像人脑一样理解和决策,无法帮助或替代人处理较为复杂的工作。在公安领域,人脸识别只是让机器能够识别出身份,但是涉及到侦查、破案,就需要对大量碎片化线索数据进行跨时间、空间的多维关联,推理或预测出可能的结果,这些都是仅靠感知智能无法完成的。
在电商行业中,感知智能只能让机器识别图片、视频或文字,而对这些多模态数据融合利用远远不够。简单基于标题关键词的推荐显然不能满足用户的检索需求,如何对视频、图片、文本等多模态数据的内容进行关联分析、识别与理解,提升对图像和视频的有效搜索和检索能力,以便我们可以召回具有适当多模态内容的产品并对其进行排名,帮助消费者做出更好的决策,成为了当前亟待解决的问题。
此外,众所周知,深度学习严重依赖样本,同一算法通过不同样本训练出的模型能力参差不齐,若采集样本中存在某些偏见(如只采集高端人群数据、忽略偏远人群等),深度学习模型在对样本进行拟合的过程中,将毫无疑问地对这些偏见进行学习、甚至放大,而这对电商平台来说无疑是灾难性的。
电商行业的认知智能,需要结合用户购买习惯、浏览序列等丰富的个人信息,进行多模态表示学习、模态映射、对齐、融合与协同学习,同时重点对抗深度学习以来样本数据可能带来的偏见,才能真正实现对用户需求的精准把握与认知。
未来的人工智能将是融合认知科学、脑科学、心理学等多学科的认知智能技术,它强调对人类感知、思考、理解和推理能力的模拟,并能适应复杂环境,使智能体具备高度的认知能力。认知智能的实现不再是虚无缥缈的存在,它即将到来,也许已经到来。而知识图谱技术、自然语言处理技术、深度学习技术的突破是新一代人工智能技术,实现认知智能的基础和关键。