人工智能是中国为数不多的与世界同步发展的技术领域,经过数十年国内无数优秀科学家、学者、以及众多企业研发工程师的不懈努力,我国部分领域核心关键技术实现重要突破,语音识别、视觉识别技术世界领先。
这一次产业界和学术界深度融合,发挥了更广泛作用,在捷通华声等专注核心技术研发和产业化应用的企业共同努力下,守住了智能语音核心技术在国际竞争中的主动权,中国语音合成产业市场牢牢掌握在我们的民族企业手上。
2000年10月,本着“让机器‘能说会听,能写会看,能辨音会认人,能思考会判断’,为人们的生活带来轻松与便捷”的美好愿望,捷通华声成立,并提出了力争成为国际一流的智能语音技术和智能人机交互解决方案提供商的战略目标,是国内最早投入人工智能领域的创业团队之一。
低调研发与积极开放,走过十年磨一剑的历程
在人工智能的道路上,由最开始人工智能概念的普及,到深度学习掀起新一轮浪潮,到科技战疫、复工复产,再到作为新基建七大领域之一被写入政府工作报告,捷通华声作为业内少有的具有“时代感”的一家企业,每个环节都有参与,有些环节更是作为推动者在做。
自21世纪开始,捷通华声在国内语音市场的占有率一直保持在20%左右,超过国际巨头IBM、摩托罗拉等,二十年来,公司专注于把人工智能技术做出“中国水准”。2011年,基于深度神经网络的声学模型在大词汇量连续语音识别任务上获得了显著的性能提升,智能语音领域研究开始转向深度学习。这一年,捷通华声对外发布灵云(AICloud.com)平台,将语音识别、语音合成、语义理解、机器翻译、图像识别等智能语音、智能语义、智能视觉技术面向产业全面开放。按照公司理念,人工智能包含一整套技术,相互之间有很强的关联性,且在很多场景下都需要同时使用,因此,不同于其他专注单一技术的AI公司,捷通华声致力于做全方位的人工智能。
作为新一代信息技术,人工智能经历了长期的技术磨合和概念炒作期。期间,捷通华声一直专注于低调研发,如果不是特意去了解,大众可能很难知晓在驰骋的高铁上,在2008年北京奥运会、上海世博会以及新近建成的大兴机场等众多应用场景中,都采用了捷通华声的语音合成技术。如今,经过多年技术的更新迭代,声音在更逼真的同时拥有不同音色和不同风格,还基于混合语种的算法研究与数据积累,填补国内智能客服领域关于多国语言、多民族语言、多方言混合语种识别的国内应用空白。
从公司初创到2011年,捷通华声经历的是探索与积累的过程,之后进入发展阶段。随着产学研用体系的完整构建及资金的注入,捷通华声本着对核心技术孜孜不倦的探索精神和务实推进的原则,从低调研发走向积极开放,在不断摸索中走出了自己的道路。即以自主研发的人工智能算法为核心,以市场应用为导向,推进智能语音、智能语义等技术研发持续创新与融合,形成由技术到平台、由产品到解决方案全覆盖的产业生态,全面融入经济社会发展。
能力、应用及场景的融合是AI发展趋势
人工智能是一个由浅入深的智能化过程,浅层上是智能化的人机交互方式,而深层次上则是基于机器学习技术的知识表达、归纳、推理等智能计算过程。如果说智能人机交互是人工智能的触角,那么智能计算则是其核心。依靠深厚的技术底蕴和产业市场的拓展,灵云平台已经成为构建了集合数十项核心技术的全方位人工智能开放平台,主要覆盖智能语音、智能语义、智能视觉和大数据分析四个层面,并构建了包括技术、平台和行业解决方案的产品生态体系。
在信息技术创新与应用上,捷通华声则积极响应关键技术国产化战略,坚持自主创新。目前已实现与鲲鹏、飞腾、龙芯、兆芯处理器,银河麒麟、中标麒麟、UOS统信操作系统,以及高斯、达梦数据库等中间件的兼容性互认证,形成多元异构的信创产品生态,推动人工智能技术与实体经济的深度融合,有望在国家自主可控的发展浪潮下持续受益。
近年来随着我国人工智能技术和产业的迅猛发展,实体经济智能化成为客观发展的必然结果。利用人工智能解决各行业痛点问题、提升生产效率,是驱动其商业化落地的根本动力,在多个应用场景中,AI的广泛应用提高行业精准化服务水平,也提升了人们的生活品质。
随着产业整体步入成熟化发展的新阶段,部分通用化、浅层化的人工智能产品和服务难以较好地满足各行业日益垂直化、专业化、场景化、细分化的赋能需求。人工智能产业的发展需要从场景出发,深入挖掘业务,将多项AI能力进行整合,形成智能化解决方案。捷通华声灵云平台通过与不同行业业务系统的快速对接,实现AI与细分场景深度结合。并在寻求底层技术突破的同时,进行更加契合客户需求的产品化开发,针对客户的特殊需求,推出了不同形态的应用和解决方案,实现在技术层、平台层和应用层的全产业链布局。
“每个行业都有自己的问题要解决,有应用场景要突破,需要技术跟场景的深度融合,这些需求已经不是单一的AI能力所能满足的。人工智能企业需要具备一定的技术沉淀以及行业理解,进行能力融合、应用融合和场景融合。只有实现行业的垂直纵深,技术才能拥有更大的落地价值”。捷通华声董事长兼总经理武卫东在采访中如是说。
场景决定应用,应用决定市场,市场决定企业发展前景
只有企业与用户不断交流,才能够了解用户的诉求,人工智能发展的动能才会有迹可循。AI的本质是科技进步对所有产业的提升,只有AI实现与各传统产业融合应用,才能创造出持续的经济价值和社会价值,反过来,持续向好的经济也会反哺人工智能企业的成长。
公司的发展目标除高瞻远瞩的先见外,还需要实际需求的推动。武卫东在采访中提到,公司要做全方位的人工智能,在产品落地过程中的实际应用场景也是原因之一。技术积累对创新型产业来说是一个漫长的过程,而短期内AI服务商很难将技术直接转化落地应用,缺乏造血机能。如今的政策导向和市场环境使得很多头部企业和初创企业涌入人工智能赛道,但实际拥有核心技术的企业并不多,原因之一就是除了算法算力等硬技术,还需要数据及场景等关键要素的支持,而这,正是长期积累才能够获得的独家资源。例如语音识别的通用模型很容易复制,但一旦深入至B端企业及细分行业场景,单数据加工处理就需要做很多工作。因此,没有深耕行业的决心和韧性的企业无法做到长期发展。
经过多年的实战积累,捷通华声不仅在核心技术上势头猛进,同时对人工智能的场景化应用经验颇丰。例如灵云全方位人工智能能力平台AICP采用开放性架构设计,集成商或客户可以灵活挑选、组合应用各项捷通华声研发的人工智能技术,打造符合自身需求的智能化业务应用。而灵云AICC全智能客服解决方案则在各地进行数字政府建设过程中,有力支撑了政务服务便民热线智能化升级。同时,捷通华声的技术提供形式也在由之前单独的授权,向公有云、私有云解决方案转变。以智能客服为例,如果客户不想搭服务器,公司可提供公有云服务,如果客户要求数据保密,则有私有云服务。换言之,公司可以在能力基础上提供定制化方案服务。
目前,捷通华声为党政、金融、能源、社区、电信、交通等各行业和领域提供了众多智能化解决方案和服务。公司在内生式增长与外延式扩张中不断丰富核心技术,完善产品生态,推动产业智能化升级。
普惠、便利是技术价值所向
显而易见,人工智能是未来社会的趋势,但与大多数人的想象不一样,它是以一种润物细无声的方式深入到大众生活的方方面面,而AI的最终落点也在于是否能普惠民众、便利生活。
在新冠疫情常态化防控中,捷通华声发挥了重要作用。人工智能技术的应用,能够在有效解决人力紧缺问题的同时,降低人与人接触概率,实现群众全覆盖、无死角、无盲区的地毯式专项防控,保证信息畅通与实时共享,使相关部门及时掌握事件相关信息,快速做出正确决策,从而掌握防疫主动权。智能12345政务服务便民热线能够迅速转换工作场景,通过外呼机器人进行批量重点人群筛查、疫情防控和宣教工作,对辖区内人员进行是否外出、人员接触、身体状况等方面的电话问询,并根据交互式问答,主动进行研判,形成调查报告,使得疫情防控效率大幅提升,极大减轻了基层社区人员的工作负担和健康风险。
在金融服务行业的赋能转型上,武卫东认为需要以人工智能为支撑的服务体系、风控体系、运营体系,通过多种新兴技术的交叉运用,在人机交互方式、数字化业务方面不断革新,重构金融用户的消费习惯,构建新的核心竞争力。因此,捷通华声结合多年智能化升级经验,推出了覆盖客户服务、手机银行、营销决策、风险防控、网点智能化等多重场景的行业解决方案。其中针对某银行信用卡中心搭建的灵云智能客服和综合业务外呼组合项目不仅大幅降低业务支出,而且为服务对象带来了实实在在的便利。
据介绍,公司在AIoT智能物联网方面已为华为盒子、智能电视、导航、车载输入法等提供众多解决方案。除此之外也推出了自己的C端产品“灵云听语”“智能录音笔”,支持实时将声音转为文字和离线音频转写,目前处在一个快速发展阶段。“让每个企业都拥有人工智能,让每个人都能享受到人工智能的轻松和便捷”正在步步落地为实。
人工智能是一场没有终点的长跑
基于深度学习的AI技术取得了卓越的效果,伴随而来的则是“大”数据、“大”模型,数据动辄TB量级,模型参数更是达到千亿级别,在如今摩尔定律日渐失效、数据监管收紧的背景下,作为在此领域深耕的一家企业,捷通华声还有很多的工作要做。针对深度学习训练过程中所需的大量人工标注的数据,公司目前主要通过数据仿真、数据增广、无监督训练、多任务等方式进行改进,实现由“大”数据到“小”数据。同时,学术界和产业界则通过模型裁剪、张量分解、研发专用芯片等方式解决“大”模型的困扰。说到底,人工智能是一场长跑,而做研究则是这场竞赛的关键。
目前国内外的一些基础性研究,尤其是方法理论性研究主要来源于大学,捷通华声不仅获得了清华产业基金投资,同时共同创立灵云人工智能研究中心、清华海峡院人工智能研究中心,通过与清华大学各院系教授团队合作,持续强化基础理论研究,促进关键技术成果转化,从而真正推动“赋能百业,共享AI未来”愿景的实现。
谈及人工智能行业经历的数次资本炒作与退潮,武卫东认为2021年资本对于人工智能领域依旧保持很高的热情,因为AI行业完全契合国家战略发展方向,是国家重点鼓励和支撑的产业。但由于很多企业前期投入巨大,亏损严重,估值虚高,所以也在一定程度上困扰了投资人。因此,投资机构将更倾向于以创新能力和技术储备、稳定的业务、合理的估值、可期的发展前景等几大维度进行选择和决策。目前,捷通华声也在不断发展的基础上进行常态化融资,并积极筹备IPO。
2020年,捷通华声成功上榜北京市“专精特新”小巨人首批名单。2021年,多家机构入股捷通华声,在产业层面对公司赋能。一直以来,公司坚持聚焦行业深耕战略,将全方位人工智能技术应用于多行业、多场景,并在细分场景下不断完善业务积累。管理学家吉姆·柯林斯将平庸的企业比作狐狸,因为他们随波逐流跟风取巧,而卓越的企业,往往具备刺猬般的专注。现在回头看看,多项技术融合应用正是AI与各行各业交叉融合,实现产业智能化升级的基础,而这也是新基建的特性之一。
武卫东直言,在人工智能领域,我们和世界发达国家仍存在一定的技术差距。坚持自主研发,全面增强原始创新能力,在新一轮国际科技竞争中掌握主导权,是中国所有科技创新者,包括捷通华声的价值追求,也是责任。智能应用成为互联网下一演进阶段周期的核心要义,人工智能部分技术已经进入产业化发展阶段,带来新的产业兴起。
“我有两个愿望,一个是看到我们国家科技进步,更加强大。另一个就是尽捷通华声最大的能力,推动中国人工智能产业的发展,为经济社会发展贡献一份力量。”采访的最后,这位公司领导人这样说道。
(文/白华)
举报/反馈

互联网周刊

1.5万获赞 3.9万粉丝
全世界各行各业联合起来Internet一定要实现
互联网周刊官方账号
关注
0
0
收藏
分享