为了让科技帮助更多人,腾讯开放了这些无障碍AI技术

创业家

百家号04-0115:28

人工智能大行其道的现今,AI技术成为了社会建设发展的新动力,从战略上来讲,这是个实现跨越发展的难得机遇,从人文角度来说,新的驱动力也将为社会创造更大的价值。

每个人都应是技术革新红利的受益者

近年来技术的发展普及,让不少人成为了技术革新红利的受益者,在享受高品质便捷生活的当下,却还有一个庞大的群体常常被人忽视,未能充分享受到互联网信息权益。

据第二次全国残疾人抽样调查数据统计显示,我国约有8500多万障碍人士,占全国总人口比例的6.34%。他们也身处这个信息化的社会,和常人一样,在网上进行社交、购物、订车或是购票。但对于他们而言,想要借着科技完全无障碍化的获取信息,还有着很长的路要走。

现如今从社交到衣食住行,互联网可谓渗透到了生活中的方方面面,人工智能也在不断深入应用到各个场景,这一过程也放大了障碍人群在互联网方面的诉求。因此如何帮助他们打破“障碍”,成为近年来多数企业聚焦的方向。

以另一种视角看科技的魅力

2009年间腾讯率先启动了产品的无障碍化改造,包括QQ、QQ空间、QQ邮箱等常用产品已经把无障碍化功能改造纳入了研发的流程。在提高产品易用性、可用性的同时,腾讯也在不断与像深圳信息无障碍研究会这样的合作伙伴进行交流,挖掘出更多的科技应用场景。

而近日,在科技无障碍发展大会上,腾讯在现场宣布QQ空间将启动“无障碍AI技术”对外开放项目,包括OCR文字识别、语音合成、图片转语音三大无障碍AI 技术,将通过“多媒体AI平台”小程序上的“无障碍AI”入口,为企业、开发者提供接入服务。这背后,依靠的是腾讯优图实验室在内的多个产品和研发团队,共同在无障碍应用上的不断探索、互相协作。

回到用户角度来看这三大AI技术,OCR文字识别能够帮助用户精准识别出身份证、指示牌、PPT照片中的文字,让用户以更为便捷的方式来获取文本信息,通过结合语音技术,也能为许多障碍人群提供便利。

图片转语音技术通过多层深度神经网络识别图片,可将图片中的内容有逻辑地组织成语言,以语音的方式来读出图片里的内容,以此可改善障碍人士在社交网络上的体验。

语音合成技术能够定制特定角色声音进行诵读,结合机器学习训练技术,让机器发声更接近真人水准,未来甚至可以用你的声音为千里之外的父母诵读一份报纸、新闻或是说明书。

腾讯的意图是将可用于无障碍领域的AI技术进行聚合与开放,以此为切入点,降低产品应用新技术的门槛,让技术拥有“听得见用得着”的实际价值。

为技术赋予的“价值观”

回头看腾讯此次开放项目的价值,首先他们引领技术朝着更加正能量的方向发展,以实际行动肩负起社会责任,为公益注入科技的力量,也只有这样未来才能看到多元化蓬勃发展的市场。

其次开放项目将会吸引到更多的行业和企业参与进来,并为他们提供技术和产品上的支持,从而将整个市场做的更大更规范,为障碍群体提供更多的高价值产品,也让AI在解决信息无障碍的过程中,能够探索出更多创新可能。

互联网时代的到来,对人们思维方式、交往方式和行为习惯产生了极大影响,而在这个时代下,障碍人群也应当享有对等的互联网信息权益。事实上,我们每一个人在生活中,都可能遇到信息获取或使用有障碍的时候。而随着人工智能技术近年来取得的突破性进展,这些AI技术在无障碍领域的开放应用,也将有助于推动互联网科技和产品的创新,为每个人都带去便捷。

本文来自TechWeb,创业家系授权发布,略经编辑修改,版权归作者所有,内容仅代表作者独立观点。

本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。

返回顶部