5月19日是第11个全球无障碍宣传日,在中国聋协指导下,腾讯搜狗输入法开发上线了无障碍“声文互转”功能,为听障人群在聊天、听课、会议、视频、直播等场景提供语音转文字、文字转语音、悬浮字幕、背景音识别等服务,帮助听障人群在日常生活中自由“听说”,更平等地享受科技带来的便捷。目前该功能已在 iOS 和 Android 端上线,更新至最新版本即可使用。
在对话场景下,听障用户可以将对方的说话内容“听”出来,点击页面上的“麦克风”按钮,即可开始语音识别,实时转成文字显示在屏幕上,该功能还具备多语种及方言识别能力,支持中英文和11种方言识别(粤语、四川话、河北话、天津话、东北话、南京话、武汉话、西安话、贵州话、济南话、河南话)。在实时语音识别过程中,如果出现了掌声或笑声,声文互转功能也会进行识别,并在屏幕上方出现掌声或笑声动画效果,让沟通氛围更真实可感知。
听障用户想要通过声音表达,只需在输入框中输入文字,点击“语音播报”按钮,即可将已输入的文字转成语音并自动播放。为了让声音表达更丰富、个性,“声文互转”运用语音合成技术,提供了不同性别、年龄段、风格的8种语音播报音色,用户可以根据自己的喜好、对话场景、沟通对象随时切换。如果语音播放过程中,对方有内容未听清听懂,点击正在播放的语音气泡可以暂停,再次点击后即可重新播放。
为了让听障人群在视频、直播等场景下拥有更好的体验, “声文互转”还加入了“悬浮字幕”模式。开启悬浮模式后,语音识别的结果会以半透明字幕条的形式悬浮在视频、直播等软件的上层,将软件播放的语音实时转化为文字,并自动滚动显示。目前,“掌声笑声识别”和“悬浮字幕“,暂仅支持Android系统。
无障碍输入是搜狗输入法长期关注和支持的领域。2015年搜狗输入法推出视障输入,为视障群体提供了完整的输入解决方案;2019年,推出点点输入,面向只能使用鼠标输入的肢体障碍群体;2021年推出长辈输入,提升中老年人的手机使用体验;2021年推出了眼动输入,让渐冻症类用户通过眼球转动和凝视操作电脑输入,并联合信息无障碍研究会、全国残疾人用品开发供应总站共同发起“众声”无障碍输入公益计划,向全行业免费开放视障输入、肢障输入、长辈输入、OCR读图、AI手语翻译等技术解决方案。