短视频时代下,HMS Core的进击与赋能。
(ChinaIT.com讯)我们正处于一个短视频充斥生活的时代。
短视频的发展速度超出很多人的想象,据估计,今年年底市场规模能达到4000亿以上,大规模的创作参与,让内容创作生态不断完善,用户创作音视频也成为移动互联网的主导内容形态。随着视频内容创作节奏的加快,大众鉴赏能力与鉴赏标准的不断提升,也要求创作者不断增强创意设计、增快创作频率。但是,由于用户音视频编辑技术基础相对薄弱,市场强烈需要一种能降低创作门槛、提升剪辑效率的辅助工具。
作为鸿蒙生态的一个移动应用技术底座,HMS Core是怎样理解和破解的呢?
HDC 2022
HMS Core音视频编辑服务的完美一击
11月4日,在以“创新照见未来”为主题的华为开发者大会 2022(HDC 2022)上,作为鸿蒙生态重要组成部分的HMS Core(华为移动核心服务),向开发者全面展示了最新的AI技术与核心服务能力,以帮助更多的应用开发者参与到鸿蒙新生态中。HMS Core的音视频开发生态引领影音、影像美学技术持续升级,进而帮助创作者和开发者在音视频领域打出完美一击。
在HDC音频与视频展区,开发者能够一站式体验HMS Core音视频编辑服务的新特性。参照短视频创作的顺序:勾选视频素材-分割精彩片段-匹配动画特效-添加音乐,HMS Core展台将音频编辑与视频编辑能力结合,将精彩片段一键成片、高拟真歌声合成等AI技术在一台手机上进行了全面展示,重塑了开发者对短视频剪辑的体验:创作可以更便捷,更智能。
除了能一气呵成创作短视频的便捷流程,在展台上还可以体验到视频编辑服务中的一键微笑、动态照片等多种脸部AI能力。令人惊喜的是,导入一张正面脸部的图片,一键微笑能力可以智能匹配出合适的微笑弧度及其牙齿形态,比市面上许多只能露出标准8颗牙齿的微笑特效更加自然。在展台讲解员处了解到,当前HMS Core视频编辑服务不仅有全面的剪辑功能和丰富的素材库,还提供如AI着色等14种AI能力,集成方式也非常简单,最快2小时即可集成使用,这将为开发者大幅降低开发成本,也能更聚焦产品本身,做出具有特色的应用。
华为开发者大会2022主题演讲中提及到的花瓣剪辑一键成片功能,使用的就是HMS Core视频编辑服务“精彩片段”技术。该技术采用华为自研的AI美学评价引擎,综合光影、色彩和构图维度,能精准捕捉到动态人脸和人体,从海量视频中智能提取有较高美学价值的精彩片段。同时,通过超大规模的内容理解模型,视频编辑服务积累了14亿图像语义的训练数据,能支持理解百万场景内容。现在,HMS Core视频编辑服务面向开放者全面开放这项技术。
华为开发者大会2022主题演讲现场
完美的视频
也需要更深入人心的音频
自由创造的除了视觉上的剪辑,音频编辑带来体验感让人更加新奇。我们知道,一段容易被大众所记住的短视频,除了优美和谐的画面,沉浸式的音乐享受同样重要。为了让用户身临其境地畅享音乐,HMS Core音频编辑服务推出了高拟真歌声合成和空间音频渲染技术。
通过使用HMS Core音频编辑服务中的歌声合成技术,创作者只需输入一段歌词,自由选择流行女声或国风女声,系统就可以根据所选的曲式、音色完成高拟真歌声合成,实现媲美真人的虚拟歌声。基于独创的AI Singer模型,音频编辑服务能够精准预测颤音、扰动和换气声等演唱技巧,让拟真的呼吸音与歌曲节奏完美契合,实现歌手级的高水准演唱。这些功能可以在短视频创作、UGC音乐制作、虚拟歌手等领域应用推广,加速推动原创音视频内容和原创IP的创新。另外,据展区工作人员介绍,HMS Core还会继续提供更多人声音色。
立体环绕演唱的沉浸式空间音频体验同样惊喜,感受人声、伴奏、乐器等音频在三维空间来自不同方位、轨迹的立体环绕音效。创作者还可以自由设置三维音效:通过分离人声、乐器的音轨,让不同音源元素在水平线180°环绕耳边,塑造沉浸式声场,还原真实世界的立体音效。这些功能可以用在音乐播放平台、K歌平台、音频制作等领域,为推动音乐娱乐方式的多元化发展提供技术支撑。
开放生态
目前我国的音视频内容创作市场愈发拥挤,用户创作供给却仍然处在扩张期,创作者对于契合自身属性的音视频处理技术存在较高的需求,这也不断促进创作辅助工具及服务的完善。
HMS Core提供的音视频编辑能力,希望和开发者共同构建繁荣的应用生态,为用户提供全场景高品质的智慧生活体验。世有伯乐然后有千里马,在音视频创作领域,HMS Core的能力也正在帮助创作者和开发者们开启星辰大海般的征程,或许将赋予行业更为创新与高效的未来。
来源:36氪