不否认已有的成绩,但问题还没解决。
为应对自 2017 年起引起全球恐慌的「AI 大毒瘤」Deepfake,政府、企业、学界联合发力。
2019 年,Facebook 斥巨资发起“Deepfake 检测挑战赛”(Deepfake Detection Challenge,DFDC)。最近,Deepfake 检测挑战赛首个结果新鲜出炉,识别准确率最高可达 82.56%,黑盒测试准确率最高为 65.18%。
Deepfake 检测挑战赛缘何发起?
故事源于 2017 年。
美国社交新闻网站 Reddit 一位名为 Deepfakes 的用户利用 AI 把《神奇女侠》女主角 Cal Gadot 的脸嫁接到一个成人电影女主身上,伪造了一段色情视频 po 上网络。
视频火了,Deepfake 技术也火了。
从技术角度来看,Deepfake 是种深度自动编解码器模型(Autoencoder-Decoder),通过用源人物和目标人物的至少几百张照片,训练模型分别识别、还原两人面部的能力,最后用源人物的照片搭配目标人物的解码器,从而完成转换。
毫无疑问,用户 Deepfakes 上传的视频涉及色情内容,且侵犯到了他人隐私,Reddit 官方自然而然地将其封号。不过,Deepfakes 也很刚,作为报复,直接把视频的 AI 代码免费公开。
此后,AI 大毒瘤开始迅速发酵——荷兰网络安全初创公司 Deeptrace 2019 年 10 月发布的关于 Deepfake 现状的报告指出,Deepfake 视频中 96% 涉及色情,在各大色情网站上疯传,所有受害者均为女性,娱乐圈名人成为主要被恶搞的对象。
可见,Deepfake 有着极其恶劣的影响,指不定哪天登上奇奇怪怪的网站连自己都不知道,真是细思极恐。
这还没完,Deepfake 也被卷入了政治中——比如,由于同性性关系在马来西亚属违法行为,2019 年一段马来西亚经济部长 Azmin Ali 与男性发生性关系的视频曝光后搅动了政局,不过 Azmin Ali 表示视频属 Deepfake 技术伪造,认为“这是场政治阴谋”。
基于此,政府、企业、学界下定决心联合起来清除毒瘤。
2019 年 9 月 5 日,Facebook CTO Mike Schroepfer 宣布,Facebook 正与微软联合包括麻省理工学院、牛津大学、康奈尔科技校区和伯克利大学在内的多所大学研究检测 Deepfake 的方法,同时非营利性研究组织 Partnership on AI 也参与其中,该组织的成员包括 Google、苹果、亚马逊、IBM 等大型科技公司。
同时,Facebook 投入了 1000 万美元发起“Deepfake 检测挑战赛”(Deepfake Detection Challenge,DFDC),竞赛于 2019 年末在温哥华举行的 NeurIPS 2019 上正式启动,旨在激励研究人员以及业余爱好者寻找能够识别出由 AI 操纵的视频算法。
Deepfake 检测结果如何?
具体来讲,Facebook 雇佣了 3000 多名不同性别、肤色、种族、年龄的演员录制了大约 10 万个视频片段数据集,其中一部分经过了 AI 的修改,把别人的脸贴在视频里。
雷锋网了解到,Facebook 利用了多种 Deepfake 生成模型、诸如图像增强之类的细化技术以及诸如模糊、帧率修改和覆盖之类的增强和干扰。这样做的目的就是,使数据集能够涵盖实际可能存在的任何类型视频。
为确保挑战赛能达到预期的效果,Facebook 与康奈尔大学、麻省理工学院、慕尼黑技术大学、加州大学伯克利分校、奥尔巴尼桑尼大学、马里兰大学、那不勒斯费德里科二世大学以及牛津大学的专家合作,收集反馈和建议。
下图是 Facebook AI 官方给出的挑战赛时间节点。
可以看出,自 2019 年 12 月 11 日正式启动以来,比赛如火如荼地展开,截止 2020 年 3 月 31 日,约 2114 名参赛者提交了超过 35000 种检测算法。随后的 4-5 月,研究人员对参赛者识别视频的能力进行测试,从而评选获胜者。
终于,当地时间 2020 年 6 月 12 日,Facebook AI 团队公布 Deepfake 检测挑战赛首个结果——视频识别算法准确率最高可达 82.56%,不过在黑盒测试(black box)中准确率最高为 65.18%,这表明特定场景的 Deepfake 视频仍具有挑战性。
实际上,检测 Deepfake 的一个核心挑战就是将新的场景归到已知的例子中,因此难度升级,参赛者须设计即使在不可预见的情况下也可能有效的模型。每个参赛队伍的方案都必须经过黑盒测试,黑盒数据集包括 10000 个比赛参与者无法获得的视频,既有可以在网上找到的视频(有真有假),也包含专门为挑战赛制作的视频。
经过 2 个月重重筛选,排名总算出炉。
获胜者的 ID 都不简单,比如第四名【Eighteen years old】一不小心暴露了年龄,第七名【All Faces Are Real】表达了美好愿望,第九名【名侦探柯西】也是业务能力过硬。
还有推特小伙激动地表示:
仍然不敢相信我们榜上有名!
与此同时,Facebook AI 官方表示,参赛者已经做出了喜人的成绩,但离自动化系统可靠地识别出 Deepfake 内容确实还有一段距离。
Facebook CTO Mike Schroepfer 也在新闻发布会上表示,他对这项挑战赛的结果感到满意,他认为这将为研究人员建立标准,有利于之后的进一步研究:
老实说,这场比赛比我想象的更成功。
实际上,Mike Schroepfer 还表示:
Facebook 目前正在独立开发自己的 Deepfake 检测技术,我们也会根据比赛过程中得到的一些经验对我们的技术进行改进。
另外雷锋网了解到,在即将到来的的计算机视觉领域“奥斯卡”CVPR 2020(2020 年国际计算机视觉与模式识别会议)上,Facebook 还将分享后续的计划、公开挑战赛的原始数据集,并开放获胜算法的源代码,从而为其他参赛队伍提供借鉴,但 Facebook 将对自己的检测技术保密,防止逆向工程。
目前看来,想要完全关上 Deepfake 潘多拉的魔盒,还有很长的路要走。后续研究进展如何,雷锋网将持续关注。
引用来源:
https://www.theverge.com/21289164/facebook-deepfake-detection-challenge-unsolved-problem-ai?scrolla=5eb6d68b7fedc32c19ef33b4
https://ai.facebook.com/blog/deepfake-detection-challenge-results-an-open-initiative-to-advance-ai