近日,我院计算机科学与工程系边山副教授和研究生李颖等人的学术论文“CNN结合Transformer的深度伪造高效检测”在《中国图象图形学报》2023年第3期发表。该文章获得相关领域学者的广泛关注,论文访问量为当期排名第一,为此学报专门制作了推荐专题,在中国图象图形学报公众号中进行推送和宣传。
该论文针对现有深度伪造检测方案在跨压缩率、跨库检测场景下检测精度显著下降且训练时间过长的问题,提出了一种基于Vision Transformer及EfficientNet-B0的双分支联合网络模型,结合随机模糊的数据增广策略,提高了模型在跨压缩率上的检测准确率。该方法在主流深度伪造数据集FaceForensics++和Celeb-DF上与现有方法进行对比实验。实验结果表明,该方法能够更好地应对跨压缩、跨库场景的检测需求,提升了检测性能,同时缩短了训练消耗时间,较现有主流检测算法更易推广至现实应用场景。该项研究获得国家自然科学基金项目(62172165,61872152,U2001202,62072480);广东省基础与应用基础研究重大项目(2019B030302008);广州市科技计划项目(202102020582,201902010081)项目资助。
《中国图象图形学报》是被国内主要检索系统收录的核心中文期刊,是图像图形学及相关领域的权威性杂志,同时是中国计算机协会推荐的T2类核心期刊,具有较广泛的影响力。
论文引用信息:Li Y, Bian S, Wang C T and Lu W. 2023. CNN and Transformer-coordinated deepfake detection. Journal of Image and Graphics, 28(03):0804-0819(李颖,边山,王春桃,卢伟. 2023. CNN 结合 Transformer 的深度伪造高效检测. 中国图象图形学报,28(03):0804-0819)[DOI:10. 11834 / jig. 220519]
论文链接:http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20230313&flag=1