开放期刊系统

高等教育自学考试实践考核中开放式编程题的抄袭检测方法研究

睿 李(西安交通大学继续教育学院,中国)
轶雄 张(西安交通大学继续教育学院,中国)
强 郭(西安交通大学继续教育学院,中国)
昱 王(西安交通大学继续教育学院,中国)
雁 白(西安交通大学继续教育学院,中国)

摘要

高等教育自学考试的软件程序设计课程实践考核通常采用开放式编程题目,抄袭检测是评估学生提交编程作业的重要任务。论文提出了一种基于深度学习的相似性检测模型,以解决源代码与二进制代码之间的跨形态相似性检测问题。通过Joern和IDA Pro工具提取控制流图信息,并融合序列token、字符字面量和控制流图结构等多模态特征,这些特征经过语义编码网络处理生成代表向量。论文介绍了一个对抗编译干扰的对比学习预训练模型,用于提取二进制代码的语义特征。采用三联体损失引导的表示学习,调整源代码与二进制代码的特征表示,实现跨形态的代码相似性检测。实验结果显示,该方法在编译干扰存在情况下能保持93.21%的高准确率。未来研究方向包括进一步分析各模态特征的贡献,并探索引入新模态进行相似性检测的可能性。

关键词

实践考核;编程题;抄袭检测;预训练模型

全文:

PDF

参考

Andrew G, Arora R, Bilmes J, et al. Deep canonical correlation analysis[C]. International conference on machine learning. PMLR,2013(6):1247-1255.

Afham M, Dissanayake I, Dissanayake D, et al. Crosspoint: Self-supervised cross-modal contrastive learning for 3d point cloud understanding[C]. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition,2022(6):9902-9912.

Zhou J, Liu L, Wei W, et al. Network representation learning: from preprocessing, feature extraction to node embedding[J]. ACM Computing Surveys (CSUR),2022,55(2):1-35.



DOI: http://dx.doi.org/10.12345/bdai.v5i5.18057

Refbacks

  • 当前没有refback。
版权所有(c)2024 睿 李, 轶雄 张, 强 郭, 昱 王, 雁 白 Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。
  • :+65-62233778 QQ:2249355960 :contact@s-p.sg