
作品简介
本作品是一个基于联邦学习的安卓恶意软件识别系统,旨在有效识别安卓平台上的恶意软件,同时保护用户隐私。该系统由多个关键模块组成,包括联邦学习模块、特征提取模块、报告生成模块和前端交互模块。联邦学习模块位于后台,利用 drebin 数据集进行模型训练,通过隐私保护机制确保数据安全。特征提取模块采用静态特征提取方法,获取 APK 的Activities、Receivers 等关键特征。报告生成模块借助大语言模型 DeepSeek,自动化生成详细的检测报告,支持 HTML 和 Word 格式。前端交互模块则通过网站串联各功能模块,实现用户与系统的便捷交互。
该系统的优势主要体现在以下几个方面。其一,隐私保护机制强大,通过差分隐私注入、参数压缩与软化等手段,有效抵御成员推理攻击,确保用户数据安全。其二,模型具备出色中国高校计算机大赛——网络技术挑战赛选拔赛阶段作品设计文档的鲁棒性,通过对抗样本防御机制,提升模型对关键特征的判别能力,确保检测的准确性与可靠性。其三,支持动态演化与可解释分析,通过联邦蒸馏机制和大语言模型,构建动态更新和详细分析的检测系统,提供可解释的检测结果和建议。其四,自动化报告生成模块显著提升报告生成效率,减少人工工作量,满足不同用户需求。
本作品不仅为安卓恶意软件检测提供了高效、安全的解决方案,也为隐私保护和模型可解释性研究提供了新的思路和方法,具有重要的理论和实践价值。
作品设计
基于我们的项目作品流程设计思路,我们将整个工作方案划分成 4 大模块。一是联邦学习模块,二是特征提取模块,三是报告生成模块,四是前端交互模块
联邦学习模块位于后台,使用 drebin 数据集进行训练联邦学习模型,用于根据输入的数据输出恶意指数和良性指数,来判断 apk 是否为恶意。
特征提取模块使用静态特征提取方法,提取 apk 的 Activities、Receivers 等特征。提取完成后会整理并输入给其他模块,以及打包成记录用于“扫描记录”页面。
报告生成模块,数据来自与特征提取模块。通过调用 deepseek API 现场自动化生成针对该 apk 的分析报告。利用 OpenAI 的 DeepSeek API,并预先进行调试和处理,生成专业、准确的报告内容以及实用建议。
前端交互模块主要负责通过网站将多个模块串联,以及为实现用户与系统的交互,提供简洁友好的界面。功能包括:用户上传 APK 文件进行检测,实时监控联邦学习模型训练进度,展示检测结果(文件信息、恶意指标、模型数据、评测报告等),查看历史扫描记录并支持重新分析、生成报告和下载,以及生成并查看详细的检测报告(HTML 和 docx 格式)。
其中的四大模块又可分成 2 大阶段,一是模型训练/预测阶段,二是模型运用与功能实现阶段。第一阶段即基于 Python 库的整体机器学习框架与步骤,第二阶段即模型训练与评估完毕后进行模型应用。通过上述模块化、分阶段的设计方案,确保联邦学习在 APK 检测场景下既能高效训练、实时监控,又能生成可解释报告,并在端到端流程中兼顾隐私保护与对抗防御。
图 1 至图 4 是项目的 APK 检测和分析系统流程。图 1 展示了模型训练和预测阶段的详细步骤,从数据准备到实时反馈训练状态,再到计算性能指标,最终生成模型参数并通过后端接口动态展示训练进度与状态。

图 1 模型训练/预测阶段流程图

图 2 检测结果与扫描记录页面流程图
图 2 描述了检测结果生成后的用户交互流程,用户可以在扫描记录页面查看历史扫描记录,包括 APK 的基本信息和检测结果摘要,并进行重新分析、生成报告或载原始 APK 文件等操作。

图 3:报告查看页面流程图
图 3 则展示了报告查看页面的流程,用户可以从检测结果页面或扫描记录页面点击生成报告按钮进入报告查看页面,这里提供 AI 自动化生成的专业检测报告,支持 HTML 格式的直观展示和 DOCX 格式的下载。

图 4:模型应用与功能实现阶段流程图
最后,图 4 详细说明了模型应用与功能实现阶段的流程,用户在首页上传 APK 文件后,系统会进行 APK 分析,提取基本信息和检测参数,调用训练好的模型计算恶意/良性指标,并生成包含多个模块的检测结果页面,这些模块展示 APK 的详细信息、参数列表、指标可视化,并提供生成报告的选项。