120 / 2025-06-28 12:26:06
基于模型提取攻击的机器学习模型保密性评估方法研究
机器学习;保密性评估;模型结构提取攻击;模型参数提取攻击
全文录用
雷长威 / 国防科技大学系统工程学院
关永起 / 国防科技大学系统工程学院
黄诗岚 / 国防科技大学系统工程学院
韩仲恒 / 国防科技大学系统工程学院
文司晨 / 国防科技大学系统工程学院
孙建彬 / 国防科技大学系统工程学院
机器学习分类模型在市场、医疗、军事等方面具有广泛应用,也因此具备较高的攻击价值。针对机器学习分类模型面临的保密性攻击威胁以及评估手段的匮乏,本文提出一种基于模型提取攻击的两阶段保密性评估方法。该方法通过分别构建模型结构提取攻击环境和模型参数提取攻击环境,检测目标模型在两场景下的防御表现并给出相应的评估指标,最终整合两阶段的评估指标形成保密性综合评估指标。实验结果表明,在6个UCI数据集上,两阶段能够有效实现对目标模型结构与参数方面保密性的评估并给出相关评估指标,可以有效支撑整体保密性指标的构建。该方法为后续完善构建机器学习分类模型评估体系提供了保密性方面的有效评估思路。
重要日期
  • 会议日期

    08月02日

    2025

    08月04日

    2025

  • 07月07日 2025

    初稿截稿日期

主办单位
国防科技大学系统工程学院
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询