56 / 2022-09-29 13:30:30
基于CLIP和双空间自适应实例归一化的图像翻译
终稿
李田芳 / 云南大学信息学院
普园媛 / 云南大学信息学院
摘  要:现有的图像翻译方法大多需要依赖数据集域标签才能进行,这种依赖往往限制了它们的应用范围。而目前针对完全无监督图像翻译任务的方法虽然能解决域标签的限制问题,但普遍存在源域信息丢失的现象。为此,本文提出一个基于CLIP和双空间自适应实例归一化(DSAdaIN)的无监督图像翻译模型。首先,针对数据集域标签的依赖问题,引入了CLIP相似性损失对风格特征施加约束,以在完全无监督的情况下实现图像翻译。然后,为了能够较好地保留源域信息,提出了一个新的双空间自适应实例归一化网络来优化风格特征和内容特征的融合过程。最后,为了确保翻译过程中CLIP相似性损失能够发挥作用,提出了鉴别器匹配对比损失来平衡生成对抗网络损失的优化过程。在数据集AFHQ和CelebA-HQ上的实验结果均表明,本文方法在定性和定量的评估上均优于现有方法。
重要日期
  • 会议日期

    11月18日

    2022

    11月20日

    2022

  • 10月25日 2022

    初稿截稿日期

  • 11月20日 2022

    终稿截稿日期

  • 11月21日 2022

    注册截止日期

主办单位
中国仿真学会
中国图象图形学会
中国计算机学会
承办单位
北京航空航天大学云南研究院
云南大学
云南艺术学院
昆明理工大学
协办单位
虚拟现实技术与系统国家重点实验室(北京航空航天大学)
北京市混合现实与新型显示工程技术研究中心(北京理工大学)
计算机辅助设计与图形学国家重点实验室(浙江大学)
文旅部闽台非遗文化数字化保护与智能处理文化和旅游部重点实验室(厦门大学)
云南省人工智能重点实验室(昆明理工大学)
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询