49 / 2022-09-27 11:14:33
融合注意力的拉普拉斯金字塔单目深度估计
终稿
余伟群 / 云南师范大学
张亚萍 / 云南师范大学
刘佳涛 / 云南师范大学
随着深度神经网络的迅速发展,基于深度学习的单目深度估计研究集中于通过编码器-解码器结构回归深度,并取得了重大成果。然而,在大多数传统方法中,解码过程通常重复简单的上采样操作,存在无法充分利用编码器的特性进行单目深度估计的问题。本文针对这一问题提出一种结合注意力机制的致密特征解码结构,以单张RGB图像作为输入,首先使用编码器提取特征,编码特征被送入拉普拉斯金字塔分支中用于生成由拉普拉斯金字塔分解定义的深度残差,将各尺度拉普拉斯残差融合到解码过程中;在解码器中引入注意力机制进一步提高深度估计效果;最后结合数据损失和结构相似性损失,提高模型训练的稳定性及收敛速度。实验结果表明,在KITTI数据集上与现有的模型相比,该方法对于单目深度估计有效,均方根误差相较于先进的算法LapDepth降低了4.8%,训练代价降低了36%。
重要日期
  • 会议日期

    11月18日

    2022

    11月20日

    2022

  • 10月25日 2022

    初稿截稿日期

  • 11月20日 2022

    终稿截稿日期

  • 11月21日 2022

    注册截止日期

主办单位
中国仿真学会
中国图象图形学会
中国计算机学会
承办单位
北京航空航天大学云南研究院
云南大学
云南艺术学院
昆明理工大学
协办单位
虚拟现实技术与系统国家重点实验室(北京航空航天大学)
北京市混合现实与新型显示工程技术研究中心(北京理工大学)
计算机辅助设计与图形学国家重点实验室(浙江大学)
文旅部闽台非遗文化数字化保护与智能处理文化和旅游部重点实验室(厦门大学)
云南省人工智能重点实验室(昆明理工大学)
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询