基于视听时空融合的旅游活动异常事件识别方法
编号:2210 访问权限:仅限参会人 更新:2024-04-12 10:16:28 浏览:828次 快闪报告

报告开始:2024年05月18日 17:15(Asia/Shanghai)

报告时间:5min

所在会场:[S7] 主题7、遥感与地理信息科学 [S7-3] 主题7、遥感与地理信息科学 专题7.3(18日下午,305)

暂无文件

摘要
旅游业蓬勃发展的同时也导致了旅游活动异常事件的频繁发生,随着人工智能技术的发展,多模态地理信息(文本、图像、音频、视频等)已经成为旅游安全监管的重要资源。旅游活动异常事件作为一种典型的多模态要素,除了自身具备的视觉特征外,尖叫声、哭泣声等声学特征也是其重要特征。然而,目前大多研究更多地从视觉模态出发,没有充分利用视频和音频模态间的时空关联性和语义互补性,面向复杂、多变的视频场景时依然存在准确度低的问题。因此,本研究从视频和音频模态数据入手,探究了基于视听融合的异常事件识别机制,从个体和群体角度构建了视听模态时空融合策略和方法,实现了复杂视频场景下更加精准化的旅游活动异常事件识别。
关键词
多模态地理信息;视听融合;异常事件识别;时空匹配;旅游安全
报告人
张峰极
博士研究生 南京师范大学地理科学学院

稿件作者
张峰极 南京师范大学地理科学学院
发表评论
验证码 看不清楚,更换一张
全部评论
重要日期
  • 会议日期

    05月17日

    2024

    05月20日

    2024

  • 03月31日 2024

    初稿截稿日期

  • 03月31日 2024

    报告提交截止日期

  • 05月20日 2024

    注册截止日期

主办单位
青年地学论坛理事会
承办单位
厦门大学近海海洋环境科学国家重点实验室
中国科学院城市环境研究所
自然资源部第三海洋研究所
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询