基于视听时空融合的旅游活动异常事件识别方法
编号:2210
访问权限:仅限参会人
更新:2024-04-12 10:16:28 浏览:828次
快闪报告
摘要
旅游业蓬勃发展的同时也导致了旅游活动异常事件的频繁发生,随着人工智能技术的发展,多模态地理信息(文本、图像、音频、视频等)已经成为旅游安全监管的重要资源。旅游活动异常事件作为一种典型的多模态要素,除了自身具备的视觉特征外,尖叫声、哭泣声等声学特征也是其重要特征。然而,目前大多研究更多地从视觉模态出发,没有充分利用视频和音频模态间的时空关联性和语义互补性,面向复杂、多变的视频场景时依然存在准确度低的问题。因此,本研究从视频和音频模态数据入手,探究了基于视听融合的异常事件识别机制,从个体和群体角度构建了视听模态时空融合策略和方法,实现了复杂视频场景下更加精准化的旅游活动异常事件识别。
关键词
多模态地理信息;视听融合;异常事件识别;时空匹配;旅游安全
发表评论