基于多维度和多模态信息的视频描述方法 上传者:明月36048 2021-01-16 22:26:04上传 PDF文件 885.21KB 热度 31次 针对视频自动描述任务中的复杂信息表征问题,提出一种多维度和多模态视觉特征的提取和融合方法。首先通过迁移学习提取视频序列的静态和动态等多维度特征,并采用图像描述算法提取视频关键帧的语义信息,完成视频信息的特征表征;然后采用多层长短期记忆网络融合多维度和多模态信息,最终生成视频内容的语言描述。实验仿真表明,所提方法与目前已有方法相比,在视频自动描述任务中取得了较好的效果。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论