MSAAv2多尺度注意力模块
多尺度注意力机制的实现挺有意思的,msaav2就是个不错的参考资源。不光结构清晰,模块拆得也比较干净,想自己魔改一下也不难。attention map
的可视化做得还蛮直观,调试起来方便,尤其适合初学者上手练手。
和常见的spatial transformer、seq2seq 自注意力差不多思路,但msaav2
在细节上做了不少优化,比如卷积后直接接注意力层,响应快,效果也还不错。你要是做视觉任务,比如行人检测、红外识别这些,用这个结构能少走点弯路。
我看了一下,有一堆相关资料可以配合一起看,比如这个spatial_transformer 注意力模型,还有视觉注意力模型实现这些,都比较实用。如果你对NLP 方向也感兴趣,PythonBERT也能搭配着了解。
如果你正好在研究多尺度、视觉注意力机制,不妨把msaav2
撸一遍,踩点少,代码风格也清爽,适合改造和迁移。嗯,别忘了注意多尺度融合
的参数设置,调整好了效果会更。
下载地址
用户评论