Multi Stage Model Compression using Teacher Assistant and Distil

上传者：fireworks5609 2023-01-22 04:08:47上传 PDF文件 1.21MB 热度 14次

大型神经网络在各种应用中都表现出高性能但是它们不适合智能手机等小型设备.因此需要实现易于部署在小型设备中并具有高性能的小型网络.解决这个问题的方法之一是蒸馏它可以通过从大型高性能教师模型中转移知识来获得具有高性能的小型神经网络.但是如果教师模型和学生模型之间的参数数量存在较大差异则蒸馏可能无法正常工作.在本文中我们使用教师助理TA模型该模型在教师模型和学生模型之间的层数中处于中间位置以执行隐藏层和输出层的多步压缩这是一种称为基于提示的训练的技术.首先我们通过使用教师模型并针对隐藏层和输出层进行蒸馏来优化TA模型.然后使用TA模型作为老师我们对学生模型上的隐藏层和输出层执行相同的提炼.通过这种方式我们通过减小模型的大小同时逐步增加层的深度来提高学生模型的性能.实验表明所提方法能够将简单的CNN模型压缩到参数比原始神经网络约17的大小同时保持测试数据集相同的分类精度.在使用瓶颈架构的ResNet的学生模型中所提出的方法优于教师模型教师模型的参数数量大约是所提模型的8倍.此外与现有研究相比所提出的方法在学生模型中取得了最佳性能.

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Multi Stage Model Compression using Teacher Assistant and Distil

大型神经网络在各种应用中都表现出高性能但是它们不适合智能手机等小型设备.因此需要实现易于部署在小型设...

大小：1.21MB | 2023-01-22 04:08:47
In airhandwriting Chinese Character recognition using multi stage classifier bas

In-airhandwriting Chinese Character recognition us...

大小：1.23MB | 2021-02-21 18:29:27
开源项目itwars Docker multi stage build#an example of docker multi stage building w

开源项目-itwars-Docker-multi-stage-build#an-example-of...

大小：78KB | 2021-01-17 03:00:16
开源项目 itwars Docker multi stage build#an example of docker multi stage building w

大小：0B | 2020-08-15 12:52:49
A general non local denoising model using multi kernel induced measures

Noises are inevitably introduced in digital image ...

大小：2.37MB | 2021-02-17 15:02:33
FedMMD Heterogenous Federated Learning based on Multi teacher

联邦蒸馏是联邦学习中的一种新的算法范式使客户端能够训练不同的网络架构.在联邦蒸馏中学生可以通过提取客...

大小：2.28MB | 2023-02-01 17:13:52
Improved Partial Least Square and Multi group Structural Equation Model Using Di

偏最小二乘的改进与分布式计算下的多对象结构方程模型，阮祥炜，童恒庆，顾客满意指数（CSI）是消费心理...

大小：339KB | 2020-07-21 10:10:21
Multi Document Summarization using Distributed Bag of Words Model中文翻译

很好的一篇多文档摘要的论文,已翻译

大小：810KB | 2021-04-18 07:38:34
Efficient Design of Multi stage Cascade Waveband Separator

We propose a cascade system of filters for realizi...

大小：777KB | 2021-02-20 14:07:03
Fast LZW Compression Using Binary Tree

Fast LZW Compression Using Binary Tree sourcecode

大小：0B | 2018-12-28 23:01:57
Recursive Identification of Micropositioning Stage Based on Sandwich Model With

Recursive Identification of Micropositioning Stage...

大小：1.29MB | 2021-04-08 19:12:59
Image Compression Using DCT Implementing Matlab

ImageCompressionUsingDCTImplementingMatlab

大小：0B | 2019-07-07 09:10:00
Cascaded Photonic Crystal Fibers forThree stage Third order Soliton Compression

Cascaded Photonic Crystal Fibers forThree-stage Th...

大小：180KB | 2021-02-27 07:28:51
Densely Guided Knowledge Distillation using Multiple Teacher Assistants

随着深度神经网络的成功，正在积极研究指导从大型教师网络学习小型学生网络的知识提炼，以进行模型压缩和转...

大小：1.41 MB | 2021-01-24 08:37:34
Multi class classification model源码

多类别分类模型该项目的目的是使用细胞定位位点中的氨基酸序列对大肠杆菌蛋白质进行分类。这可以用来预...

大小：24KB | 2021-04-24 04:00:30
Laravel开发multi model authentication

Laravel开发-multi-model-authentication Laravel对多模型认证...

大小：9KB | 2020-07-17 20:12:10