77百科网
当前位置: 首页 生活百科

so a模式(这个自蒸馏新框架新SOTA)

时间:2023-07-29 作者: 小编 阅读量: 2 栏目名: 生活百科

机器之心专栏

机器之心编辑部

OPPO 研究院联合上海交通大学提出的新的自蒸馏框架DLB,无需额外的网络架构修改,对标签噪声具有鲁棒性,并可大幅节约训练的空间复杂度,在三个基准数据集的实验中达到了 SOTA 性能。

深度学习促进人工智能(AI)领域不断发展,实现了许多技术突破。与此同时,如何在有限硬件资源下挖掘模型潜能、提升部署模型的准确率成为了学界和业界的研究热点。其中,知识蒸馏作为一种模型压缩和增强的方法, 将泛化能力更强的「大网络模型」蕴含的知识「蒸馏」到「小网络模型」上,来提高小模型精度,广泛地应用于 AI 领域的全监督、半监督、自监督、域迁移等各个方向。

近日, OPPO 研究院联合上海交通大学将视角聚焦到知识蒸馏的范式本身,提出了新的自蒸馏框架:DLB(Self-Distillation from Last Mini-Batch),模型无需额外的网络架构修改,对标签噪声具有鲁棒性,并大幅节约训练的空间复杂度。此外,在三个基准数据的实验中,模型达到了 SOTA 性能。相关论文「Self-Distillation from the Last Mini-Batch for Consistency Regularization」已被 CVPR 2022 收录。

论文链接:https://arxiv.org/pdf/2203.16172.pdf

DLB 自蒸馏框架

如何减少蒸馏计算复杂度?

知识蒸馏通常可以划分为三类,即离线蒸馏、在线蒸馏和自蒸馏。其中,自蒸馏具有训练轻量、知识迁移效率高的特点,最近受到更多研究者的重视。

图 1:本文方法与其他自蒸馏方法的比较

但是传统的自蒸馏,例如 Be Your Own Teacher,在模型训练过程中需要对模型结构进行修改。除此以外,训练成本高、计算冗余且效率低下也是自蒸馏需要攻克的难题。

为了解决上述难题,让模型更好地部署到手机等终端设备中,OPPO 研究院和上海交通大学的研究员们提出了 DLB 自蒸馏框架。利用训练时前后 Batch 预测结果的一致性,在无需对模型进行网络结构修改的前提下,就能降低训练复杂度,增强模型泛化能力。

1. 本文的任务

提出更加轻量的自蒸馏方式,降低训练的计算复杂度,提高模型准确率和泛化性。

2. 本文创新与贡献

    提出 DLB,通过保存与下个 Batch 部分样本重叠的软目标(soft targets)进行自蒸馏。节省计算内存,并且简化训练流程。让训练样本的每次前向过程都与一次反向传播过程相关联,从而提升学习效率。实验分析了 DLB 训练方法的动态影响,发现其正则化效果来源于即时生效的平滑标签带来的训练一致性,为自蒸馏的理论研究提供了实验基础。

DLB 自蒸馏框架训练机制

DLB 在训练阶段的每个 iteration 中,目标网络扮演着「教师」和「学生」的双重角色。其中,教师的作用是生成下一个 iteration 的软目标进行正则化;学生的作用是从前一个 iteration 平滑的标签中蒸馏,并最小化监督学习目标。

数据集定义为

,包含 n 个样本的 Batch 定义为:

,以图像分类为例,图片先进行数据增强,然后将其输入神经网络,优化预测输出与真值间的交叉熵损失:

上式中 p_i 的表达式如下:

θ为网络参数,K 表示分类类别数,τ表示温度。

为了提高泛化能力,传统的 vanilla 知识蒸馏通过额外优化的 KL 散度损失来迁移预先训练好的 teacher 网络的知识,即:

不同于以往采用预先训练 teacher 模型的方式生成(P_i^τ ) ̃,DLB 采用训练中前一个 Batch 蕴含的信息生成(P_i^τ ) ̃,并将其作为正则化的即时平滑标签。

图 2:DLB 训练方式示意图

如图 2 所示,数据样本在第 t 次迭代时的定义为

,神经网络的参数为θ_t。

B_t 和 B_(t-1)是通过使用数据采样器获得,在前向过程后计算 L_CE。每个小批次的一半限制为与上一个 iteration 一致,其余一半与下一个 iteration 一致。之后,前半部分小批次利用上一个 iteration 中生成的动态软目标进行学习。即

由 t-1 次迭代的软标签(soften labels)

生成。因此,引入的正则化损失公式如下:

存储平滑标签只需要很少的额外内存成本,所以带来的额外计算成本很低。整体损失函数由下式表示:

综上,DLB 算法整体的训练的伪代码如下所示:

实验设置

研究员们采用三个图像分类基准数据集评估性能,包括 CIFAR-10、CIFAR-100TinyImageNet。实验结果都达到了最佳性能,如下表所示:

具体而言,在平均错误率层面, DLB 在 CIAFR-100 改进幅度为 0.83% 至 2.50%,在 CIFAR-10 上为 0.37% 至 1.01%,在 TinyImageNet 上为 0.81% 至 3.17。值得一提的是,DLB 的表现明显优于 Tf-KD 和 PS-KD,这证明了 DLB 在模型泛化提升上的优势。

为了评估 DLB 与基于数据增强正则化方法的兼容性,研究员在 CIFAR-10 和 CIFAR-100 上将 DLB 与 CutMix、CutOut 和 DDGSD 相结合。如下所示,实验表明通过结合 DLB 和基于增强的正则化,可以实现额外的性能增益。

为了证明鲁棒性,研究员在训练之前向 CIFAR-100、CIFAR-10 随机注入标签噪声,实验结果如下图所示,DLB 可以有效地抵抗标签噪声并提高整体性能。

结语

本文提出了一种基于自蒸馏思想的深度学习训练策略,将自蒸馏思想融入到模型训练过程中,对传统知识蒸馏进行改进,无需额外预先训练 teacher 的过程。通过在三个基准数据集上进行实验,多维度论证了 DLB 训练策略的有效性与普适性。

当下,深度学习网络模型结构复杂度不断提升,使用有限硬件资源开发和部署 AI 模型成为新的科研问题。在本文中,研究员设计的 DLB 训练策略,在某种程度上解决了「不增加模型复杂度,提高模型准确率」这一业界难题。

未来,OPPO 将持续研发该算法,并将其赋能到相关业务场景中,不断提升 OPPO 产品的用户体验。

    推荐阅读
  • 2022年最大超级月亮上演(今年最大超级月亮来了)

    近地点距离小于36万公里,远地点则超过40万公里。2022年7月13日,北京,一架即将在北京首都国际机场降落的空客A321客机从“超级月亮”前飞过。2022年7月13日,南昌,超级月亮出现在城市上空。2022年7月13日晚,长沙,“超级月亮”现身夜空。通常情况下,每14个朔望月,就会出现一次“超级月亮”。下一次“超级月亮”将出现在2023年8月31日。

  • 我们可以对美国人说no(不吐不快和美国做)

    在这一轮的“火”中,前一个“xx”指身处变局的阿富汗,后一个“xx”则指美国及其陷入阿富汗事务的“盟友”。美国在“坑”盟友方面可谓驾轻就熟,背后“捅刀子”、推入火坑、翻脸不认人、见死不救……山姆大叔眼里,所谓盟友无非是主从关系昭然若揭,所谓盟友其实更多是服务于美国霸权利益的棋子罢了。一声是对美国两面三刀做派的无奈,一声是对美国装腔作势的鄙视。

  • 梦见沼泽地含义(梦见沼泽地含义是什么)

    梦见沼泽地含义文职工作者身陷沼泽地,从事的多为协助性工作,受他人的制约较强。同时,工作上的难题如果能从不同的角度考虑,较容易突破局限,迎刃而解。男士梦见沼泽地,大吉。但小心隐藏着盛极必衰的预兆。言行要谨慎,以确保好运的继续开展。女士梦见沼泽地,最近爱情方面运势复杂。情侣间需要花较多的时间来经营爱情,尤其注意相处时不要过多提到其他异性以免误会。您恋爱欲望强烈,对心仪者会展开爱情攻势。

  • 买牛肉怎么挑选背脊肉(买牛肉怎么挑选背脊肉呢)

    新鲜的牛里脊肉是有一定的弹性的,而且弹性不错;另外,里脊肉相比于其他肉类来说更加紧致,这就是的表面的紧致可以感受到,表面相对来说不沾手。

  • 常见海鲜图文介绍(渔民整理的海鲜大全)

    你即使是吃货(食神),下面的海鲜你也不一定全认识,下面是一渔民整理的资料,给大家普及下知识吧!虽然如此,但是小可还是极力不提倡食用。

  • 樟脑丸有无味的吗(你家的樟脑丸是樟脑做的吗)

    萘丸萘丸的中毒症状表现为恶心、呕吐、腹痛、腹泻、头晕、头痛等。长期与萘丸放在一起的衣服,婴儿穿后会引起黄疸病,有的甚至有生命危险。虽然国家已经明令禁止,但仍有一些不法商家在私自生产加工萘丸。如何鉴别买回来的樟脑丸1、由于合成樟脑和天然樟脑的密度较小,放入水中不会下沉,而对二氯苯或萘丸的密度较大,放入水中会沉入水底。

  • 姜恩惠演过什么电视剧(认识了解一下姜恩惠)

    同年12月25日,以该片获得第34届韩国黄金摄影奖最佳女新人奖。2015年11月19日,出演爱情电影《禁止的爱:善良的小姨子》。后来拍摄了《法利赛人》,自2012年退出团体后,积极发展戏剧之路,演出19禁电影《法利赛人》。姜恩惠,1988年3月28日出生。韩国女歌手、演员。2008年,成为NineMuses组合成员,正式出道前退出。2011年,成为DalShabet队长,同年1月4日,发布出道专辑《SupaDupaDiva》。同年5月24日,宣布退出组合个人发展。

  • 孕妇嗜睡正常吗(怀孕初期孕妇嗜睡正常吗)

    因为怀孕后,女性绒毛膜性腺激素增加,使得身体容易疲累。基础新陈代谢增加所致女性孕后基础新陈代谢增加,妊娠期母体分泌系统产生变化,体内热量消耗快,血糖不足,就容易造成嗜睡的现象。

  • 空调制热的正确操作方法(空调制热的正确操作方法介绍)

    空调制热的正确操作方法遥控器、安装好电池备用、空调电源插好。遥控器对准空调线上屏、按“开关”键、听到提示音、空调启动。按“模式”键选择、遥控器显示屏最左侧数列最下方显示、就是制热模式。按“+-”键调整设定温度、按要求设定在24℃、等几分钟、空调压缩机开始工作并开始放气、按“风速”键调整放气大小,按“上下左右”键调整风向。如果没有原装遥控器,可以买一个万能遥控器,按说明书操作即可。

  • 谷雨的节气特点(谷雨的节气特点是怎样的)

    谷雨节气后降雨增多,雨生百谷。这时,南方的气温升高较快,一般4月下旬平均气温,除了华南北部和西部部分地区外,已达20℃至22℃,比中旬增高2℃以上。华南东部常会有一、二天出现30℃以上的高温,使人开始有炎热之感。华南春季气温较高的气候特点,有利于在大春作物栽培措施上抓早。还有谷雨节气如气温偏高,阴雨频繁,会使三麦病虫害发生和流行。广大农村要根据天气变化,搞好三麦病虫害防治。