77百科网
当前位置: 首页 生活百科

so a模式(这个自蒸馏新框架新SOTA)

时间:2023-07-29 作者: 小编 阅读量: 4 栏目名: 生活百科

机器之心专栏

机器之心编辑部

OPPO 研究院联合上海交通大学提出的新的自蒸馏框架DLB,无需额外的网络架构修改,对标签噪声具有鲁棒性,并可大幅节约训练的空间复杂度,在三个基准数据集的实验中达到了 SOTA 性能。

深度学习促进人工智能(AI)领域不断发展,实现了许多技术突破。与此同时,如何在有限硬件资源下挖掘模型潜能、提升部署模型的准确率成为了学界和业界的研究热点。其中,知识蒸馏作为一种模型压缩和增强的方法, 将泛化能力更强的「大网络模型」蕴含的知识「蒸馏」到「小网络模型」上,来提高小模型精度,广泛地应用于 AI 领域的全监督、半监督、自监督、域迁移等各个方向。

近日, OPPO 研究院联合上海交通大学将视角聚焦到知识蒸馏的范式本身,提出了新的自蒸馏框架:DLB(Self-Distillation from Last Mini-Batch),模型无需额外的网络架构修改,对标签噪声具有鲁棒性,并大幅节约训练的空间复杂度。此外,在三个基准数据的实验中,模型达到了 SOTA 性能。相关论文「Self-Distillation from the Last Mini-Batch for Consistency Regularization」已被 CVPR 2022 收录。

论文链接:https://arxiv.org/pdf/2203.16172.pdf

DLB 自蒸馏框架

如何减少蒸馏计算复杂度?

知识蒸馏通常可以划分为三类,即离线蒸馏、在线蒸馏和自蒸馏。其中,自蒸馏具有训练轻量、知识迁移效率高的特点,最近受到更多研究者的重视。

图 1:本文方法与其他自蒸馏方法的比较

但是传统的自蒸馏,例如 Be Your Own Teacher,在模型训练过程中需要对模型结构进行修改。除此以外,训练成本高、计算冗余且效率低下也是自蒸馏需要攻克的难题。

为了解决上述难题,让模型更好地部署到手机等终端设备中,OPPO 研究院和上海交通大学的研究员们提出了 DLB 自蒸馏框架。利用训练时前后 Batch 预测结果的一致性,在无需对模型进行网络结构修改的前提下,就能降低训练复杂度,增强模型泛化能力。

1. 本文的任务

提出更加轻量的自蒸馏方式,降低训练的计算复杂度,提高模型准确率和泛化性。

2. 本文创新与贡献

    提出 DLB,通过保存与下个 Batch 部分样本重叠的软目标(soft targets)进行自蒸馏。节省计算内存,并且简化训练流程。让训练样本的每次前向过程都与一次反向传播过程相关联,从而提升学习效率。实验分析了 DLB 训练方法的动态影响,发现其正则化效果来源于即时生效的平滑标签带来的训练一致性,为自蒸馏的理论研究提供了实验基础。

DLB 自蒸馏框架训练机制

DLB 在训练阶段的每个 iteration 中,目标网络扮演着「教师」和「学生」的双重角色。其中,教师的作用是生成下一个 iteration 的软目标进行正则化;学生的作用是从前一个 iteration 平滑的标签中蒸馏,并最小化监督学习目标。

数据集定义为

,包含 n 个样本的 Batch 定义为:

,以图像分类为例,图片先进行数据增强,然后将其输入神经网络,优化预测输出与真值间的交叉熵损失:

上式中 p_i 的表达式如下:

θ为网络参数,K 表示分类类别数,τ表示温度。

为了提高泛化能力,传统的 vanilla 知识蒸馏通过额外优化的 KL 散度损失来迁移预先训练好的 teacher 网络的知识,即:

不同于以往采用预先训练 teacher 模型的方式生成(P_i^τ ) ̃,DLB 采用训练中前一个 Batch 蕴含的信息生成(P_i^τ ) ̃,并将其作为正则化的即时平滑标签。

图 2:DLB 训练方式示意图

如图 2 所示,数据样本在第 t 次迭代时的定义为

,神经网络的参数为θ_t。

B_t 和 B_(t-1)是通过使用数据采样器获得,在前向过程后计算 L_CE。每个小批次的一半限制为与上一个 iteration 一致,其余一半与下一个 iteration 一致。之后,前半部分小批次利用上一个 iteration 中生成的动态软目标进行学习。即

由 t-1 次迭代的软标签(soften labels)

生成。因此,引入的正则化损失公式如下:

存储平滑标签只需要很少的额外内存成本,所以带来的额外计算成本很低。整体损失函数由下式表示:

综上,DLB 算法整体的训练的伪代码如下所示:

实验设置

研究员们采用三个图像分类基准数据集评估性能,包括 CIFAR-10、CIFAR-100TinyImageNet。实验结果都达到了最佳性能,如下表所示:

具体而言,在平均错误率层面, DLB 在 CIAFR-100 改进幅度为 0.83% 至 2.50%,在 CIFAR-10 上为 0.37% 至 1.01%,在 TinyImageNet 上为 0.81% 至 3.17。值得一提的是,DLB 的表现明显优于 Tf-KD 和 PS-KD,这证明了 DLB 在模型泛化提升上的优势。

为了评估 DLB 与基于数据增强正则化方法的兼容性,研究员在 CIFAR-10 和 CIFAR-100 上将 DLB 与 CutMix、CutOut 和 DDGSD 相结合。如下所示,实验表明通过结合 DLB 和基于增强的正则化,可以实现额外的性能增益。

为了证明鲁棒性,研究员在训练之前向 CIFAR-100、CIFAR-10 随机注入标签噪声,实验结果如下图所示,DLB 可以有效地抵抗标签噪声并提高整体性能。

结语

本文提出了一种基于自蒸馏思想的深度学习训练策略,将自蒸馏思想融入到模型训练过程中,对传统知识蒸馏进行改进,无需额外预先训练 teacher 的过程。通过在三个基准数据集上进行实验,多维度论证了 DLB 训练策略的有效性与普适性。

当下,深度学习网络模型结构复杂度不断提升,使用有限硬件资源开发和部署 AI 模型成为新的科研问题。在本文中,研究员设计的 DLB 训练策略,在某种程度上解决了「不增加模型复杂度,提高模型准确率」这一业界难题。

未来,OPPO 将持续研发该算法,并将其赋能到相关业务场景中,不断提升 OPPO 产品的用户体验。

    推荐阅读
  • 普洱饼保存方法(普洱饼怎么存放)

    我们一起去了解并探讨一下这个问题吧!普洱饼保存方法保存普洱茶饼的方法:避免高温、避免阳光直射、避免接触异味物品、避开湿气,生饼、熟饼分开放。存放在有温有湿有氧无异味的空间,经常调度环境处于最适宜状态,如调节温度与温度,没有条件的话,至少也要通通风,防止让茶发霉。紫砂茶具有其透气,用来存放普洱茶是最好的容器。

  • 初中生投篮技巧(初中生如何投篮才准?)

    初中生投篮技巧瞄篮投篮时瞄篮点在哪里?眼睛应注视篮圈的后沿部分。许多教练教队员瞄篮圈前缘一点,那么做,你不得不比瞄篮点投得更远些。应该每次都投向瞄篮点,犹如神投手一样。如果右手投篮,右脚应直接指向篮圈中央。罚球情况下应把右脚放在罚球线中点,稍前于左脚。罚球线左右的球,在到达篮圈前应旋转一周到一周半。如果没有适当的后旋,就会使球碰及篮圈后向外而不落入球网内。

  • 五香豆腐干的家常做法大全(五香豆腐干的做法)

    辅料:老卤水:一碗,色拉油:1匙,花椒面:少许,味精:少许,五香粉:半匙,辣椒面:少许。这个超便宜的,一块钱一张。我们用开水浸泡一下毒。4锅里放入色拉油,冷油下锅,开大火炸。5炸这个表皮气泡,转小火。7所有的调料调调好。8用厨纸继续把这个豆腐干上这的水分擦干。小窍门炸干水分才会美味。

  • 烫伤起水泡怎么处理才不会留疤(烫伤起泡怎么处理)

    大家好,欢迎关注汇生活小妙招。

  • 口蘑的做法?(口蘑的家常做法)

    以下内容希望对你有帮助!口蘑的做法口蘑、盐(2克)、猪油、味精(1克)、淀粉(豌豆)(5克)。将水发口蘑洗净,切成0.2厘米厚的片。炒锅置火上,放入熟猪油烧热,下口蘑片煸出香味,放入清汤,加精盐、味精,烧沸片刻,用湿淀粉10克勾芡,炒匀后装盘食用。

  • 梦幻西游手游化生新手攻略(化生寺最新玩法攻略)

    今天继续给大家分享一下化生寺的玩法。接下来一一分析其所需装备,宝宝,法宝,静脉,加点和器灵等方面的玩法。对于普通的69平民玩家,建议罗汉以及玉清的位置选择头或者项链,更进一步加个法爆,在进一步简易罗汉,一步到位!

  • 5朵粉玫瑰代表什么意思(5朵粉玫瑰的意思是什么)

    下面更多详细答案一起来看看吧!5朵粉玫瑰代表什么意思五朵粉玫瑰的含义是无悔、由衷欣赏,粉玫瑰属于十分浪漫的花卉,如果将其送给喜欢的女孩子,具有表白的含义,虽然粉玫瑰没有红色玫瑰那般张扬,但也能表达心中的爱意。粉玫瑰的花语为感动、铭记于心,适合送给含蓄且甜美的女孩子,粉玫瑰不仅能代表爱情,还能象征着朋友之间的友情,可以送给关系比较近的朋友,代表着对他的美好祝福。

  • 小淘气尼古拉搞笑(读小淘气尼古拉)

    样子非常的可爱,跟尼古拉的一样的有趣。爸爸想看足球赛,妈妈要看烹饪节目,尼古拉要看牛仔电影,三个人闹了矛盾,家里充满了火药的味道。我们也应该向尼古拉的爸爸妈妈学习,为了孩子做一些舍弃。尼古拉的许多故事特别有趣,孩子看了好玩,大人看了可以引发思考。

  • 名爵hs1.5t用什么发动机 名爵hs2.0t发动机

    近日,我们从相关渠道获悉,名爵全新SUVHS1.5T车型的动力参数信息,最大功率为124kW。根据之前的消息,MGHS将于9月上市。新车上市后将与本田CRV等紧凑型SUV展开竞争,MGHS的高颜值也将使其在这一市场占有一席之地。从汽车油耗标注可以看出,名爵HS将搭载与名爵6相同的15E4E1.5T发动机,最大功率124kW,峰值扭矩250Nm。内饰方面,名爵HS采用红黑配色设计,红色内饰也符合其运动定位。我们将继续关注其上市后的实际售价。

  • 古代气温数据是如何的(没有温度计的年代)

    始终没有两个温度计记录相同的温度,因此人们无法取得共识。冰点,成了第一个被公认的温度标准。今天被称为罗氏温标,它具有历史意义,但并未正式使用。当丹尼尔年仅12岁的时候,他的父亲和母亲死于食用毒蘑菇。华伦海特通过逃离他的出生国摆脱了他的命运。在这一种温标中,原本零度设在盐水的冰点。在全球采用公制刻度后,华氏系统被瑞典天文学家安德斯·摄尔修斯于1742年发明的刻度所取代。