ECCV 2022 | 谷歌提出Data-free NAS,网络搜索仅需一个预训练模型

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: ECCV 2022 | 谷歌提出Data-free NAS,网络搜索仅需一个预训练模型

神经网络架构搜索(NAS) 自 2016 年提出以来就广受关注,很多工作通过设计搜索空间,提升搜索算法等提升 NAS 的精度。今天这篇文章主要研究如何将 NAS 用于数据缺失的情况,文中提出 data-free NAS,该架构仅需要一个预训练模型,就可以自动进行网络搜索。目前该方法主要研究图片领域。


论文地址: https://arxiv.org/abs/2112.02086

代码地址: https://github.com/liuzechun/Data-Free-NAS


Data-free NAS 的架构非常简单,分为两步,第一步用预训练网络模型生成数据,第二步用生成的数据和预测的标签(label)来训练 NAS。


而挑战在于 NAS 需要利用生成的数据训练和评估搜索空间中数以百万计的网络架构的优劣,对他们进行排序。如果生成的数据不够多样,网络就很容易过拟合,所有网络都表现很好,就很难从中筛选出最优网络结构。因此,如何提高生成数据的多样性,使其能支持网络搜索的重任,就取决于生成算法的优劣了。


1. 图片生成算法


这篇文章不仅利用了损失函数计算导数来指导图片生成,还提出了循环生成语义更丰富的标签(recursive label calibration)和区域更新方法(regional update)来提升生成数据的丰富度。


1.1 Loss function


最基础的数据生成方式通过输入一张全是白噪声的图片到预训练网络中,通过计算输出的 logits 和目标标签的损失函数来计算导数,更新图片,并且添加正则化约束。


但这种方式生成的图片容易模式近似,多样性不足以支撑 NAS。


1.2 recursivelabel calibration

因此作者提出循环标签生成(recursive label calibration),主要基于的一个观察:自然图像作为预训练模型的输入时,模型输出的预测是一个分布,最大值是目标类,并且有其他几个峰值落在与之近似的类上。如下图所示,一张自然图像 “咖啡杯” 的预测包含 “咖啡杯” 和相关类“杯子”。


然而针对某一个标签生成的图片往往容易过拟合,从而有极大的预测值在该标签上,但无法发掘语义近似的标签之间的联系,比如下图的 (b) 中,针对“咖啡杯” 类合成的图像,预训练模型仅预测该图像为“咖啡杯”,使得图片过分强化咖啡杯的特征,且不像真实图片。


人们希望生成图片与真实图片尽可能接近,为了做到这点,可以先让生成图片和真实图片经过预训练网络后的预测(logits)尽可能相近。但是真实的训练数据与其 logits 无法获得,因此,作者提出 Recursive Label Calibration,利用循环放大预训练模型对生成图像在语义近似类上的预测值,生成 soft label,再用 soft label 来指导图片生成。


从图(c)中可以看出,使用 Recursive Label Calibration 合成的图像。它会自动将 “杯子” 标识为针对 “咖啡杯” 合成的图像的相关类,并且生成图像看起来也更自然。


1.3 regional update


此外,作者提出的区域更新(regional update),即在生成图片过程中,每次仅用导数更新图片的一个区域,比如针对于 ImageNet 数据集的生成数据仅更新 256×256 的图片范围中大小为 224×224 的随机范围。这样保证每一个 224×224 的范围都可以独立成为一幅生成图片,从而配合后续网络训练中用到的随机裁剪(random crop)数据增强算法。


整体的生成算法如上图所示:输入一张白噪声图片,在生成过程的每次迭代中,一个 224×224 区域是从 256×256 输入中随机裁剪的,利用通过 loss 计算的导数更新所选区域,直到白噪声收敛成合成图片。然后使用预训练模型对合成图像的预测作为软标签(soft label)来指导下一批从白噪声到图片的生成,从而循环生成 soft-label 和与之对应的图片。


2. 可视化和对照实验


这样,生成的图片相比于仅仅用损失函数生成的图片来得更佳多样化,也更接近真实图片:


同时,作者做了多组对比实验,来分析生成图片对于 NAS 标定不同网络结构好坏的准确性的影响。通过计算用生成图片训练网络的精度和用真实数据训练的网络精度之间的一致性,作者分析得出,使用所提出的 recursive label calibration 和 regional update 可以大大提高一致性,使得 NAS 更容易搜索得到最优网络:


3. Data-free NAS 实验结果


最后,作者用生成图片和生成图片对应的预训练网络预测值来指导 NAS 训练,结合三种常见的 NAS 方法,得到 data-free NAS,包括用基于导数的搜索算法 DSRTS [1],基于遗传算法的 SPOS[2],和基于强化学习算法的 ProxylessNAS[3]。


实验结果表明,结合不同的搜索算法,data-free NAS 都能搜索出和用真实图片搜索得到的结构效果相近甚至更好的网络结构,表明了 data-free NAS 的可行性。


Data-free DARTS :


Data-free SPOS :


Data-free ProxylessNAS :


更多结果和方法细节可以参考原论文。


参考文献:

[1] Liu, H., Simonyan, K., Yang, Y., et al.: Darts: Differentiable architecture search. In: International Conference on Learning Representations (2019)

[2] Guo, Z., Zhang, X., Mu, H., Heng, W., Liu, Z., Wei, Y., Sun, J.: Single path one-shot neural architecture search with uniform sampling. arXiv preprint arXiv:1904.00420 (2019)

[3] Cai, H., Zhu, L., Han, S., et al.: Proxylessnas: Direct neural architecture search on target task and hardware. arXiv preprint arXiv:1812.00332 (2018) 

相关实践学习
基于ECS和NAS搭建个人网盘
本场景主要介绍如何基于ECS和NAS快速搭建个人网盘。
阿里云文件存储 NAS 使用教程
阿里云文件存储(Network Attached Storage,简称NAS)是面向阿里云ECS实例、HPC和Docker的文件存储服务,提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。 产品详情:https://www.aliyun.com/product/nas
相关文章
|
7月前
|
Linux
百度搜索:蓝易云 ,Linux系统如何查看服务器带宽及网络使用情况?
通过使用ifconfig、ip、nload和vnstat等命令和工具,您可以方便地查看Linux服务器的带宽和网络使用情况。请根据您的需求选择适合的工具来监视和分析网络流量。
109 0
|
2天前
|
机器学习/深度学习 安全 网络安全
谷歌推出新一代恶意文件检测工具Magika:网络安全的重大进步
【2月更文挑战第9天】谷歌推出新一代恶意文件检测工具Magika:网络安全的重大进步
51 4
谷歌推出新一代恶意文件检测工具Magika:网络安全的重大进步
|
2天前
|
Linux 文件存储 数据安全/隐私保护
百度搜索:蓝易云【centos以cifs协议挂载nas】
通过按照以上步骤,你应该能够在CentOS上使用CIFS协议成功挂载NAS。请根据你的实际情况替换相应的参数,并根据需要进行自动挂载的配置。如果遇到任何问题,可以参考CIFS官方文档或社区寻求更多帮助。
42 0
|
2天前
|
Linux
百度搜索:蓝易云【Linux系统下获取系统、BIOS、进程、网络等相关信息的方法和工具。】
综上所述,通过使用命令行工具和图形化工具,可以在Linux系统下获取系统、BIOS、进程和网络等相关信息。根据具体的需求和使用场景,选择合适的工具和命令可以帮助你更好地了解和管理Linux系统。
66 2
|
2天前
|
网络协议 Linux 调度
百度搜索:蓝易云【Linux网络、进程详解。】
综上所述,Linux网络提供了强大的网络配置和通信功能,支持TCP/IP协议栈和各种网络服务。Linux进程管理涉及进程的创建、状态管理和资源管理,以实现任务执行和进程间通信。这些概念和机制是Linux操作系统的核心组成部分,为系统的正常运行和应用程序的开发提供了基础。
65 0
|
6月前
|
网络协议 网络架构
百度搜索:蓝易云【网络:IP地址、子网掩码、网络地址、广播地址、网段、网关详解。】
这些概念是构建和理解网络的基础,它们在网络通信和地址分配中起着重要的作用。了解和正确配置这些概念对于建立和管理网络是至关重要的。
43 0
|
6月前
|
Web App开发 存储 缓存
离线网络搜索
离线网络搜索是指在本地计算机或移动设备上进行网络搜索,而不是通过互联网连接到远程服务器进行搜索。这种技术可以用于在没有网络连接或网络连接不稳定的情况下进行搜索,或者出于隐私或安全考虑而需要保护搜索历史记录和搜索活动。
424 3
|
6月前
|
搜索推荐
在线网络搜索
在线网络搜索是指通过互联网连接到远程服务器,使用搜索引擎对网络上的信息进行检索和查找。这种搜索方式是我们日常生活中最常用的搜索方式。在线网络搜索可以帮助用户在短时间内找到大量相关的信息,提高信息获取的效率。以下是在线网络搜索的使用方法、适用场景和示例:
118 8
|
9月前
|
机器学习/深度学习
2022玻尔兹曼奖公布:两位获奖者,Hopfield网络提出者在列
2022玻尔兹曼奖公布:两位获奖者,Hopfield网络提出者在列
377 0
http://www.vxiaotou.com