ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware #143

gaocegege · 2019-04-25T05:01:47Z

gaocegege · 2019-04-25T05:31:34Z

这篇文章挺有参考价值的，idea 很有趣。机器之心文章里有一个地方写的不清楚比较影响阅读，DARTS 需要的不是内存是 GPU memory（显存）

文章值得关注的一个点，是它把硬件的 latency 用一个连续函数表示了一下，变得可微，然后作为 loss 进行了训练。但是文章中并没有看到 GPU 和 CPU 的 latency 函数到底是什么样子的

gaocegege · 2019-04-25T05:34:30Z

他跟 DARTS 等比较类似，都是重在 Suggestion 这边的 train，真正去 evaluate 的时候是不训练的，但是利用了文章里所说的，path binarization。这样降低了训练的成本。

gaocegege · 2019-05-20T06:29:47Z

常见的 proxy

先在小数据集（CIFAR）上搜索，然后迁移到大数据集（imagenet）。

先搜索一个比较浅的网络，然后重复堆叠同样的结构单元来得到更深的网络。

只做训练少量 epoch （e.g. 5 epoch），然后就 validate。

gaocegege added TODO-未读 type/paper area/neural-architecture-search area/AutoML labels Apr 25, 2019

gaocegege removed the TODO-未读 label Apr 25, 2019

gaocegege mentioned this issue May 20, 2019

Single Path One-Shot Neural Architecture Search with Uniform Sampling #140

Open

Provide feedback