open-mmlab · pppppM · Oct 10, 2022 · Sep 14, 2022 · Sep 20, 2022 · Sep 22, 2022
diff --git a/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_slimmable_subnet_8xb256_in1k.py b/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_slimmable_subnet_8xb256_in1k.py
@@ -21,23 +21,19 @@
 
 # !autoslim algorithm config
 # ==========================================================================
-channel_cfg_paths = [
-    'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-220M_acc-71.4_20220715-9c288f3b_subnet_cfg.yaml',  # noqa: E501
-    'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-320M_acc-72.73_20220715-9aa8f8ae_subnet_cfg.yaml',  # noqa: E501
-    'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-530M_acc-74.23_20220715-aa8754fe_subnet_cfg.yaml'  # noqa: E501
-]
 
 model = dict(
     _delete_=True,
     _scope_='mmrazor',
     type='SlimmableNetwork',
     architecture=supernet,
     data_preprocessor=data_preprocessor,
-    channel_cfg_paths=channel_cfg_paths,
     mutator=dict(
         type='SlimmableChannelMutator',
-        mutable_cfg=dict(type='SlimmableMutableChannel'),
-        tracer_cfg=dict(
+        channel_unit_cfg=dict(
+            type='SlimmableChannelUnit',
+            units='tests/data/MBV2_slimmable_config.json'),
+        parse_cfg=dict(
             type='BackwardTracer',
             loss_calculator=dict(type='ImageClassifierPseudoLoss'))))
 
@@ -46,6 +42,6 @@
     broadcast_buffers=False,
     find_unused_parameters=True)
 
-optim_wrapper = dict(accumulative_counts=len(channel_cfg_paths))
+optim_wrapper = dict(accumulative_counts=3)
 
 val_cfg = dict(type='mmrazor.SlimmableValLoop')
diff --git a/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-220M.py b/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-220M.py
@@ -1,4 +1,3 @@
 _base_ = 'autoslim_mbv2_1.5x_slimmable_subnet_8xb256_in1k.py'
 
-_channel_cfg_paths = 'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-220M_acc-71.4_20220715-9c288f3b_subnet_cfg.yaml'  # noqa: E501
-model = dict(channel_cfg_paths=_channel_cfg_paths)
+model = dict(deploy_index=0)
diff --git a/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-320M.py b/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-320M.py
@@ -1,4 +1,3 @@
 _base_ = 'autoslim_mbv2_1.5x_slimmable_subnet_8xb256_in1k.py'
 
-_channel_cfg_paths = 'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-320M_acc-72.73_20220715-9aa8f8ae_subnet_cfg.yaml'  # noqa: E501
-model = dict(channel_cfg_paths=_channel_cfg_paths)
+model = dict(deploy_index=1)
diff --git a/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-530M.py b/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_subnet_8xb256_in1k_flops-530M.py
@@ -1,4 +1,3 @@
 _base_ = 'autoslim_mbv2_1.5x_slimmable_subnet_8xb256_in1k.py'
 
-_channel_cfg_paths = 'https://download.openmmlab.com/mmrazor/v1/autoslim/autoslim_mbv2_subnet_8xb256_in1k_flops-530M_acc-74.23_20220715-aa8754fe_subnet_cfg.yaml'  # noqa: E501
-model = dict(channel_cfg_paths=_channel_cfg_paths)
+model = dict(deploy_index=2)
diff --git a/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_supernet_8xb256_in1k.py b/configs/pruning/mmcls/autoslim/autoslim_mbv2_1.5x_supernet_8xb256_in1k.py
@@ -43,11 +43,13 @@
                 preds_T=dict(recorder='fc', from_student=False)))),
     mutator=dict(
         type='OneShotChannelMutator',
-        mutable_cfg=dict(
-            type='OneShotMutableChannel',
-            candidate_choices=list(i / 12 for i in range(2, 13)),
-            candidate_mode='ratio'),
-        tracer_cfg=dict(
+        channel_unit_cfg=dict(
+            type='OneShotMutableChannelUnit',
+            default_args=dict(
+                candidate_choices=list(i / 12 for i in range(2, 13)),
+                choice_mode='ratio',
+                divisor=8)),
+        parse_cfg=dict(
             type='BackwardTracer',
             loss_calculator=dict(type='ImageClassifierPseudoLoss'))))
 

diff --git a/configs/pruning/mmcls/l1-norm/README.md b/configs/pruning/mmcls/l1-norm/README.md
@@ -0,0 +1,11 @@
+# L1-norm pruning
+
+> [Pruning Filters for Efficient ConvNets.](https://arxiv.org/pdf/1608.08710.pdf)
+
+<!-- [ALGORITHM] -->
+
+## Implementation
+
+L1-norm pruning is a classical filter pruning algorithm. It prunes filers(channels) according to the l1-norm of the weight of a conv layer.
+
+We use ItePruneAlgorithm and L1MutableChannelUnit to implement l1-norm pruning. Please refer to xxxx for more configuration detail.
diff --git a/configs/pruning/mmcls/l1-norm/l1-norm_resnet34_8xb32_in1k.py b/configs/pruning/mmcls/l1-norm/l1-norm_resnet34_8xb32_in1k.py
@@ -0,0 +1,56 @@
+_base_ = ['mmcls::resnet/resnet34_8xb32_in1k.py']
+
+stage_ratio_1 = 0.7
+stage_ratio_2 = 0.7
+stage_ratio_3 = 0.7
+stage_ratio_4 = 1.0
+
+# the config template of target_pruning_ratio can be got by
+# python ./tools/get_channel_units.py {config_file} --choice
+target_pruning_ratio = {
+    'backbone.layer1.2.conv2_(0, 64)_64': stage_ratio_1,
+    'backbone.layer1.0.conv1_(0, 64)_64': stage_ratio_1,
+    'backbone.layer1.1.conv1_(0, 64)_64': stage_ratio_1,
+    'backbone.layer1.2.conv1_(0, 64)_64': stage_ratio_1,
+    'backbone.layer2.0.conv1_(0, 128)_128': stage_ratio_2,
+    'backbone.layer2.3.conv2_(0, 128)_128': stage_ratio_2,
+    'backbone.layer2.1.conv1_(0, 128)_128': stage_ratio_2,
+    'backbone.layer2.2.conv1_(0, 128)_128': stage_ratio_2,
+    'backbone.layer2.3.conv1_(0, 128)_128': stage_ratio_2,
+    'backbone.layer3.0.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.5.conv2_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.1.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.2.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.3.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.4.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer3.5.conv1_(0, 256)_256': stage_ratio_3,
+    'backbone.layer4.0.conv1_(0, 512)_512': stage_ratio_4,
+    'backbone.layer4.2.conv2_(0, 512)_512': stage_ratio_4,
+    'backbone.layer4.1.conv1_(0, 512)_512': stage_ratio_4,
+    'backbone.layer4.2.conv1_(0, 512)_512': stage_ratio_4
+}
+data_preprocessor = {'type': 'mmcls.ClsDataPreprocessor'}
+architecture = _base_.model
+architecture.update({
+    'init_cfg': {
+        'type':
+        'Pretrained',
+        'checkpoint':
+        'https://download.openmmlab.com/mmclassification/v0/resnet/resnet34_8xb32_in1k_20210831-f257d4e6.pth'  # noqa
+    }
+})
+
+model = dict(
+    _delete_=True,
+    _scope_='mmrazor',
+    type='ItePruneAlgorithm',
+    architecture=architecture,
+    mutator_cfg=dict(
+        type='ChannelMutator',
+        channel_unit_cfg=dict(
+            type='L1MutableChannelUnit',
+            default_args=dict(choice_mode='ratio'))),
+    target_pruning_ratio=target_pruning_ratio,
+    step_epoch=1,
+    prune_times=1,
+)
diff --git a/mmrazor/engine/runner/slimmable_val_loop.py b/mmrazor/engine/runner/slimmable_val_loop.py
@@ -43,10 +43,10 @@ def run(self):
         self.runner.call_hook('before_val')
 
         all_metrics = dict()
-        for subnet_idx in range(self._model.num_subnet):
+        for subnet_idx, subnet in enumerate(self._model.mutator.subnets):
             self.runner.call_hook('before_val_epoch')
             self.runner.model.eval()
-            self._model.mutator.switch_choices(subnet_idx)
+            self._model.mutator.set_choices(subnet)
             for idx, data_batch in enumerate(self.dataloader):
                 self.run_iter(idx, data_batch)
             # compute student metrics

diff --git a/mmrazor/models/algorithms/__init__.py b/mmrazor/models/algorithms/__init__.py
@@ -5,11 +5,24 @@
                       SelfDistill, SingleTeacherDistill)
 from .nas import SPOS, AutoSlim, AutoSlimDDP, Darts, DartsDDP, Dsnas, DsnasDDP
 from .pruning import SlimmableNetwork, SlimmableNetworkDDP
+from .pruning.ite_prune_algorithm import ItePruneAlgorithm
 
 __all__ = [
-    'SingleTeacherDistill', 'BaseAlgorithm', 'FpnTeacherDistill', 'SPOS',
-    'SlimmableNetwork', 'SlimmableNetworkDDP', 'AutoSlim', 'AutoSlimDDP',
-    'Darts', 'DartsDDP', 'SelfDistill', 'DataFreeDistillation',
-    'DAFLDataFreeDistillation', 'OverhaulFeatureDistillation', 'Dsnas',
-    'DsnasDDP'
+    'SingleTeacherDistill',
+    'BaseAlgorithm',
+    'FpnTeacherDistill',
+    'SPOS',
+    'SlimmableNetwork',
+    'SlimmableNetworkDDP',
+    'AutoSlim',
+    'AutoSlimDDP',
+    'Darts',
+    'DartsDDP',
+    'SelfDistill',
+    'DataFreeDistillation',
+    'DAFLDataFreeDistillation',
+    'OverhaulFeatureDistillation',
+    'ItePruneAlgorithm',
+    'Dsnas',
+    'DsnasDDP',
 ]
diff --git a/mmrazor/models/algorithms/nas/autoslim.py b/mmrazor/models/algorithms/nas/autoslim.py
@@ -14,7 +14,6 @@
 from mmrazor.models.utils import (add_prefix,
                                   reinitialize_optim_wrapper_count_status)
 from mmrazor.registry import MODEL_WRAPPERS, MODELS
-from mmrazor.utils import SingleMutatorRandomSubnet
 from ..base import BaseAlgorithm
 
 VALID_MUTATOR_TYPE = Union[OneShotChannelMutator, Dict]
@@ -33,10 +32,24 @@ def __init__(self,
                  data_preprocessor: Optional[Union[Dict, nn.Module]] = None,
                  init_cfg: Optional[Dict] = None,
                  num_samples: int = 2) -> None:
+        """Implementation of Autoslim algorithm. Please refer to
+        https://arxiv.org/abs/1903.11728 for more details.
+
+        Args:
+            mutator (VALID_MUTATOR_TYPE): config of mutator.
+            distiller (VALID_DISTILLER_TYPE): config of  distiller.
+            architecture (Union[BaseModel, Dict]): the model to be searched.
+            data_preprocessor (Optional[Union[Dict, nn.Module]], optional):
+                data prepocessor. Defaults to None.
+            init_cfg (Optional[Dict], optional): config of initialization.
+                Defaults to None.
+            num_samples (int, optional): number of sample subnets.
+                Defaults to 2.
+        """
         super().__init__(architecture, data_preprocessor, init_cfg)
 
-        self.mutator = self._build_mutator(mutator)
-        # `prepare_from_supernet` must be called before distiller initialized
+        self.mutator: OneShotChannelMutator = MODELS.build(mutator)
+        # prepare_from_supernet` must be called before distiller initialized
         self.mutator.prepare_from_supernet(self.architecture)
 
         self.distiller = self._build_distiller(distiller)
@@ -49,7 +62,7 @@ def __init__(self,
 
     def _build_mutator(self,
                        mutator: VALID_MUTATOR_TYPE) -> OneShotChannelMutator:
-        """build mutator."""
+        """Build mutator."""
         if isinstance(mutator, dict):
             mutator = MODELS.build(mutator)
         if not isinstance(mutator, OneShotChannelMutator):
@@ -61,6 +74,7 @@ def _build_mutator(self,
 
     def _build_distiller(
             self, distiller: VALID_DISTILLER_TYPE) -> ConfigurableDistiller:
+        """Build distiller."""
         if isinstance(distiller, dict):
             distiller = MODELS.build(distiller)
         if not isinstance(distiller, ConfigurableDistiller):
@@ -70,20 +84,25 @@ def _build_distiller(
 
         return distiller
 
-    def sample_subnet(self) -> SingleMutatorRandomSubnet:
+    def sample_subnet(self) -> Dict:
+        """Sample a subnet."""
         return self.mutator.sample_choices()
 
-    def set_subnet(self, subnet: SingleMutatorRandomSubnet) -> None:
+    def set_subnet(self, subnet) -> None:
+        """Set a subnet."""
         self.mutator.set_choices(subnet)
 
     def set_max_subnet(self) -> None:
-        self.mutator.set_max_choices()
+        """Set max subnet."""
+        self.mutator.set_choices(self.mutator.max_choices())
 
     def set_min_subnet(self) -> None:
-        return self.mutator.set_min_choices()
+        """Set min subnet."""
+        self.mutator.set_choices(self.mutator.min_choices())
 
     def train_step(self, data: List[dict],
                    optim_wrapper: OptimWrapper) -> Dict[str, torch.Tensor]:
+        """Train step."""
 
         def distill_step(
                 batch_inputs: torch.Tensor, data_samples: List[BaseDataElement]
@@ -109,7 +128,9 @@ def distill_step(
                 accumulative_counts=self.num_samples + 2)
             self._optim_wrapper_count_status_reinitialized = True
 
-        batch_inputs, data_samples = self.data_preprocessor(data, True)
+        input_data = self.data_preprocessor(data, True)
+        batch_inputs = input_data['inputs']
+        data_samples = input_data['data_samples']
 
         total_losses = dict()
         self.set_max_subnet()
@@ -136,6 +157,7 @@ def distill_step(
 
 @MODEL_WRAPPERS.register_module()
 class AutoSlimDDP(MMDistributedDataParallel):
+    """DDPwapper for autoslim."""
 
     def __init__(self,
                  *,
@@ -175,7 +197,9 @@ def distill_step(
                 accumulative_counts=self.module.num_samples + 2)
             self._optim_wrapper_count_status_reinitialized = True
 
-        batch_inputs, data_samples = self.module.data_preprocessor(data, True)
+        input_data = self.module.data_preprocessor(data, True)
+        batch_inputs = input_data['inputs']
+        data_samples = input_data['data_samples']
 
         total_losses = dict()
         self.module.set_max_subnet()