From 4800ae6d988cba4338a4a6cd45e93c16c54263ad Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Carlos=20Mochol=C3=AD?= <carlossmocholi@gmail.com>
Date: Thu, 9 Mar 2023 21:41:05 +0100
Subject: [PATCH 1/2] 1.1.1

---
 requirements/typing.txt                       |  2 +-
 src/lightning/app/core/app.py                 |  2 +-
 .../app/utilities/packaging/build_config.py   |  2 +-
 .../fabric/plugins/collectives/collective.py  |  6 +++---
 .../plugins/collectives/torch_collective.py   |  6 ++----
 .../fabric/utilities/device_dtype_mixin.py    | 14 ++++++-------
 src/lightning/fabric/utilities/types.py       |  4 ++--
 src/lightning/pytorch/CHANGELOG.md            |  1 +
 .../_graveyard/legacy_import_unpickler.py     |  2 +-
 src/lightning/pytorch/core/datamodule.py      | 15 +++++++-------
 src/lightning/pytorch/core/module.py          |  6 ++++--
 .../connectors/logger_connector/result.py     |  2 +-
 .../pytorch/utilities/combined_loader.py      |  8 ++++----
 src/lightning/pytorch/utilities/compile.py    | 20 +++++++++----------
 src/lightning/pytorch/utilities/data.py       |  5 ++---
 15 files changed, 48 insertions(+), 47 deletions(-)

diff --git a/requirements/typing.txt b/requirements/typing.txt
index e44f97d0e33ee..a7068f05f5231 100644
--- a/requirements/typing.txt
+++ b/requirements/typing.txt
@@ -1,4 +1,4 @@
-mypy==0.982
+mypy==1.1.1
 -f https://download.pytorch.org/whl/test/cpu/torch_test.html --pre
 torch==2.0.0
 
diff --git a/src/lightning/app/core/app.py b/src/lightning/app/core/app.py
index 8dbab05e022ce..0a886f1105da7 100644
--- a/src/lightning/app/core/app.py
+++ b/src/lightning/app/core/app.py
@@ -76,7 +76,7 @@ def __init__(
         root: Union["LightningFlow", LightningWork],
         flow_cloud_compute: Optional["CloudCompute"] = None,
         log_level: str = "info",
-        info: frontend.AppInfo = None,
+        info: Optional[frontend.AppInfo] = None,
         root_path: str = "",
     ) -> None:
         """The Lightning App, or App in short runs a tree of one or more components that interact to create end-to-end
diff --git a/src/lightning/app/utilities/packaging/build_config.py b/src/lightning/app/utilities/packaging/build_config.py
index 97724b83b5a91..a16b84a6109cd 100644
--- a/src/lightning/app/utilities/packaging/build_config.py
+++ b/src/lightning/app/utilities/packaging/build_config.py
@@ -196,7 +196,7 @@ def to_dict(self) -> Dict:
         return {"__build_config__": asdict(self)}
 
     @classmethod
-    def from_dict(cls, d: Dict) -> Self:  # type: ignore[valid-type]
+    def from_dict(cls, d: Dict) -> Self:
         return cls(**d["__build_config__"])
 
 
diff --git a/src/lightning/fabric/plugins/collectives/collective.py b/src/lightning/fabric/plugins/collectives/collective.py
index 24cf171d5c633..9a2c399883ea3 100644
--- a/src/lightning/fabric/plugins/collectives/collective.py
+++ b/src/lightning/fabric/plugins/collectives/collective.py
@@ -110,12 +110,12 @@ def destroy_group(cls, group: CollectibleGroup) -> None:
     def _convert_to_native_op(cls, op: str) -> Any:
         ...
 
-    def setup(self, **kwargs: Any) -> Self:  # type: ignore[valid-type]
+    def setup(self, **kwargs: Any) -> Self:
         if not self.is_initialized():
             self.init_group(**kwargs)
         return self
 
-    def create_group(self, **kwargs: Any) -> Self:  # type: ignore[valid-type]
+    def create_group(self, **kwargs: Any) -> Self:
         """Create a group.
 
         This assumes that :meth:`~lightning.fabric.plugins.collectives.Collective.init_group` has been
@@ -126,7 +126,7 @@ def create_group(self, **kwargs: Any) -> Self:  # type: ignore[valid-type]
         self._group = self.new_group(**kwargs)
         return self
 
-    def teardown(self) -> Self:  # type: ignore[valid-type]
+    def teardown(self) -> Self:
         if self._group is None:
             raise RuntimeError(f"`{type(self).__name__}` does not own a group to destroy.")
         self.destroy_group(self._group)
diff --git a/src/lightning/fabric/plugins/collectives/torch_collective.py b/src/lightning/fabric/plugins/collectives/torch_collective.py
index 0456460d51cde..10323379ed01e 100644
--- a/src/lightning/fabric/plugins/collectives/torch_collective.py
+++ b/src/lightning/fabric/plugins/collectives/torch_collective.py
@@ -111,9 +111,7 @@ def barrier(self, device_ids: Optional[List[int]] = None) -> None:
     def monitored_barrier(self, timeout: Optional[datetime.timedelta] = None, wait_all_ranks: bool = False) -> None:
         dist.monitored_barrier(group=self.group, timeout=timeout, wait_all_ranks=wait_all_ranks)
 
-    def setup(
-        self, main_address: Optional[str] = None, main_port: Optional[str] = None, **kwargs: Any
-    ) -> Self:  # type: ignore[valid-type]
+    def setup(self, main_address: Optional[str] = None, main_port: Optional[str] = None, **kwargs: Any) -> Self:
         if self.is_initialized():
             return self
         # maybe set addr
@@ -139,7 +137,7 @@ def setup(
             os.environ.pop("MASTER_PORT", None)
         return self
 
-    def teardown(self) -> Self:  # type: ignore[valid-type]
+    def teardown(self) -> Self:
         non_group_member = self.group == dist.GroupMember.NON_GROUP_MEMBER
         super().teardown()  # will destroy its own group
         # try to destroy the default group. this should only be done by a group member to avoid race conditions,
diff --git a/src/lightning/fabric/utilities/device_dtype_mixin.py b/src/lightning/fabric/utilities/device_dtype_mixin.py
index 30a7f0f8258ff..40a171134e849 100644
--- a/src/lightning/fabric/utilities/device_dtype_mixin.py
+++ b/src/lightning/fabric/utilities/device_dtype_mixin.py
@@ -46,14 +46,14 @@ def device(self) -> torch.device:
 
         return device
 
-    def to(self, *args: Any, **kwargs: Any) -> Self:  # type: ignore[valid-type]
+    def to(self, *args: Any, **kwargs: Any) -> Self:
         """See :meth:`torch.nn.Module.to`."""
         # this converts `str` device to `torch.device`
         device, dtype = torch._C._nn._parse_to(*args, **kwargs)[:2]
         self.__update_properties(device=device, dtype=dtype)
         return super().to(*args, **kwargs)
 
-    def cuda(self, device: Optional[Union[torch.device, int]] = None) -> Self:  # type: ignore[valid-type]
+    def cuda(self, device: Optional[Union[torch.device, int]] = None) -> Self:
         """Moves all model parameters and buffers to the GPU. This also makes associated parameters and buffers
         different objects. So it should be called before constructing optimizer if the module will live on GPU
         while being optimized.
@@ -72,27 +72,27 @@ def cuda(self, device: Optional[Union[torch.device, int]] = None) -> Self:  # ty
         self.__update_properties(device=device)
         return super().cuda(device=device)
 
-    def cpu(self) -> Self:  # type: ignore[valid-type]
+    def cpu(self) -> Self:
         """See :meth:`torch.nn.Module.cpu`."""
         self.__update_properties(device=torch.device("cpu"))
         return super().cpu()
 
-    def type(self, dst_type: Union[str, torch.dtype]) -> Self:  # type: ignore[valid-type]
+    def type(self, dst_type: Union[str, torch.dtype]) -> Self:
         """See :meth:`torch.nn.Module.type`."""
         self.__update_properties(dtype=dst_type)
         return super().type(dst_type=dst_type)
 
-    def float(self) -> Self:  # type: ignore[valid-type]
+    def float(self) -> Self:
         """See :meth:`torch.nn.Module.float`."""
         self.__update_properties(dtype=torch.float)
         return super().float()
 
-    def double(self) -> Self:  # type: ignore[valid-type]
+    def double(self) -> Self:
         """See :meth:`torch.nn.Module.double`."""
         self.__update_properties(dtype=torch.double)
         return super().double()
 
-    def half(self) -> Self:  # type: ignore[valid-type]
+    def half(self) -> Self:
         """See :meth:`torch.nn.Module.half`."""
         self.__update_properties(dtype=torch.half)
         return super().half()
diff --git a/src/lightning/fabric/utilities/types.py b/src/lightning/fabric/utilities/types.py
index 9909fe5554be0..4efd7922e1abd 100644
--- a/src/lightning/fabric/utilities/types.py
+++ b/src/lightning/fabric/utilities/types.py
@@ -30,7 +30,7 @@
 if torch.distributed.is_available():
     from torch.distributed import ProcessGroup, ReduceOp
 
-    RedOpType: TypeAlias = ReduceOp.RedOpType if _TORCH_GREATER_EQUAL_1_13 else object  # type: ignore[misc]
+    RedOpType: TypeAlias = ReduceOp.RedOpType if _TORCH_GREATER_EQUAL_1_13 else object  # type: ignore[valid-type]
 else:
     ProcessGroup = Any  # type: ignore[assignment,misc]
     ReduceOp = object  # type: ignore[assignment,misc] # we are using isinstance check once
@@ -75,7 +75,7 @@ def step(self, epoch: Optional[int] = None) -> None:
 
 
 _TORCH_LRSCHEDULER: TypeAlias = (
-    torch.optim.lr_scheduler.LRScheduler  # type: ignore[misc]
+    torch.optim.lr_scheduler.LRScheduler  # type: ignore[valid-type]
     if _TORCH_GREATER_EQUAL_2_0
     else torch.optim.lr_scheduler._LRScheduler
 )
diff --git a/src/lightning/pytorch/CHANGELOG.md b/src/lightning/pytorch/CHANGELOG.md
index 945f6380fad7b..61c4e87d6187c 100644
--- a/src/lightning/pytorch/CHANGELOG.md
+++ b/src/lightning/pytorch/CHANGELOG.md
@@ -402,6 +402,7 @@ The format is based on [Keep a Changelog](http://keepachangelog.com/en/1.0.0/).
 
 - Removed registration of `ShardedTensor` state dict hooks in `LightningModule.__init__` with `torch>=2.1` ([#16892](https://github.com/Lightning-AI/lightning/pull/16892))
 
+- Removed the `lightning.pytorch.core.saving.ModelIO` class interface ([#16974](https://github.com/Lightning-AI/lightning/pull/16974))
 
 - Removed the `lightning.pytorch.core.saving.ModelIO` class interface ([#16999](https://github.com/Lightning-AI/lightning/pull/16999))
 
diff --git a/src/lightning/pytorch/_graveyard/legacy_import_unpickler.py b/src/lightning/pytorch/_graveyard/legacy_import_unpickler.py
index 94d33e99d0136..6dd6da172c018 100644
--- a/src/lightning/pytorch/_graveyard/legacy_import_unpickler.py
+++ b/src/lightning/pytorch/_graveyard/legacy_import_unpickler.py
@@ -40,7 +40,7 @@ def compare_version(package: str, op: Callable, version: str, use_base_version:
 
 try:
     if hasattr(torchmetrics.metric, "_compare_version"):
-        torchmetrics.metric._compare_version = compare_version  # type: ignore
+        torchmetrics.metric._compare_version = compare_version
 except AttributeError:
     pass
 pickle.Unpickler = RedirectingUnpickler  # type: ignore
diff --git a/src/lightning/pytorch/core/datamodule.py b/src/lightning/pytorch/core/datamodule.py
index 629df0f690dfb..fc08d72f9ce96 100644
--- a/src/lightning/pytorch/core/datamodule.py
+++ b/src/lightning/pytorch/core/datamodule.py
@@ -13,7 +13,7 @@
 # limitations under the License.
 """LightningDataModule for loading DataLoaders with ease."""
 import inspect
-from typing import Any, Dict, IO, Mapping, Optional, Sequence, Union
+from typing import Any, cast, Dict, IO, Mapping, Optional, Sequence, Union
 
 from torch.utils.data import DataLoader, Dataset, IterableDataset
 from typing_extensions import Self
@@ -138,13 +138,13 @@ def predict_dataloader() -> EVAL_DATALOADERS:
 
         datamodule = cls(**datamodule_kwargs, **special_kwargs)
         if train_dataset is not None:
-            datamodule.train_dataloader = train_dataloader  # type: ignore[assignment]
+            datamodule.train_dataloader = train_dataloader  # type: ignore[method-assign]
         if val_dataset is not None:
-            datamodule.val_dataloader = val_dataloader  # type: ignore[assignment]
+            datamodule.val_dataloader = val_dataloader  # type: ignore[method-assign]
         if test_dataset is not None:
-            datamodule.test_dataloader = test_dataloader  # type: ignore[assignment]
+            datamodule.test_dataloader = test_dataloader  # type: ignore[method-assign]
         if predict_dataset is not None:
-            datamodule.predict_dataloader = predict_dataloader  # type: ignore[assignment]
+            datamodule.predict_dataloader = predict_dataloader  # type: ignore[method-assign]
         return datamodule
 
     def state_dict(self) -> Dict[str, Any]:
@@ -169,7 +169,7 @@ def load_from_checkpoint(
         checkpoint_path: Union[_PATH, IO],
         hparams_file: Optional[_PATH] = None,
         **kwargs: Any,
-    ) -> Self:  # type: ignore[valid-type]
+    ) -> Self:
         r"""
         Primary way of loading a datamodule from a checkpoint. When Lightning saves a checkpoint
         it stores the arguments passed to ``__init__``  in the checkpoint under ``"datamodule_hyper_parameters"``.
@@ -223,7 +223,7 @@ def load_from_checkpoint(
             )
 
         """
-        return _load_from_checkpoint(
+        loaded = _load_from_checkpoint(
             cls,
             checkpoint_path,
             map_location=None,
@@ -231,3 +231,4 @@ def load_from_checkpoint(
             strict=None,
             **kwargs,
         )
+        return cast(Self, loaded)
diff --git a/src/lightning/pytorch/core/module.py b/src/lightning/pytorch/core/module.py
index eb73b2a4fae31..0db5dd1f7a58b 100644
--- a/src/lightning/pytorch/core/module.py
+++ b/src/lightning/pytorch/core/module.py
@@ -21,6 +21,7 @@
 from typing import (
     Any,
     Callable,
+    cast,
     Dict,
     Generator,
     IO,
@@ -1447,7 +1448,7 @@ def load_from_checkpoint(
         hparams_file: Optional[_PATH] = None,
         strict: bool = True,
         **kwargs: Any,
-    ) -> Self:  # type: ignore[valid-type]
+    ) -> Self:
         r"""
         Primary way of loading a model from a checkpoint. When Lightning saves a checkpoint
         it stores the arguments passed to ``__init__``  in the checkpoint under ``"hyper_parameters"``.
@@ -1519,7 +1520,7 @@ def load_from_checkpoint(
             pretrained_model.freeze()
             y_hat = pretrained_model(x)
         """
-        return _load_from_checkpoint(
+        loaded = _load_from_checkpoint(
             cls,
             checkpoint_path,
             map_location,
@@ -1527,6 +1528,7 @@ def load_from_checkpoint(
             strict,
             **kwargs,
         )
+        return cast(Self, loaded)
 
     @contextmanager
     def _prevent_trainer_and_dataloaders_deepcopy(self) -> Generator[None, None, None]:
diff --git a/src/lightning/pytorch/trainer/connectors/logger_connector/result.py b/src/lightning/pytorch/trainer/connectors/logger_connector/result.py
index 46f4ceb43b942..b63cd72c9fc41 100644
--- a/src/lightning/pytorch/trainer/connectors/logger_connector/result.py
+++ b/src/lightning/pytorch/trainer/connectors/logger_connector/result.py
@@ -181,7 +181,7 @@ def is_custom_reduction(self) -> bool:
         return not (self.is_mean_reduction or self.is_max_reduction or self.is_min_reduction or self.is_sum_reduction)
 
 
-class _ResultMetric(Metric, _DeviceDtypeModuleMixin):
+class _ResultMetric(Metric, _DeviceDtypeModuleMixin):  # type: ignore[misc]  # torchmetrics methods should return Self
     """Wraps the value provided to `:meth:`~lightning.pytorch.core.module.LightningModule.log`"""
 
     def __init__(self, metadata: _Metadata, is_tensor: bool) -> None:
diff --git a/src/lightning/pytorch/utilities/combined_loader.py b/src/lightning/pytorch/utilities/combined_loader.py
index c1304f06e5562..895de912bc4ec 100644
--- a/src/lightning/pytorch/utilities/combined_loader.py
+++ b/src/lightning/pytorch/utilities/combined_loader.py
@@ -31,7 +31,7 @@ def __init__(self, iterables: List[Iterable]) -> None:
     def __next__(self) -> _T:
         raise NotImplementedError
 
-    def __iter__(self) -> Self:  # type: ignore[valid-type]
+    def __iter__(self) -> Self:
         self.iterators = [iter(iterable) for iterable in self.iterables]
         return self
 
@@ -59,7 +59,7 @@ def __next__(self) -> List:
                 out[i] = next(self.iterators[i])
         return out
 
-    def __iter__(self) -> Self:  # type: ignore[valid-type]
+    def __iter__(self) -> Self:
         super().__iter__()
         self._consumed = [False] * len(self.iterables)
         return self
@@ -117,7 +117,7 @@ def __next__(self) -> Tuple[Any, int, int]:
             self._use_next_iterator()
             return self.__next__()
 
-    def __iter__(self) -> Self:  # type: ignore[valid-type]
+    def __iter__(self) -> Self:
         super().__iter__()
         self._iterator_idx = 0
         self._idx = 0
@@ -263,7 +263,7 @@ def __next__(self) -> Any:
             return out
         return tree_unflatten(out, self._spec)
 
-    def __iter__(self) -> Self:  # type: ignore[valid-type]
+    def __iter__(self) -> Self:
         cls = _supported_modes[self._mode]["iterator"]
         iterator = cls(self.flattened)
         iter(iterator)
diff --git a/src/lightning/pytorch/utilities/compile.py b/src/lightning/pytorch/utilities/compile.py
index e253c22d206f8..a75410307d999 100644
--- a/src/lightning/pytorch/utilities/compile.py
+++ b/src/lightning/pytorch/utilities/compile.py
@@ -56,15 +56,15 @@ def from_compiled(model: "torch._dynamo.OptimizedModule") -> "pl.LightningModule
         "original_predict_step": orig_module.predict_step,
     }
 
-    orig_module.forward = model.dynamo_ctx(orig_module.forward)  # type: ignore[assignment]
+    orig_module.forward = model.dynamo_ctx(orig_module.forward)  # type: ignore[method-assign]
     if not _TORCH_GREATER_EQUAL_2_1:  # https://github.com/pytorch/pytorch/issues/95630
         orig_module.forward._torchdynamo_inline = orig_module.forward
-    orig_module.training_step = model.dynamo_ctx(orig_module.training_step)  # type: ignore[assignment]
+    orig_module.training_step = model.dynamo_ctx(orig_module.training_step)  # type: ignore[method-assign]
     if not _TORCH_GREATER_EQUAL_2_1:  # https://github.com/pytorch/pytorch/issues/95630
         orig_module.training_step._torchdynamo_inline = orig_module.training_step
-    orig_module.validation_step = model.dynamo_ctx(orig_module.validation_step)  # type: ignore[assignment]
-    orig_module.test_step = model.dynamo_ctx(orig_module.test_step)  # type: ignore[assignment]
-    orig_module.predict_step = model.dynamo_ctx(orig_module.predict_step)  # type: ignore[assignment]
+    orig_module.validation_step = model.dynamo_ctx(orig_module.validation_step)  # type: ignore[method-assign]
+    orig_module.test_step = model.dynamo_ctx(orig_module.test_step)  # type: ignore[method-assign]
+    orig_module.predict_step = model.dynamo_ctx(orig_module.predict_step)  # type: ignore[method-assign]
     return orig_module
 
 
@@ -101,11 +101,11 @@ def to_uncompiled(model: Union["pl.LightningModule", "torch._dynamo.OptimizedMod
 
     ctx = model._compiler_ctx
     if ctx is not None:
-        model.forward = ctx["original_forward"]  # type: ignore[assignment]
-        model.training_step = ctx["original_training_step"]  # type: ignore[assignment]
-        model.validation_step = ctx["original_validation_step"]  # type: ignore[assignment]
-        model.test_step = ctx["original_test_step"]  # type: ignore[assignment]
-        model.predict_step = ctx["original_predict_step"]  # type: ignore[assignment]
+        model.forward = ctx["original_forward"]  # type: ignore[method-assign]
+        model.training_step = ctx["original_training_step"]  # type: ignore[method-assign]
+        model.validation_step = ctx["original_validation_step"]  # type: ignore[method-assign]
+        model.test_step = ctx["original_test_step"]  # type: ignore[method-assign]
+        model.predict_step = ctx["original_predict_step"]  # type: ignore[method-assign]
         model._compiler_ctx = None
 
     return model
diff --git a/src/lightning/pytorch/utilities/data.py b/src/lightning/pytorch/utilities/data.py
index f53cb7cf8ea81..a21c6d074839e 100644
--- a/src/lightning/pytorch/utilities/data.py
+++ b/src/lightning/pytorch/utilities/data.py
@@ -34,8 +34,7 @@
 from lightning.pytorch.utilities.exceptions import MisconfigurationException
 from lightning.pytorch.utilities.rank_zero import rank_zero_warn, WarningCache
 
-# might be supported in later releases, see https://github.com/python/mypy/pull/13297
-BType = Union[Tensor, str, Mapping[Any, "BType"], Iterable["BType"]]  # type: ignore[misc]
+BType = Union[Tensor, str, Mapping[Any, "BType"], Iterable["BType"]]
 
 warning_cache = WarningCache()
 
@@ -53,7 +52,7 @@ def _extract_batch_size(batch: BType) -> Generator[Optional[int], None, None]:
         for sample in batch:
             yield from _extract_batch_size(sample)
     elif is_dataclass_instance(batch):
-        for field in fields(batch):
+        for field in fields(batch):  # type: ignore[arg-type]
             yield from _extract_batch_size(getattr(batch, field.name))
     else:
         yield None

From aea50eae74bd835107afbdf09020cfd182851920 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Carlos=20Mochol=C3=AD?= <carlossmocholi@gmail.com>
Date: Thu, 9 Mar 2023 21:43:37 +0100
Subject: [PATCH 2/2] 1.1.1

---
 src/lightning/pytorch/strategies/ipu.py | 7 +++++--
 1 file changed, 5 insertions(+), 2 deletions(-)

diff --git a/src/lightning/pytorch/strategies/ipu.py b/src/lightning/pytorch/strategies/ipu.py
index b7ddc69f14a75..255de4f88270f 100644
--- a/src/lightning/pytorch/strategies/ipu.py
+++ b/src/lightning/pytorch/strategies/ipu.py
@@ -287,7 +287,9 @@ def teardown(self) -> None:
         assert self.lightning_module is not None
         if self._optimizer_zero_grad_original is not None:
             # re-enable `optimizer_zero_grad`
-            self.lightning_module.optimizer_zero_grad = self._optimizer_zero_grad_original  # type: ignore[assignment]
+            self.lightning_module.optimizer_zero_grad = (  # type: ignore[method-assign]
+                self._optimizer_zero_grad_original
+            )
 
         for model in self.poptorch_models.values():
             model.destroy()
@@ -345,7 +347,8 @@ def on_train_batch_start(self, batch: Any, batch_idx: int) -> None:
         self.poptorch_models[RunningStage.TRAINING].setOptimizer(optimizer)
 
     @property
-    def root_device(self) -> torch.device:
+    def root_device(self) -> torch.device:  # type: ignore[empty-body]
+        # TODO: this should return `self.parallel_devices[self.local_rank]`
         pass
 
     def model_to_device(self) -> None: