activation/tanh.py

import torch


class Tanh(torch.autograd.Function):
    """The Tanh activation function."""

    @staticmethod
    def forward(ctx, data: torch.Tensor) -> torch.Tensor:
        """Performs a forward pass."""

        neg_mask = data < 0
        pos_mask = ~neg_mask

        zs = torch.empty_like(data)
        zs[neg_mask] = (2 * data[neg_mask]).exp()
        zs[pos_mask] = (-2 * data[pos_mask]).exp()

        numerator = torch.ones_like(data)
        numerator[neg_mask] *= -1
        numerator[neg_mask] += zs[neg_mask]
        numerator[pos_mask] -= zs[pos_mask]

        denominator = torch.ones_like(data)
        denominator[neg_mask] += zs[neg_mask]
        denominator[pos_mask] += zs[pos_mask]

        result = numerator / denominator

        ctx.save_for_backward(result)
        return result

    @staticmethod
    def backward(ctx, grad_output: torch.Tensor) -> torch.Tensor:
        """Performs a backpropagation."""

        (result,) = ctx.saved_tensors
        grad = 1 - result * result
        return grad_output * grad


# Alternative impl {{{
#
# Can your activation function be expressed as a combination of existing PyTorch functions?
# If yes, no need to implement the `backward` method.
#
# import torch
# import torch.nn as nn
#
#
# class Tanh(nn.Module):
#     """The Tanh activation function."""
#
#     def __init__(self) -> None:
#         """Inherits from `nn.Module`."""
#
#         super().__init__()
#
#     def forward(self, data: torch.Tensor) -> torch.Tensor:
#         """Performs a forward pass."""
#
#         neg_mask = data < 0
#         pos_mask = ~neg_mask
#
#         zs = torch.empty_like(data)
#         zs[neg_mask] = (2 * data[neg_mask]).exp()
#         zs[pos_mask] = (-2 * data[pos_mask]).exp()
#
#         numerator = torch.ones_like(data)
#         numerator[neg_mask] *= -1
#         numerator[neg_mask] += zs[neg_mask]
#         numerator[pos_mask] -= zs[pos_mask]
#
#         denominator = torch.ones_like(data)
#         denominator[neg_mask] += zs[neg_mask]
#         denominator[pos_mask] += zs[pos_mask]
#
#         result = numerator / denominator
#
#         return result
#
# }}}


# Testing (gradcheck) {{{

if __name__ == "__main__":
    # Sets the manual seed for reproducible experiments
    torch.manual_seed(0)

    tanh = Tanh.apply
    data = torch.randn(4, dtype=torch.double, requires_grad=True)

    # `torch.autograd.gradcheck` takes a tuple of tensors as input, check if your gradient evaluated
    # with these tensors are close enough to numerical approximations and returns `True` if they all
    # verify this condition.
    if torch.autograd.gradcheck(tanh, data, eps=1e-8, atol=1e-7):
        print("gradcheck successful")
    else:
        print("gradcheck unsuccessful")

# }}}