ViT PyTorch

PyTorch implementation of Vision Transformer (ViT).

Vision Transformer (ViT) - An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
LICENSE		LICENSE
README.md		README.md
ViT.png		ViT.png
demo.py		demo.py
requirements.txt		requirements.txt
vit.py		vit.py
vit_1d.py		vit_1d.py
vit_3d.py		vit_3d.py

Provide feedback