Releases · huggingface/tokenizers

[#850]: Added a feature gate to enable disabling http features
[#718]: Fix WordLevel tokenizer determinism during training
[#762]: Add a way to specify the unknown token in SentencePieceUnigramTokenizer
[#770]: Improved documentation for UnigramTrainer
[#780]: Add Tokenizer.from_pretrained to load tokenizers from the Hugging Face Hub
[#793]: Saving a pretty JSON file by default when saving a tokenizer

Provide feedback