[`model cards`] Replace 'sentence_transformers_model_id' from reused model if possible #2714

tomaarsen · 2024-06-04T20:11:13Z

Hello!

Pull Request overview

Replace 'sentence_transformers_model_id' from reused model if possible

Details

A common occurrence is saving a model locally with model.save_pretrained("my_model"), then later loading the model again with SentenceTransformer("my_model") and uploading that model with model.push_to_hub("my_user/my_model"). Sentence Transformers reuses the model card if no training is carried out, so you still get all of your training logs, hyperparameters, etc., but the original save likely resulted in a usage snippet of:

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Then he ran.',
    'The people are running.',
    'The man is on his bike.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

This'll get fully reused, even if with the push_to_hub the code should know the final model ID. This PR fixes that, i.e. the sentence_transformers_model_id will get updated.

Tom Aarsen

…del_id

tomaarsen added 4 commits June 4, 2024 22:04

Replace 'sentence_transformers_model_id' from reused model if possible

0f84a7b

Ensure that self.model_card_data.model_id is set

0dbd349

Reformat

c1f22d4

Merge branch 'master' into model_card/update_sentence_transformers_mo…

3c649c1

…del_id

tomaarsen merged commit a3e1b86 into UKPLab:master Jun 4, 2024
9 checks passed

tomaarsen deleted the model_card/update_sentence_transformers_model_id branch June 4, 2024 21:19

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[`model cards`] Replace 'sentence_transformers_model_id' from reused model if possible #2714

[`model cards`] Replace 'sentence_transformers_model_id' from reused model if possible #2714

tomaarsen commented Jun 4, 2024

[model cards] Replace 'sentence_transformers_model_id' from reused model if possible #2714

[model cards] Replace 'sentence_transformers_model_id' from reused model if possible #2714

Conversation

tomaarsen commented Jun 4, 2024

Pull Request overview

Details

[`model cards`] Replace 'sentence_transformers_model_id' from reused model if possible #2714

[`model cards`] Replace 'sentence_transformers_model_id' from reused model if possible #2714