Source code doesnt provide operation of data prepare for BERT-like models #42

pikaliov · 2020-09-18T07:49:39Z

Repository doesnt contain code for ALBERT/BERT: masking input tokens, masked labels, madked positions.
Did you follow hugginface or tensorflow.official algorithm to create dataset for train/eval?

jarednielsen · 2020-09-22T05:28:01Z

I'd recommend following the instructions provided by Nvidia: https://github.com/NVIDIA/DeepLearningExamples/tree/b7903f0f62b1cdc3356d27956b5c8dee3896f68d/TensorFlow/LanguageModeling/BERT#getting-the-data. Those TFRecords are the expected format for the training scripts.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Source code doesnt provide operation of data prepare for BERT-like models #42

Source code doesnt provide operation of data prepare for BERT-like models #42

pikaliov commented Sep 18, 2020 •

edited

Loading

jarednielsen commented Sep 22, 2020

Source code doesnt provide operation of data prepare for BERT-like models #42

Source code doesnt provide operation of data prepare for BERT-like models #42

Comments

pikaliov commented Sep 18, 2020 • edited Loading

jarednielsen commented Sep 22, 2020

pikaliov commented Sep 18, 2020 •

edited

Loading