关于tokenizer是如何提取的 #112

JayLin1996 · 2023-07-27T15:27:44Z

找了很久没有找到如何操作token的，我使用paddlenlp官方的pretrain模型：rocketqa-zh-base-query-encoder和rocketqa-zh-base-para-encoder，想对齐embedding，但是发现对文本使用embedding的维度始终是（1,xx,768），但是这里的baseline都是(1,768)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于tokenizer是如何提取的 #112

关于tokenizer是如何提取的 #112

JayLin1996 commented Jul 27, 2023

关于tokenizer是如何提取的 #112

关于tokenizer是如何提取的 #112

Comments

JayLin1996 commented Jul 27, 2023