关于unilm文本生成 #8

thinkingmanyangyang · 2021-01-06T15:52:57Z

苏神您好，我看了下您那个自动生成标题的代码，有一个关于预测时批次处理的问题。举个例子，输入时sentence1和sentence2，经过tokenizer的处理后会变成[cls s1 sep s2 sep padding]的形式。但是在预测的时候时由于没有sentence2，把输入padding到同一长度后会变为[cls s1 sep padding]，那么sentence2相对于训练时候的position ids会比原来偏移量多了padding的数目，请问这个会对模型的预测有问题吗？bert4keras的源码有些长，我理解的也比较浅薄，希望苏神可以解答一下，多谢。

bojone · 2021-01-27T10:16:53Z

预测的时候是单个样本进行的，没有padding

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于unilm文本生成 #8

关于unilm文本生成 #8

thinkingmanyangyang commented Jan 6, 2021

bojone commented Jan 27, 2021

关于unilm文本生成 #8

关于unilm文本生成 #8

Comments

thinkingmanyangyang commented Jan 6, 2021

bojone commented Jan 27, 2021