Support relative positional encoding for Emformer #448

yaozengwei · 2022-06-27T08:21:31Z

This PR aims to support relative positional encoding for the simplified Emformer (#440, not merged yet).
Since the query and key tensors for attention computation is not "continuous" during training, we can not easily apply the "shift trick" as in Conformer (https://github.com/k2-fsa/icefall/blob/master/egs/librispeech/ASR/pruned_transducer_stateless2/conformer.py#L532):

query: [hard-copied right context, utterance]
key: [memory, hard-copied right context, utterance]

Hence, I first compute the relative positions between query indexes and key indexes, and use the torch.gather operation to gather target position-related scores with the pre-computed positions.

The RelPositionalEncoding class is also modified.

Details can be found in conv_emformer_transducer_stateless3/emformer.py.

yaozengwei added 22 commits April 29, 2022 10:26

Merge remote-tracking branch 'k2-fsa/master'

9c39d8b

Merge remote-tracking branch 'k2-fsa/master'

70634d5

Merge remote-tracking branch 'k2-fsa/master'

ecfb3e9

Merge remote-tracking branch 'k2-fsa/master'

bcef517

Merge remote-tracking branch 'k2-fsa/master'

c9d84ae

Merge remote-tracking branch 'k2-fsa/master'

fbbc24f

Merge remote-tracking branch 'origin/master'

5453166

Merge remote-tracking branch 'k2-fsa/master'

bb7ea31

Merge remote-tracking branch 'k2-fsa/master'

2a5a70e

Merge remote-tracking branch 'k2-fsa/master'

ec8646d

init files

1c067e7

use average value as memory vector for each chunk

193b44e

change tail padding length from right_context_length to chunk_length

5d877ef

correct the files, ln -> cp

c27bb1c

fix bug in conv_emformer_transducer_stateless2/emformer.py

208bbb6

fix doc in conv_emformer_transducer_stateless/emformer.py

5b19011

refactor init states for stream

42e3e88

modify .flake8

9c37c16

copy files from conv_emformer_transducer_stateless2

4929fae

support position encoding

630626a

fix bug of relative position

7b15596

add doc

5ea58a4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support relative positional encoding for Emformer #448

Support relative positional encoding for Emformer #448

yaozengwei commented Jun 27, 2022

Support relative positional encoding for Emformer #448

Are you sure you want to change the base?

Support relative positional encoding for Emformer #448

Conversation

yaozengwei commented Jun 27, 2022