Data preprocessing #1

PSYGIM · 2024-09-23T14:38:40Z

Hello, I noticed that OGM-GE_CVPR2022 does not mention how the KineticSound dataset was processed. If possible, could you kindly provide the preprocessing code for the KineticSound dataset? I would greatly appreciate it!

echo0409 · 2024-11-06T11:11:05Z

Thank you for your question.

For audio, please refer to https://github.com/GeWu-Lab/OGM-GE_CVPR2022/blob/main/data/KineticSound/process_audio.py.

For video, we just extract 1 frame per second. Then we evenly pick 3 frames for each sample during training.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Data preprocessing #1

Data preprocessing #1

PSYGIM commented Sep 23, 2024

echo0409 commented Nov 6, 2024

Data preprocessing #1

Data preprocessing #1

Comments

PSYGIM commented Sep 23, 2024

echo0409 commented Nov 6, 2024