Skip to content

Latest commit

 

History

History
11 lines (8 loc) · 771 Bytes

README.md

File metadata and controls

11 lines (8 loc) · 771 Bytes

yaSpeechToText

Переводит речь в текст, используя Yandex Speech Kit (YSK)

Сетап

  1. poetry install + создать .env по аналогии с .env.sample
  2. Закинуть в /data/acc/ или в /data/opus/ аудио-файлы (YSK поддерживает только .opus, .acc умею переводить в .opus)
  3. Запускается это все в acc_to_text.ipynb
  4. Там нужно прописать /data/aac/postman.aac в aac_files или для .opus файлов в opus_files (ну там коммент есть о этом)
  5. Ну и все: по шагам выполняем ячейки, в конце результат появится в txt-файл в data/txt/