Skip to content

πŸ”Š SpeakerPy - лСгкая ΠΈ мощная Python-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для синтСза Ρ€Π΅Ρ‡ΠΈ! πŸ’¬ Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Silero TTS для высококачСствСнного Π·Π²ΡƒΠΊΠ°. πŸŽ™οΈ ΠžΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π΅Ρ‚ числа, английскиС слова ΠΈ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅Ρ‚ тСкст Π½Π° части. πŸš€ Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΡ„Π»Π°ΠΉΠ½, сохраняСт Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π² MP3. 🎧 ИдСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для ΠΎΠ·Π²ΡƒΡ‡ΠΊΠΈ Π°ΡƒΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³, подкастов ΠΈ мноТСства Π΄Ρ€ΡƒΠ³ΠΈΡ… Π·Π°Π΄Π°Ρ‡! 🌐

Notifications You must be signed in to change notification settings

denisxab/speakerpy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

author
our ame
Sep 20, 2023
1ae6aa0 Β· Sep 20, 2023

History

19 Commits
Sep 20, 2023
Mar 30, 2023
Sep 20, 2023
Sep 20, 2023
Aug 21, 2023
Mar 26, 2023
Aug 21, 2023
Mar 29, 2023
Mar 30, 2023
Mar 30, 2023
Aug 18, 2023
Aug 18, 2023
Aug 21, 2023
Sep 20, 2023

Repository files navigation

SpeakerPy

SpeakerPy - это Python-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для синтСза Ρ€Π΅Ρ‡ΠΈ, основанная Π½Π° модСлях Silero Text-to-Speech.

logo

Π’ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ сфСры примСнСния SpeakerPy

SpeakerPy ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ ряд возмоТностСй для синтСза Ρ€Π΅Ρ‡ΠΈ, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π΅Π³ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ инструмСнтом для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈ сфСр Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. НиТС ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ областСй, Π³Π΄Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использовано ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ SpeakerPy:

  1. ΠžΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для озвучивания ΡƒΡ‡Π΅Π±Π½Ρ‹Ρ… ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π»Π΅ΠΊΡ†ΠΈΠΈ, ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΈ ΠΊΠ½ΠΈΠ³ΠΈ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ студСнтам ΠΈ прСподаватСлям Π»Π΅Π³Ρ‡Π΅ Π²ΠΎΡΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ врСмя.

  2. Аудиокниги: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для создания Π°ΡƒΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³ ΠΈΠ· тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Ρ‡Ρ‚ΠΎ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ доступ ΠΊ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ для людСй с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ возмоТностями ΠΈ Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡ΠΈΡ‚Π°Π΅Ρ‚ ΡΠ»ΡƒΡˆΠ°Ρ‚ΡŒ, Π° Π½Π΅ Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ.

  3. ΠŸΠΎΠ΄ΠΊΠ°ΡΡ‚Ρ‹ ΠΈ Ρ€Π°Π΄ΠΈΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для создания подкастов ΠΈ Ρ€Π°Π΄ΠΈΠΎΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡ Π½Π° основС тСкстовых ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ новости, ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΈΠ»ΠΈ Π±Π»ΠΎΠ³ΠΈ.

  4. Π”ΠΎΡΡ‚ΡƒΠΏΠ½ΠΎΡΡ‚ΡŒ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΈ Π²Π΅Π±-сайтов с Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Text-to-Speech, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚ доступным для людСй с Π½Π°Ρ€ΡƒΡˆΠ΅Π½ΠΈΡΠΌΠΈ зрСния ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ возмоТностями.

  5. ΠžΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π½ΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для автоматичСского озвучивания Π²ΠΈΠ΄Π΅ΠΎΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΠΈ, ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ Ρ€ΠΎΠ»ΠΈΠΊΠΈ.

  6. Π˜Π½ΠΎΡΡ‚Ρ€Π°Π½Π½Ρ‹Π΅ языки: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для озвучивания тСкстов Π½Π° иностранных языках, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ·ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌ язык Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΈ ΠΈΠ½Ρ‚ΠΎΠ½Π°Ρ†ΠΈΡŽ.

  7. НавигационныС систСмы: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π² Π½Π°Π²ΠΈΠ³Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… систСмах ΠΈ голосовых ΠΏΠΎΠΌΠΎΡ‰Π½ΠΈΠΊΠ°Ρ… для автоматичСского озвучивания ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ΠΎΠ², инструкций ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ.

  8. ВСхничСская ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ Π² систСмы тСхничСской ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ для автоматичСского озвучивания ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π½Π° часто Π·Π°Π΄Π°Π²Π°Π΅ΠΌΡ‹Π΅ вопросы ΠΈΠ»ΠΈ инструкций ΠΏΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ.

  9. ΠœΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³ ΠΈ Ρ€Π΅ΠΊΠ»Π°ΠΌΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для создания голосовых объявлСний, ΠΏΡ€ΠΎΠΌΠΎ-Ρ€ΠΎΠ»ΠΈΠΊΠΎΠ² ΠΈ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΠΉ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΡΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ врСмя ΠΈ срСдства Π½Π° ΠΎΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π΄ΠΈΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ.

  10. ΠœΠ΅Π΄ΠΈΡ†ΠΈΠ½Π°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ для озвучивания мСдицинских тСкстов, инструкций ΠΏΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡŽ лСкарств ΠΈΠ»ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² диагностики, Ρ‡Ρ‚ΠΎ упростит восприятиС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ для ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ мСдицинских спСциалистов.

  11. Наука ΠΈ исслСдования: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для озвучивания Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… статСй, Π΄ΠΎΠΊΠ»Π°Π΄ΠΎΠ² ΠΈ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΉ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ доступ ΠΊ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ для ΡƒΡ‡Π΅Π½Ρ‹Ρ… ΠΈ исслСдоватСлСй.

  12. ΠšΠ°ΡΡ‚ΠΎΠΌΠΈΠ·Π°Ρ†ΠΈΡ голосовых ассистСнтов: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для кастомизации голоса Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… ассистСнтов, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Siri, Google Assistant ΠΈΠ»ΠΈ Alexa, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ голосовыС ΠΎΠΏΡ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠΌ большС нравятся.

  13. Π—Π°ΠΌΠ΅Π½Π° голоса: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для смСны голоса Π² ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… аудиозаписях, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ для Π°Π½ΠΎΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ подкастов ΠΈΠ»ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€Π²ΡŒΡŽ.

  14. ВСкстовыС Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Ρ‹: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ Π² тСкстовыС Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Ρ‹ для прСдоставлСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Text-to-Speech, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Π°Π²Ρ‚ΠΎΡ€Π°ΠΌ ΠΈ Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Π°ΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ свои тСксты Π½Π° ошибки ΠΈ стилистичСскиС нСточности.

Π­Ρ‚ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ лишь Ρ‡Π°ΡΡ‚ΡŒ возмоТностСй примСнСния SpeakerPy. Благодаря своСй гибкости ΠΈ ΠΌΠΎΡ‰Π½Ρ‹ΠΌ функциям, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ для использования Π² самых Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹Ρ… сфСрах ΠΈ отраслях, Π³Π΄Π΅ трСбуСтся ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅Ρ‡ΡŒ ΠΈΠ· тСкста. ΠžΡ‚ ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π° ΠΈ Ρ€Π΅ΠΊΠ»Π°ΠΌΡ‹ Π΄ΠΎ ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Ρ‹ ΠΈ Π½Π°ΡƒΠΊΠΈ, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ инструмСнтом для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ², спСциалистов ΠΏΠΎ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Ρƒ ΠΈ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ.

Π’ Ρ†Π΅Π»ΠΎΠΌ, возмоТности использования SpeakerPy ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹ лишь Ρ„Π°Π½Ρ‚Π°Π·ΠΈΠ΅ΠΉ ΠΈ потрСбностями ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ². Благодаря своСй ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ простотС использования, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°ΠΉΡ‚ΠΈ своС мСсто Π² самых Ρ€Π°Π·Π½Ρ‹Ρ… областях ΠΈ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ самыС Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ.

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ ΠΈ прСимущСства SpeakerPy

  • Вранскрипция чисСл ΠΈ английских слов: SpeakerPy способСн ΠΎΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Ρ‚ΡŒ числа ΠΈ английскиС слова Ρ‡Π΅Ρ€Π΅Π· Ρ‚Ρ€Π°Π½ΡΠΊΡ€ΠΈΠΏΡ†ΠΈΡŽ.
  • Π‘ΠΈΠ½Ρ‚Π΅Π· Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов тСкста: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ большиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ тСкста Π±Π΅Π· ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ.
  • ΠšΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎΠ΅ Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° куски: благодаря использованию Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ nltk, SpeakerPy ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π΄Π΅Π»ΠΈΡ‚ большиС тСксты Π½Π° прСдлоТСния.
  • ΠšΠ΅ΡˆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ синтСзированного тСкста: SpeakerPy синтСзируСт ΠΈ Ρ…Ρ€Π°Π½ΠΈΡ‚ тСкст ΠΏΠΎ кускам, Ρ‡Ρ‚ΠΎ позволяСт ΠΊΠ΅ΡˆΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡƒΠΆΠ΅ Ρ€Π°Π½Π΅Π΅ синтСзированный тСкст ΠΈ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ синтСзирования.
  • Π Π°Π±ΠΎΡ‚Π° Π² Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅: SpeakerPy синтСзируСт Π·Π²ΡƒΠΊ локально, Π±Π΅Π· ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΊ ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Ρƒ, Ρ‡Ρ‚ΠΎ позволяСт ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π³ΠΎ Π² Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅.
  • Π‘ΠΎΡ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ синтСзированного тСкста Π² MP3: SpeakerPy прСдоставляСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΡΠΎΡ…Ρ€Π°Π½ΡΡ‚ΡŒ синтСзированный тСкст Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ MP3.

Установка

БистСмныС трСбования

  • 2 Π“Π‘ ΠžΠ—Π£

Установка Ρ‡Π΅Ρ€Π΅Π· pip

SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ pip:

pip install speakerpy

Установка ΠΈ запуск Ρ‡Π΅Ρ€Π΅Π· Docker

Π‘ΠΊΠ°Ρ‡Π°Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π·

docker pull xable/speakerpy

Π‘ΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π·(вСсит 8.27GB):

make docker-build

Π—Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ ΠΎΠ±Ρ€Π°Π·:

make docker-run

ИспользованиС CLI

β•°β”€βž€  python -m speakerpy --help
usage: __main__.py [-h] -l {ru,en} -f FILE -t {mp3,speak} [-sr SAMPLE_RATE] [-s SPEED] [-n NAME_TEXT] [-a AUDIO_DIR]

πŸŽ™οΈ SpeakerPy: CLI для синтСза Ρ€Π΅Ρ‡ΠΈ с использованиСм SpeakerPy πŸŽ™οΈ

options:
  -h, --help            show this help message and exit
  -l {ru,en}, --language {ru,en} 
                        Π―Π·Ρ‹ΠΊ синтСза (ru | en)
  -f FILE, --file FILE  ΠŸΡƒΡ‚ΡŒ ΠΊ Ρ„Π°ΠΉΠ»Ρƒ с тСкстом для озвучивания
  -t {mp3,speak}, --type_out {mp3,speak}
                        Каким ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ вывСсти синтСзированный тСкст (mp3 | speak)
  -sr SAMPLE_RATE, --sample_rate SAMPLE_RATE
                        Частота дискрСтизации (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: 48000)
  -s SPEED, --speed SPEED
                        Π‘ΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ чтСния (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: 1.0)
  -n NAME_TEXT, --name_text NAME_TEXT
                        Имя для тСкста, с Ρ‚Π°ΠΊΠΈΠΌ ΠΈΠΌΠ΅Π½Π΅ΠΌ сохранится ΠΈΡ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ mp3 Ρ„Π°ΠΉΠ» (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: имя Ρ„Π°ΠΉΠ»Π° с тСкстом)
  -a AUDIO_DIR, --audio_dir AUDIO_DIR
                        Папка для сохранСния Π³ΠΎΡ‚ΠΎΠ²Ρ‹Ρ… Π°ΡƒΠ΄ΠΈΠΎ Ρ„Π°ΠΉΠ»ΠΎΠ² (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: тСкущая ΠΏΠ°ΠΏΠΊΠ°)

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ использования:
  python -m speakerpy -l ru -t speak -f ./books/example.txt -s 1.2;
  python -m speakerpy -l ru -t mp3 -f ./books/example.txt;
  python -m speakerpy -l en -t speak -f ./books/example.txt;
  python -m speakerpy -l en -t mp3 -f ./books/example.txt;

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹

ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ состоит ΠΈΠ· Π΄Π²ΡƒΡ… основных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ²: Lib Speak ΠΈ Lib SL Text.

Lib Speak

Lib Speak Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ классы Speaker ΠΈ SpeakerBase для синтСза Ρ€Π΅Ρ‡ΠΈ с использованиСм ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Silero. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ класса Speaker:

  1. speak: произнСсСниС тСкста.
  2. to_mp3: конвСртация тСкста Π² Π°ΡƒΠ΄ΠΈΠΎΡ„Π°ΠΉΠ» MP3.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ использования Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ speak

from lib_speak import Speaker
from lib_sl_text import SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠΌΠ΅Ρ€ тСкста для синтСза Ρ€Π΅Ρ‡ΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.speak(text=text, sample_rate=48000, speed=1.0)

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ использования Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ to_mp3

from lib_speak import Speaker
from lib_sl_text import SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠΌΠ΅Ρ€ тСкста для синтСза Ρ€Π΅Ρ‡ΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.to_mp3(text=text, name_text="ВСкст", sample_rate=48000, audio_dir=pathlib.Path(__file__).parent.parent / "mp3", speed=1.0)

Lib SL Text

Lib SL Text содСрТит класс SeleroText для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ тСкста ΠΏΠ΅Ρ€Π΅Π΄ синтСзом Ρ€Π΅Ρ‡ΠΈ. Основной ΠΌΠ΅Ρ‚ΠΎΠ΄ класса SeleroText:

  1. chunk: Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° Π±Π»ΠΎΠΊΠΈ.

ИспользованиС класса SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠ²Π΅Ρ‚, ΠΌΠΈΡ€!", to_language="ru")

Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° куски с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° chunk():

for chunk in text.chunk():
    print(chunk)

РСсурсы ΠΈ ссылки

About

πŸ”Š SpeakerPy - лСгкая ΠΈ мощная Python-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для синтСза Ρ€Π΅Ρ‡ΠΈ! πŸ’¬ Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Silero TTS для высококачСствСнного Π·Π²ΡƒΠΊΠ°. πŸŽ™οΈ ΠžΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π΅Ρ‚ числа, английскиС слова ΠΈ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅Ρ‚ тСкст Π½Π° части. πŸš€ Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΡ„Π»Π°ΠΉΠ½, сохраняСт Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π² MP3. 🎧 ИдСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для ΠΎΠ·Π²ΡƒΡ‡ΠΊΠΈ Π°ΡƒΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³, подкастов ΠΈ мноТСства Π΄Ρ€ΡƒΠ³ΠΈΡ… Π·Π°Π΄Π°Ρ‡! 🌐

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published