Alternative (Neura Voice)

original implementation of fast parallel speech signal generation from text with MFCC (2018)

Idea & Architecture

Text → (Location-based attention mechanism) → MFCC
MFCC → (parallel recurrent network) → Speech Signal

Text to Mel

This model is based on Alex Glaves「Generating Sequences With Recurrent Neural Networks」

MFCC to Speech Signal

Parallel speech signal generation vocoder model (based on WaveRNN)

    WaveRNN math::
        xt = [ct-1, ft-1, ct]  # input
        ut = σ(Ru ht-1 + Iu*xt + bu)  # update gate
        rt = σ(Rr ht-1 + Ir*xt + br)  # reset gate
        et = tanh(rt∘(Re ht-1) + Ie*xt + be)  # recurrent unit
        ht = ut∘ht-1 + (1-u)∘et  # next hidden state
        yc, yf = split(ht)  # coarse, fine
        P(ct) = softmax(O2 relu(O1 yc))  # coarse distribution
        P(ft) = softmax(O4 relu(O3 yf))  # fine distribution

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
notes		notes
Char2Mel_generation.ipynb		Char2Mel_generation.ipynb
Char2Mel_train.ipynb		Char2Mel_train.ipynb
Char2Mel_train_single.ipynb		Char2Mel_train_single.ipynb
Char2Wav_train.ipynb		Char2Wav_train.ipynb
NewTTS_train.ipynb		NewTTS_train.ipynb
README.md		README.md
Vocoder_generation.ipynb		Vocoder_generation.ipynb
Vocoder_single_sample_train.ipynb		Vocoder_single_sample_train.ipynb
Vocoder_train.ipynb		Vocoder_train.ipynb
calcnote.ipynb		calcnote.ipynb
char2mel_calculation.ipynb		char2mel_calculation.ipynb
char2mel_calculation_backup.ipynb		char2mel_calculation_backup.ipynb
dataset.py		dataset.py
mel_spectram_test.ipynb		mel_spectram_test.ipynb
neuravoice.py		neuravoice.py
neuravoice2.py		neuravoice2.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Alternative (Neura Voice)

Idea & Architecture

Text to Mel

MFCC to Speech Signal

About

Releases

Packages

Languages

kazukiotsuka/Alternative

Folders and files

Latest commit

History

Repository files navigation

Alternative (Neura Voice)

Idea & Architecture

Text to Mel

MFCC to Speech Signal

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages