Caffe-Speaker-Recognition

Convolutional Neural Network to recognize the speaker from a spoken number dataset.

##Dataset The dataset includes audio spectrogram of 24 different speakers, speaking 0-9 numbers. Training set has the total of 3500 records and Testing set includes the total of 1080 records. Dataset Link http://pannous.net/spoken_numbers.tar

##Model Convolutional Neural Network consists of 5 convolution layers, 3 fully connected layers with ReLu and Max-Pooling in between.

##Deep Learning Platform Used Caffe

##Training Steps Executed the following command from Caffe root folder to train the model.

build/tools/caffe train --solver = speaker_recognition/solver.prototxt

##Accuracy Achieved 99% accuracy in 5000 iterations.

##Classification Executed the following command from Caffe root folder for classification the "0_Karen_160.png" which is a spectrogram of user "Karen" speaking number '0' by using the trained model.

build/examples/cpp_classification/classification.bin speaker_recognition/numbers_deploy.prototxt speaker_recognition/numbers_iter_5212.caffemodel speaker_recognition/train_mean.binaryproto speaker_recognition/synset_numbers.txt speaker_recognition/0_Karen_160.png

##Reference https://github.com/pannous/caffe-speech-recognition

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
README.md		README.md
SpeakerRecognition_net.prototxt		SpeakerRecognition_net.prototxt
create_spoken_number_dataset.py		create_spoken_number_dataset.py
create_synset_spoken_number.py		create_synset_spoken_number.py
dataset.txt		dataset.txt
generate_test_and_train_dataset.py		generate_test_and_train_dataset.py
numbers_deploy.prototxt		numbers_deploy.prototxt
solver.prototxt		solver.prototxt
synset_numbers.txt		synset_numbers.txt
test.txt		test.txt
train.txt		train.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Caffe-Speaker-Recognition

About

Releases

Packages

Languages

Nishanksingla/Caffe-Speaker-Recognition

Folders and files

Latest commit

History

Repository files navigation

Caffe-Speaker-Recognition

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages