ComfyUI Audio Nodes

ComfyUI-EdgeTTS is a powerful text-to-speech node for ComfyUI, leveraging Microsoft's Edge TTS capabilities. It enables seamless conversion of text into natural-sounding speech, supporting multiple languages and voices. Ideal for enhancing user interactions, this node is easy to integrate and customize, making it perfect for various applications.

Updates

V1.1.0 (2025-01-24) - Added 19 new languages and 38 new voices, with more detailed characteristics for existing Chinese voices. For more information, please see the update log.

Features

Edge TTS Node

Edge TTS: Convert text to speech using Microsoft Edge TTS
- Multiple languages and voices support
- Adjustable speech rate and pitch
- High-quality voice synthesis
- Configurable via config.json

Speech to Text Node

Whisper STT: High-accuracy speech recognition
- Multiple language support with auto-detection
- Multiple model sizes (tiny to large)
- Supports ComfyUI audio format
- Language detection confidence reporting

Audio File Node

Save Audio: Export audio files
- Supports WAV, MP3, FLAC formats
- Quality presets (high/medium/low)
- Custom file naming and paths
- Automatic file numbering

Installation

Method 1. install on ComfyUI-Manager, search `Comfyui-EdgeTTS` and install

install requirment.txt in the ComfyUI-EdgeTTS folder

./ComfyUI/python_embeded/python -m pip install -r requirements.txt

Method 2. Clone this repository to your ComfyUI custom_nodes folder:

cd ComfyUI/custom_nodes
git clone https://github.com/1038lab/ComfyUI-EdgeTTS.git

install requirment.txt in the ComfyUI-EdgeTTS folder

./ComfyUI/python_embeded/python -m pip install -r requirements.txt

Requirements

Python packages (see requirements.txt)
CUDA compatible GPU (optional, for faster Whisper processing)

Usage Examples

Text to Speech

Add Edge TTS node to workflow
Input text and select voice
Adjust speed and pitch if needed
Connect to Save Audio node for export

ComfyUI-edgeTTS-DEMO.mp4

Speech to Text

Add Whisper STT node
Connect audio input
Select model size and language (or auto-detect)
Run to get transcription

Supported Voices

Language	Female Voices	Male Voices
Chinese-Mainland	XiaoXiao (News, Novel, Warm), XiaoYi (Cartoon, Novel, Lively)	Yunjian (Sports, Novel, Passion), Yunxi (Novel, Lively), Yunxia (Cartoon, Novel), Yunyang (News, Professional)
Chinese-Cantonese	HiuGaai (Friendly), HiuMaan (Friendly)	WanLung (Friendly)
Chinese-Taiwan	HsiaoChen (Friendly), HsiaoYu (Friendly)	YunJhe (Friendly)
English-US	Jenny (Friendly), Aria (Positive), Ana (Cute), Michelle (Friendly)	Guy (Passion), Christopher (Authority), Eric (Rational), Roger (Lively), Steffan (Rational)
English-GB	Libby (Friendly), Maisie (Friendly), Sonia (Friendly)	Ryan (Friendly), Thomas (Friendly)
English-AU	Natasha (Friendly)	William (Friendly)
Japanese	Nanami (Friendly)	Keita (Friendly)
Korean	SunHi (Friendly)	InJoon (Friendly), Hyunsu (Multilingual)
French-FR	Denise (Friendly), Eloise (Friendly), Vivienne (Multilingual)	Henri (Friendly), Remy (Multilingual)
French-CA	Sylvie (Friendly)	Jean (Friendly), Antoine (Friendly)
German-DE	Katja (Friendly), Amala (Friendly), Seraphina (Multilingual)	Conrad (Friendly), Killian (Friendly), Florian (Multilingual)

More voices available in config.json, including voices for:

German (AT/CH)
Spanish (ES/MX)
Russian
Italian
Portuguese (BR/PT)
Dutch
Polish
Turkish
Arabic
Hindi
Indonesian
Vietnamese
Thai
Ukrainian And many more...

Each language provides at least one male and female voice option, allowing you to choose different voice styles based on your needs.

Credits

Edge TTS: Microsoft Edge TTS
Whisper: OpenAI Whisper

Name	Name	Last commit message	Last commit date
Latest commit 1038lab Update README.md Jan 24, 2025 560d7a7 · Jan 24, 2025 History 41 Commits
.github/workflows	.github/workflows	Create publish.yml	Jan 17, 2025
LICENSE	LICENSE	Initial commit	Jan 16, 2025
README.md	README.md	Update README.md	Jan 24, 2025
__init__.py	__init__.py	Add files via upload	Jan 16, 2025
ailab_audio.py	ailab_audio.py	Add files via upload	Jan 17, 2025
ailab_edgeTTS.py	ailab_edgeTTS.py	Add files via upload	Jan 24, 2025
ailab_whisperSTT.py	ailab_whisperSTT.py	Add files via upload	Jan 17, 2025
config.json	config.json	Add files via upload	Jan 24, 2025
pyproject.toml	pyproject.toml	Update pyproject.toml	Jan 24, 2025
requirements.txt	requirements.txt	Add files via upload	Jan 16, 2025
update.md	update.md	Add files via upload	Jan 24, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ComfyUI Audio Nodes

Updates

Features

Edge TTS Node

Speech to Text Node

Audio File Node

Installation

Method 1. install on ComfyUI-Manager, search `Comfyui-EdgeTTS` and install

Method 2. Clone this repository to your ComfyUI custom_nodes folder:

Requirements

Usage Examples

Text to Speech

Speech to Text

Supported Voices

Credits

About

Releases

Packages

Languages

License

1038lab/ComfyUI-EdgeTTS

Folders and files

Latest commit

History

Repository files navigation

ComfyUI Audio Nodes

Updates

Features

Edge TTS Node

Speech to Text Node

Audio File Node

Installation

Method 1. install on ComfyUI-Manager, search Comfyui-EdgeTTS and install

Method 2. Clone this repository to your ComfyUI custom_nodes folder:

Requirements

Usage Examples

Text to Speech

Speech to Text

Supported Voices

Credits

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Method 1. install on ComfyUI-Manager, search `Comfyui-EdgeTTS` and install

Packages