Skip to content

bogdal1993/voice_perception

Repository files navigation

voice_perception

Alt text

Система речевой аналитики на базе Vosk
Основные фукнции

  1. Распознавание звонков
  2. Диаризация моно звонков
  3. Определение эмоций по фразам
  4. Построение отчетов по звонкам
  5. Поиск звонков по тексту
  6. Суммаризация по тексту диалога на базе LLM mistral 7b
  7. Автотематизация

Установка

Установить БД postgres и запустить инициализирующий скрипт initial.sql

Worker node

  1. Перейти в директорию worker_node
cd worker_node
  1. в файле docker-compose.yml изменить параметры подключения к БД в DSN, вместо
postgresql://user:pass@host:port/db

прописать ваши данные

  1. в переменной VOSK_SERVER указать адрес текущей машины или вместо 127.0.0.1 прописать vosk

  2. Скачать нужные файлы моделей

в директорию

cd vosk 

скачать и распаковать модели vosk по ссылкам из файла loadvosk.txt

в директорию

text_processor\ruword2tags

скачиваем файл ruword2tags.db по ссылке в load.txt

  1. Запустить через
docker-compose up -d

Web node

Устанавливаем nginx и прописываем конфигурацию как в файле default. Если сервисы расположены на разных машинах, то необходимо прописать корректные адреса до них в секциях location -> proxy_pass.

Если web node развернута на отдельном сервере, то указать в docker-compose.yml Правильный внешний адрес машины

APIURL: "http://127.0.0.1/api/file/"

LLM node

Скачать модель с помощью скрипта

llm_node\summarization_server\load_model.sh

Запустить сервер через

docker-compose up -d

Загрузка аудио

в файле load.curl есть пример запроса для подгрузки новых аудио
Так же в интерфейсе реализована форма загрузки через web

Пример интерфейса

Основной интерфейс просмотра звонков Alt text

Интерфейс графических отчетов Alt text

Интерфейс поиска по тексту Alt text

В проекте используются модели Vosk, DeepPavlov, I.Koziev

Присоединяйтесь к сообществу https://t.me/voiceperception