Skip to content

Новостной Всемогутор 3000

Notifications You must be signed in to change notification settings

Vlad1slawoo/final_project

 
 

Repository files navigation

Новостной Всемогутор 3000

Телеграм-бот, который сэкономит время и сделает вашу жизнь проще!

Stack

Python PyTorch Aiogram Selenium Beautiful Soup Tesseract HuggingFace

Функциональность

  • Пользователь выбирает ресурс (habr/lenta/wiki), указывает интересующую тему.
  • С помощью библиотек Beautiful Soup, Selenium, Wikipedia происходит парсинг ресурса, выбираются релевантные статьи
  • NLP-модель на основе MBart генерит абстрактивное саммари статьи
  • Пользователю приходит сгенеренное короткое саммари с голосовой озвучкой и ссылкой на исходную статью
  • Раз в день бот присылает статьи по темам, которые пользователь искал ранее

Header

Дополнительная функциональность:

  • Пользователь может отправить длинный текст и бот выдаст его короткое саммари
  • Текст для суммаризации может быть отправлен в виде картинки, например, скриншота статьи или документа. Перед тем, как отправить его в модель саммаризации, приложение сделает распознавание (OCR) исходной картинки с помощью Tesseract OCR
  • Выделение сущностей (NER - named entity recognition) из введенного текста. Текстовая модель на основе BERT выделит и подсветит такие сущности как: Персоны, Даты, События, Организации, Деньги и т.д, что может быть полезно для анализа текстов
  • Оцифровка документов - перевод скриншота или фото документа в редактируемый текст с помощью OCR

Header

(БОНУС) Калькулятор расходов

  • Пригодится, если несколько людей потратились на общее мероприятие и надо быстро посчитать, кто сколько кому должен перевести.
  • Потраченные суммы можно вводить вручную или прикрепить фото с чеком - бот самостоятельно выделит сумму!

Header

About

Новостной Всемогутор 3000

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 80.6%
  • Jupyter Notebook 19.4%