- Пользователь выбирает ресурс (habr/lenta/wiki), указывает интересующую тему.
- С помощью библиотек Beautiful Soup, Selenium, Wikipedia происходит парсинг ресурса, выбираются релевантные статьи
- NLP-модель на основе MBart генерит абстрактивное саммари статьи
- Пользователю приходит сгенеренное короткое саммари с голосовой озвучкой и ссылкой на исходную статью
- Раз в день бот присылает статьи по темам, которые пользователь искал ранее
- Пользователь может отправить длинный текст и бот выдаст его короткое саммари
- Текст для суммаризации может быть отправлен в виде картинки, например, скриншота статьи или документа. Перед тем, как отправить его в модель саммаризации, приложение сделает распознавание (OCR) исходной картинки с помощью Tesseract OCR
- Выделение сущностей (NER - named entity recognition) из введенного текста. Текстовая модель на основе BERT выделит и подсветит такие сущности как: Персоны, Даты, События, Организации, Деньги и т.д, что может быть полезно для анализа текстов
- Оцифровка документов - перевод скриншота или фото документа в редактируемый текст с помощью OCR
- Пригодится, если несколько людей потратились на общее мероприятие и надо быстро посчитать, кто сколько кому должен перевести.
- Потраченные суммы можно вводить вручную или прикрепить фото с чеком - бот самостоятельно выделит сумму!