Skip to content

Latest commit

 

History

History
19 lines (12 loc) · 2.44 KB

README.md

File metadata and controls

19 lines (12 loc) · 2.44 KB

Скачиваем избранное хабрахабра в формат fb2

В принципе, скрипт уже работает - прописываем в файле config.php в переменной $login нужный логин, переходим на страничку index.php - и запускаем скачивание. Полноценный аккаунт не нужен, ключи разработчика не нужны, работает быстро, памяти много не ест.

Конфигурируется через файл config.php.

Есть проблема - не идеальная и не 100% конвертация из HTML в fb2. На некоторых статьях может генерироваться битый код, который ломает дальнейший просмотр книги. Причина - не найден надежный способ заменять тэг <br>. При замене на </empty-line> файл становится корректным с точки зрения XML, но часть читалок файл не принимает. С точки зрения стандарта нельзя использовать </empty-line> внутри <p></p>. Так что читаемость получившегося файла зависит от читалки. (Cool Reader, например, прочитает с любыми ошибками, FBReader - уже нет).

Неудачно скачанные картинки, статьи или файлы просто отбрасываются, а информация об ошибке записывается в лог.

Update от 27.02.2013. Теперь можно сохранять и комментарии к статьям (выключено по-умолчанию, настраивается в файле config.php, увеличиваем время генерации, размер файла, комментарии отображаются линейно, из комментариев удаляются картинки).

Скрипт не для коммандной строки - запускается через браузер. (я знаю про php-cli, позже будет реализовано).

В данный момент есть мысли на основе этого конвертера сделать конвертер в epub-формат.