Skip to content

OCR and feature extraction from invoices using openai API

Notifications You must be signed in to change notification settings

maxfil333/invoice_scanner

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

примеры команд:

pyinstaller --add-data "C:\Program Files\poppler-22.01.0\Library\bin;poppler" --onefile config/config.py

Добавление дополнительных файлов и папок к сборке.

1. Как добавить к сборке tesseract:

  • 1.1. Командой ..

pyinstaller --add-data "C:\Program Files\Tesseract-OCR;Tesseract-OCR" --onefile main.py

.. добавляем копию тессаракта в папку
Users\User\AppData\Local\Temp%TEMPFOLDERNAME%\Tesseract-OCR;

  • 1.2. Получить путь к копии tesseract.exe через ..

bundle_dir = sys._MEIPASS
pytesseract.pytesseract.tesseract_cmd = os.path.join(bundle_dir, 'Tesseract-OCR', 'tesseract.exe')

2. Создание и редактирование файла .spec:

  • 2.1. Создать файл filename.spec командой

pyinstaller --onefile src/filename.py

  • 2.2. Файл filename.spec отредактировать. Добавить в datas имена папок с алиасами:
    (это второй способ добавить tesseract в сборку)

datas=[
('C:\Program Files\poppler-22.01.0\Library\bin', 'poppler'),
('src', 'src'),
('config', 'config'),
('C:\Program Files\Tesseract-OCR', 'Tesseract-OCR')
],

  • 2.3. Удалить dist, build
  • 2.4. Выполнить pyinstaller filename.spec

Варианты доступа к переменной в различных сборках (на примере ImageMagick).

datas=[('C:\Program Files\ImageMagick-7.1.1-Q16-HDRI', 'magick')],

5.1 getattr(sys, 'frozen') + --onefile + --add-data/путь добавлен в .spec datas
os.path.join(sys._MEIPASS, 'magick', 'magick.exe')

5.2 getattr(sys, 'frozen') - --onefile + путь добавлен в .spec
os.path.join(sys._MEIPASS, 'magick', 'magick.exe')

5.3 getattr(sys, 'frozen') + --onefile - путь НЕ добавлен в .spec
Положить рядом с main.exe директорию с исполняемым файлом magick/magick.exe
os.path.join(os.path.dirname(sys.executable), 'magick', 'magick.exe')

5.4 getattr(sys, 'frozen') - --onefile - путь НЕ добавлен в .spec
Положить рядом с main.exe директорию с исполняемым файлом magick/magick.exe
os.path.join(os.path.dirname(sys.executable), 'magick', 'magick.exe')

5.5 Запуск из исходного кода
magick или C:\Program Files\ImageMagick-7.1.1-Q16-HDRI\magick.exe

About

OCR and feature extraction from invoices using openai API

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published