Text classification based on PDF input data

Package structure

.
├── environment.yml
├── logs
├── main.py
├── README.md
├── requirements.txt
├── src
│   ├── __init__.py
│   ├── notebooks
│   │   ├── fasttext_classifier.ipynb
│   │   └── naivebayes_classifier.ipynb
│   ├── pdf_extract
│   │   ├── config
│   │   ├── data
│   │   ├── resources
│   │   ├── services
│   │   └── utils
│   ├── setup.py
│   └── templates
└── stream_app.py

Package installation

Create conda virtual environment with required packages

conda env create -f environment.yml 
conda activate env_pdf

Install your package

python -m spacy download en_core_web_lg
python -m spacy download de_core_news_lg      # install large word embeddings
pip install -e src

Start REST API locally:

uvicorn main:app --reload --port 5000         # checkout Swagger docs: http://127.0.0.1:5000/docs

Start streamlit app locally:

streamlit run stream_app.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Text classification based on PDF input data

Package structure

Package installation

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 79 Commits
.streamlit		.streamlit
.vscode		.vscode
src		src
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
main.py		main.py
requirements.txt		requirements.txt
stream_app.py		stream_app.py

AVoss84/pdf_extract

Folders and files

Latest commit

History

Repository files navigation

Text classification based on PDF input data

Package structure

Package installation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages