pdf-tools

Tools to extract/transform data from PDF

inspired by project: pdf-to-markdown

Installation

npm install @bsorrentino/pdf-tools -g

Requirements

NodeJs >= 16
Since pdf-tools use canvas that is a Cairo-backed Canvas implementation for Node.js take a look to its reqirements

pdftools Commands

common options

 -o, --outdir [folder]        output folder (default: "out")

pdfximages

extract images (as png) from pdf and save it to the given folder

Usage:

pdftools pdfximages|pxi [options] <pdf>

pdf2images

create an image (as png) for each pdf page

Usage:

pdftools pdf2images|p2i <pdf>

pdf2md

convert pdf to markdown format.

Usage:

pdftools pdf2md|p2md [options] <pdf>

Options:

  -ps, --pageseparator [separator]  add page separator (default: "---")
  --imageurl [url prefix]           imgage url prefix
  --stats                           print stats information
  --debug                           print debug information

Conversion to Markdown

supported features

Detect headers
Detect and extract images
Extract plain text
Extract fonts and allow custom mapping through a generated file <document name>.font.json

Supported fonts bold, italic, monospace, bold+italic
Detect code block ( i.e. ```)
Detect external link

TO DO

Detect TOC

Name		Name	Last commit message	Last commit date
Latest commit History 210 Commits
.github/workflows		.github/workflows
pdf2md		pdf2md
samples		samples
src		src
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
README.md		README.md
changelog.mustache		changelog.mustache
cli.js		cli.js
jest.config.js		jest.config.js
jsr.json		jsr.json
package.json		package.json
tsconfig.json		tsconfig.json
zx-clean.mjs		zx-clean.mjs

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pdf-tools

Installation

Requirements

pdftools Commands

pdfximages

pdf2images

pdf2md

Conversion to Markdown

supported features

TO DO

About

Releases 6

Packages

Languages

License

bsorrentino/pdf-tools

Folders and files

Latest commit

History

Repository files navigation

pdf-tools

Installation

Requirements

pdftools Commands

pdfximages

pdf2images

pdf2md

Conversion to Markdown

supported features

TO DO

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 6

Packages 0

Languages

Packages