一个简易的pdf转markdown服务
- 前端项目地址:marker-ui
- 后端项目地址:marker-api
在运行安装命令之前,请确保您的机器上安装了 Docker 和 Docker Compose
git clone https://github.com/zivenyang/marker-deploy.git --recursive
cd marker-deploy
docker-compose up -d --build
前端日志查看:docker logs -f marker-ui
后端日志查看:docker logs -f marker-api
访问http://localhost:28000/进行访问
点击第一个图标上传pdf文件进行识别,识别时长取决与本机算力,第一次使用会从huggingface上下载模型,本镜像默认使用的cpu计算,识别时间较长(约10分钟),如需使用gpu请修改docker-compose.yml中的api服务,参考Turn on GPU access with Docker Compose
中文识别需要将在marker-deploy/marker-api/server.py
中将默认语言改为Chinese
以提高中文识别准确率,修改后记得返回marker-deploy
目录使用docker-compose up -d --build
重新构建服务
@app.post("/convert")
async def convert_pdf_to_markdown(pdf_file: UploadFile = File(...), extract_images: bool = True):
Settings.DEFAULT_LANG="Chinese" # 将默认语言设置为中文
if extract_images == False:
Settings.EXTRACT_IMAGES = False
print("Print EXTRACT_IMAGES set to False")
else:
Settings.EXTRACT_IMAGES = True
...
- 暂不支持图片预览,但接口有返回base64编码