PaddleClas 支持 Python Whl 包方式进行预测,目前 Whl 包方式仅支持图像分类,暂不支持主体检测、特征提取及向量检索。
- pip安装
pip3 install paddleclas==2.2.1
- 本地构建并安装
python3 setup.py bdist_wheel
pip3 install dist/*
- 使用
ResNet50
模型,以下图(PaddleClas/docs/images/inference_deployment/whl_demo.jpg
)为例进行说明。
- 在Python代码中使用
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
result=clas.predict(infer_imgs)
print(next(result))
注意:PaddleClas.predict()
为可迭代对象(generator
),因此需要使用 next()
函数或 for
循环对其迭代调用。每次调用将以 batch_size
为单位进行一次预测,并返回预测结果。返回结果示例如下:
>>> result
[{'class_ids': [8, 7, 136, 80, 84], 'scores': [0.79368, 0.16329, 0.01853, 0.00959, 0.00239], 'label_names': ['hen', 'cock', 'European gallinule, Porphyrio porphyrio', 'black grouse', 'peacock']}]
- 在命令行中使用
paddleclas --model_name=ResNet50 --infer_imgs="docs/images/inference_deployment/whl_demo.jpg"
>>> result
filename: docs/images/inference_deployment/whl_demo.jpg, top-5, class_ids: [8, 7, 136, 80, 84], scores: [0.79368, 0.16329, 0.01853, 0.00959, 0.00239], label_names: ['hen', 'cock', 'European gallinule, Porphyrio porphyrio', 'black grouse', 'peacock']
Predict complete!
以下参数可在命令行方式使用中通过参数指定,或在Python代码中实例化PaddleClas对象时作为构造函数的参数使用。
- model_name(str): 模型名称,使用PaddleClas提供的基于ImageNet1k的预训练模型。
- inference_model_dir(str): 本地模型文件目录,当未指定
model_name
时该参数有效。该目录下需包含inference.pdmodel
和inference.pdiparams
两个模型文件。 - infer_imgs(str): 待预测图片文件路径,或包含图片文件的目录,或网络图片的URL。
- use_gpu(bool): 是否使用GPU,默认为
True
。 - gpu_mem(int): 使用的GPU显存大小,当
use_gpu
为True
时有效,默认为8000。 - use_tensorrt(bool): 是否开启TensorRT预测,可提升GPU预测性能,需要使用带TensorRT的预测库,默认为
False
。 - enable_mkldnn(bool): 是否开启MKLDNN,当
use_gpu
为False
时有效,默认False
。 - cpu_num_threads(int): cpu预测时的线程数,当
use_gpu
为False
且enable_mkldnn
为True
时有效,默认值为10
。 - batch_size(int): 预测时每个batch的样本数量,默认为
1
。 - resize_short(int): 按图像较短边进行等比例缩放,默认为
256
。 - crop_size(int): 将图像裁剪到指定大小,默认为
224
。 - topk(int): 打印(返回)预测结果的前
topk
个类别和对应的分类概率,默认为5
。 - class_id_map_file(str):
class id
与label
的映射关系文件。默认使用ImageNet1K
数据集的映射关系。 - save_dir(str): 将预测结果作为预标注数据保存的路径,默认为
None
,即不保存。
注意: 如果使用Transformer
系列模型,如DeiT_***_384
, ViT_***_384
等,请注意模型的输入数据尺寸,需要设置参数resize_short=384
, crop_size=384
,如下所示。
- 命令行中
from paddleclas import PaddleClas, get_default_confg
paddleclas --model_name=ViT_base_patch16_384 --infer_imgs='docs/images/inference_deployment/whl_demo.jpg' --resize_short=384 --crop_size=384
- Python代码中
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ViT_base_patch16_384', resize_short=384, crop_size=384)
PaddleClas提供两种使用方式:
- Python代码中使用;
- 命令行中使用。
- CLI
paddleclas -h
可以使用PaddleClas提供的预训练模型来预测,并通过参数model_name
指定。此时PaddleClas会根据model_name
自动下载指定模型,并保存在目录~/.paddleclas/
下。
- Python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
result=clas.predict(infer_imgs)
print(next(result))
- CLI
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
可以使用本地的模型文件进行预测,通过参数inference_model_dir
指定模型文件目录即可。需要注意,模型文件目录下必须包含inference.pdmodel
和inference.pdiparams
两个文件。
- Python
from paddleclas import PaddleClas
clas = PaddleClas(inference_model_dir='./inference/')
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
result=clas.predict(infer_imgs)
print(next(result))
- CLI
paddleclas --inference_model_dir='./inference/' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
当参数 infer_imgs
为包含图片文件的目录时,可以对图片进行批量预测,只需通过参数 batch_size
指定batch大小。
- Python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', batch_size=2)
infer_imgs = 'docs/images/'
result=clas.predict(infer_imgs)
for r in result:
print(r)
- CLI
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/' --batch_size 2
可以对网络图片进行预测,只需通过参数infer_imgs
指定图片url
。此时图片会下载并保存在~/.paddleclas/images/
目录下。
- Python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
infer_imgs = 'https://raw.githubusercontent.com/paddlepaddle/paddleclas/release/2.2/docs/images/inference_deployment/whl_demo.jpg'
result=clas.predict(infer_imgs)
print(next(result))
- CLI
paddleclas --model_name='ResNet50' --infer_imgs='https://raw.githubusercontent.com/paddlepaddle/paddleclas/release/2.2/docs/images/inference_deployment/whl_demo.jpg'
在Python中,可以对Numpy.ndarray
格式的图像数据进行预测,只需通过参数infer_imgs
指定即可。注意该图像数据必须为三通道图像数据。
- python
import cv2
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
infer_imgs = cv2.imread("docs/images/inference_deployment/whl_demo.jpg")
result=clas.predict(infer_imgs)
print(next(result))
可以指定参数pre_label_out_dir='./output_pre_label/'
,将图片按其top1预测结果保存到pre_label_out_dir
目录下对应类别的文件夹中。
- python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', save_dir='./output_pre_label/')
infer_imgs = 'docs/images/whl/' # it can be infer_imgs folder path which contains all of images you want to predict.
result=clas.predict(infer_imgs)
print(next(result))
- CLI
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/whl/' --save_dir='./output_pre_label/'
可以通过参数class_id_map_file
指定class id
与lable
的对应关系。PaddleClas默认使用ImageNet1K的label_name(ppcls/utils/imagenet1k_label_list.txt
)。
class_id_map_file
文件内容格式应为:
class_id<space>class_name<\n>
例如:
0 tench, Tinca tinca
1 goldfish, Carassius auratus
2 great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias
......
- Python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', class_id_map_file='./ppcls/utils/imagenet1k_label_list.txt')
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
result=clas.predict(infer_imgs)
print(next(result))
- CLI
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg' --class_id_map_file='./ppcls/utils/imagenet1k_label_list.txt'