在部署前,需确认以下两个步骤
-
- 软硬件环境满足要求,参考FastDeploy环境要求
-
- FastDeploy Python whl包安装,参考FastDeploy Python安装
【注意】如你部署的为PP-Matting、PP-HumanMatting以及ModNet请参考Matting模型部署
本目录下提供infer.py
快速完成Unet在CPU/GPU,以及GPU上通过TensorRT加速部署的示例。执行如下脚本即可完成
#下载部署示例代码
git clone https://github.com/PaddlePaddle/FastDeploy.git
cd FastDeploy/examples/vision/segmentation/paddleseg/python
# 下载Unet模型文件和测试图片
wget https://bj.bcebos.com/paddlehub/fastdeploy/Unet_cityscapes_without_argmax_infer.tgz
tar -xvf Unet_cityscapes_without_argmax_infer.tgz
wget https://paddleseg.bj.bcebos.com/dygraph/demo/cityscapes_demo.png
# CPU推理
python infer.py --model Unet_cityscapes_without_argmax_infer --image cityscapes_demo.png --device cpu
# GPU推理
python infer.py --model Unet_cityscapes_without_argmax_infer --image cityscapes_demo.png --device gpu
# GPU上使用TensorRT推理 (注意:TensorRT推理第一次运行,有序列化模型的操作,有一定耗时,需要耐心等待)
python infer.py --model Unet_cityscapes_without_argmax_infer --image cityscapes_demo.png --device gpu --use_trt True
运行完成可视化结果如下图所示
fd.vision.segmentation.PaddleSegModel(model_file, params_file, config_file, runtime_option=None, model_format=ModelFormat.PADDLE)
PaddleSeg模型加载和初始化,其中model_file, params_file以及config_file为训练模型导出的Paddle inference文件,具体请参考其文档说明模型导出
参数
- model_file(str): 模型文件路径
- params_file(str): 参数文件路径
- config_file(str): 推理部署配置文件
- runtime_option(RuntimeOption): 后端推理配置,默认为None,即采用默认配置
- model_format(ModelFormat): 模型格式,默认为Paddle格式
PaddleSegModel.predict(input_image)模型预测结口,输入图像直接输出检测结果。
参数
- input_image(np.ndarray): 输入数据,注意需为HWC,BGR格式
返回
返回
fastdeploy.vision.SegmentationResult
结构体,结构体说明参考文档视觉模型预测结果
用户可按照自己的实际需求,修改下列预处理参数,从而影响最终的推理和部署效果
- is_vertical_screen(bool): PP-HumanSeg系列模型通过设置此参数为
true
表明输入图片是竖屏,即height大于width的图片
- apply_softmax(bool): 当模型导出时,并未指定
apply_softmax
参数,可通过此设置此参数为true
,将预测的输出分割标签(label_map)对应的概率结果(score_map)做softmax归一化处理