Skip to content

Latest commit

 

History

History
54 lines (37 loc) · 1.54 KB

python.md

File metadata and controls

54 lines (37 loc) · 1.54 KB

English | 中文

Python推理

确认开发环境已安装FastDeploy,参考FastDeploy安装安装预编译的FastDeploy,或根据自己需求进行编译安装。

本文档以 PaddleClas 分类模型 MobileNetV2 为例展示CPU上的推理示例

1. 获取模型

import fastdeploy as fd

model_url = "https://bj.bcebos.com/fastdeploy/models/mobilenetv2.tgz"
fd.download_and_decompress(model_url, path=".")

2. 配置后端

option = fd.RuntimeOption()

option.set_model_path("mobilenetv2/inference.pdmodel",
                      "mobilenetv2/inference.pdiparams")

# **** CPU 配置 ****
option.use_cpu()
option.use_ort_backend()
option.set_cpu_thread_num(12)

# 初始化构造runtime
runtime = fd.Runtime(option)

# 获取模型输入名
input_name = runtime.get_input_info(0).name

# 构造随机数据进行推理
results = runtime.infer({
    input_name: np.random.rand(1, 3, 224, 224).astype("float32")
})

print(results[0].shape)

加载完成,会输出提示如下,说明初始化的后端,以及运行的硬件设备

[INFO] fastdeploy/fastdeploy_runtime.cc(283)::Init	Runtime initialized with Backend::OrtBackend in device Device::CPU.

其它文档