# Python 快速开始(5分钟) 本教程带你从安装到推理,完成一个端到端的图像分类任务。 ## 1. 安装 MNN ```bash pip install MNN ``` > 如果 pip 安装失败(可能是当前系统和 Python 版本不支持),可以从源码编译安装,参考 [PyMNN 编译](../compile/pymnn.md)。 ## 2. 准备模型 以 MobileNet V1 为例,先将 ONNX 模型转换为 MNN 格式: ```bash # 转换为 MNN 格式(附带 8bit 权值量化,体积缩小 75%) mnnconvert -f ONNX --modelFile mobilenet_v1.onnx --MNNModel mobilenet_v1.mnn --weightQuantBits 8 ``` > 更多转换选项请参考 [模型转换工具](../tools/convert.md) 和 [模型压缩](../tools/compress.md)。 ## 3. 加载模型并推理 ```python from __future__ import print_function import numpy as np import MNN import MNN.cv as cv2 import sys def inference(model_path, image_path): # ========== 1. 加载模型 ========== # 参数:模型路径、输入名列表、输出名列表 net = MNN.nn.load_module_from_file(model_path, ["input"], ["MobilenetV1/Predictions/Reshape_1"]) # ========== 2. 预处理 ========== image = cv2.imread(image_path) image = image[..., ::-1] # BGR -> RGB image = cv2.resize(image, (224, 224)) image = image - (103.94, 116.78, 123.68) image = image * (0.017, 0.017, 0.017) image = image.astype(np.float32) # 创建输入 VARP:[N, H, W, C] NHWC 格式 input_var = MNN.expr.placeholder([1, 224, 224, 3], MNN.expr.NHWC) input_var.write(image) # Module 内部使用 NC4HW4 格式,需要转换 input_var = MNN.expr.convert(input_var, MNN.expr.NC4HW4) # ========== 3. 推理 ========== output_var = net.forward([input_var]) output_var = output_var[0] # ========== 4. 后处理 ========== # 输出也可能是 NC4HW4,转回 NHWC 再读取 output_var = MNN.expr.convert(output_var, MNN.expr.NHWC) print("预测类别编号:{}".format(np.argmax(output_var.read()))) if __name__ == "__main__": inference(sys.argv[1], sys.argv[2]) ``` 运行: ```bash python classify.py mobilenet_v1.mnn test.jpg ``` ## 4. 使用 GPU 加速(可选) ```python config = { 'backend': 3, # OpenCL GPU 'precision': 2, # FP16 'numThread': 4, } rt = MNN.nn.create_runtime_manager((config,)) rt.set_cache("gpu.cache") net = MNN.nn.load_module_from_file("mobilenet_v1.mnn", ["input"], ["MobilenetV1/Predictions/Reshape_1"], runtime_manager=rt) ``` > 后端选项:0=CPU, 1=Metal, 2=CUDA, 3=OpenCL, 7=Vulkan。详见 [PyMNN 完整指南](python.md)。 ## 下一步 - [LLM 部署指南](../transformers/llm.md) — 部署大语言模型 - [模型压缩](../tools/compress.md) — 权值量化、离线量化、FP16 压缩 - [C++ 推理-Module API](../inference/module.md) — C++ 高性能推理接口 - [Python API 参考](../pymnn/MNN.md) — 完整 Python API 文档