Benchmark工具

Linux / macOS / Ubuntu

从源码编译,然后执行如下命令:

./benchmark.out models_folder loop_count warm_up_count forwardtype numberThread precision weightSparsity weightSparseBlockNumber testQuantizdModel

参数如下:

  • models_folder: benchmark models文件夹,benchmark models

  • loop_count: 可选,默认是10

  • warm_up_count: 预热次数

  • forwardtype: 可选,默认是0,即CPU,forwardtype有0->CPU,1->Metal,3->OpenCL,6->OpenGL,7->Vulkan

  • numberThread: 可选,默认是4,为 CPU 线程数或者 GPU 的运行模式

  • precision: 可选,默认是2,有效输入为:0(Normal), 1(High), 2(Low_FP16), 3(Low_BF16)

  • weightSparsity: 可选,默认是 0.0 ,在 weightSparsity > 0.5 时且后端支持时,开启稀疏计算

  • weightSparseBlockNumber: 可选,默认是 1 ,仅当 weightSparsity > 0.5 时生效,为稀疏计算 block 大小,越大越有利于稀疏计算的加速,一般选择 1, 4, 8, 16

  • testQuantizedModel 可选,默认是0,即只测试浮点模型;取1时,会在测试浮点模型后进行量化模型的测试

Android

benchmark目录下直接执行脚本bench_android.sh,默认编译armv7,加参数-64编译armv8,参数-p将benchmarkModels push到机器上。 脚本执行完成在benchmark目录下得到测试结果benchmark.txt

iOS

  1. 先准备模型文件,进入tools/script目录下执行脚本get_model.sh

  2. 打开demo/iOS目录下的demo工程,点击benchmark;可通过底部工具栏切换模型、推理类型、线程数。

基于表达式构建模型的Benchmark

从源码编译,运行以下命令查看帮助:

 ./benchmarkExprModels.out help

示例:

 ./benchmarkExprModels.out MobileNetV1_100_1.0_224 10 0 4 
 ./benchmarkExprModels.out MobileNetV2_100 10 0 4 
 ./benchmarkExprModels.out ResNet_100_18 10 0 4 
 ./benchmarkExprModels.out GoogLeNet_100 10 0 4 
 ./benchmarkExprModels.out SqueezeNet_100 10 0 4 
 ./benchmarkExprModels.out ShuffleNet_100_4 10 0 4

相应模型的paper链接附在头文件里,如benchmark/exprModels/MobileNetExpr.hpp