Benchmark工具
Linux / macOS / Ubuntu
从源码编译,然后执行如下命令:
./benchmark.out models_folder loop_count warm_up_count forwardtype numberThread precision weightSparsity weightSparseBlockNumber testQuantizdModel
参数如下:
models_folder: benchmark models文件夹,benchmark models。
loop_count: 可选,默认是10
warm_up_count: 预热次数
forwardtype: 可选,默认是0,即CPU,forwardtype有0->CPU,1->Metal,3->OpenCL,6->OpenGL,7->Vulkan
numberThread: 可选,默认是4,为 CPU 线程数或者 GPU 的运行模式
precision: 可选,默认是 2 (precision_low)
weightSparsity: 可选,默认是 0.0 ,在 weightSparsity > 0.5 时且后端支持时,开启稀疏计算
weightSparseBlockNumber: 可选,默认是 1 ,仅当 weightSparsity > 0.5 时生效,为稀疏计算 block 大小,越大越有利于稀疏计算的加速,一般选择 1, 4, 8, 16
testQuantizedModel 可选,默认是0,即只测试浮点模型;取1时,会在测试浮点模型后进行量化模型的测试
Android
在benchmark目录下直接执行脚本bench_android.sh
,默认编译armv7,加参数-64编译armv8,参数-p将benchmarkModels push到机器上。
脚本执行完成在benchmark目录下得到测试结果benchmark.txt
iOS
先准备模型文件,进入tools/script目录下执行脚本
get_model.sh
;打开demo/iOS目录下的demo工程,点击benchmark;可通过底部工具栏切换模型、推理类型、线程数。
基于表达式构建模型的Benchmark
从源码编译,运行以下命令查看帮助:
./benchmarkExprModels.out help
示例:
./benchmarkExprModels.out MobileNetV1_100_1.0_224 10 0 4
./benchmarkExprModels.out MobileNetV2_100 10 0 4
./benchmarkExprModels.out ResNet_100_18 10 0 4
./benchmarkExprModels.out GoogLeNet_100 10 0 4
./benchmarkExprModels.out SqueezeNet_100 10 0 4
./benchmarkExprModels.out ShuffleNet_100_4 10 0 4
相应模型的paper链接附在头文件里,如benchmark/exprModels/MobileNetExpr.hpp