MNN-Doc

介绍

  • MNN介绍
  • 发布版本

快速开始

  • 快速开始
  • 示例工程

从源码构建

  • 编译宏介绍
  • 主库编译
  • 其他模块编译
  • Pymnn构建

推理用法

  • Session API使用
  • Module API使用
  • Python API使用
  • NPU 及相应后端使用说明

表达式

  • Expr API使用

训练框架

  • 使用表达式接口训练
  • 加载训练数据
  • 优化器使用
  • 使用预训练模型Finetune
  • 蒸馏训练

生成式模型

  • 扩散模型
  • 大语言模型
  • 模型下载
    • 大语言模型

工具集

  • 模型转换工具
  • 测试工具
  • Benchmark工具
  • 模型压缩 / 模型量化
  • 可视化工具
  • Python工具

贡献代码

  • 代码风格
  • 自定义后端
  • 自定义算子

FAQ

  • 常见问题与解答

C++ API

  • Interpreter
  • Tensor
  • ImageProcess
  • Matrix
  • VARP
  • Variable
  • Expr
  • Module
  • Optimizer
  • MathOp
  • NeuralNetWorkOp

Python API

  • MNN
  • expr
  • numpy
  • cv
  • nn
  • optim
  • data
  • loss
  • compress
  • linalg
  • random
  • MNN.Interpreter [deprecated]
  • MNN.Session [deprecated]
  • MNN.OpInfo
  • MNN.Tensor [deprecated]
  • MNN.CVImageProcess [deprecated]
  • 不建议使用该接口,请使用cv代替
  • MNN.CVMatrix [deprecated]
  • expr.Var
  • nn._Module
  • nn.RuntimeManager
  • optim.Optimizer
  • data.Dataset
  • data.DataLoader
MNN-Doc
  • 模型下载
  • View page source

模型下载

大语言模型

Model ModelScope Hugging Face
Qwen-VL-Chat Q4_1 Q4_1
Baichuan2-7B-Chat Q4_1 Q4_1
bge-large-zh Q4_1 Q4_1
chatglm-6b Q4_1 Q4_1
chatglm2-6b Q4_1 Q4_1
chatglm3-6b Q4_1 Q4_1
codegeex2-6b Q4_1 Q4_1
deepseek-llm-7b-chat Q4_1 Q4_1
gemma-2-2b-it Q4_1 Q4_1
glm-4-9b-chat Q4_1 Q4_1
gte_sentence-embedding_multilingual-base Q4_1 Q4_1
internlm-chat-7b Q4_1 Q4_1
Llama-2-7b-chat Q4_1 Q4_1
Llama-3-8B-Instruct Q4_1 Q4_1
Llama-3.2-1B-Instruct Q4_1 Q4_1
Llama-3.2-3B-Instruct Q4_1 Q4_1
OpenELM-1_1B-Instruct Q4_1 Q4_1
OpenELM-270M-Instruct Q4_1 Q4_1
OpenELM-3B-Instruct Q8_1 Q8_1
OpenELM-450M-Instruct Q4_1 Q4_1
phi-2 Q4_1 Q4_1
qwen/Qwen-1_8B-Chat Q4_1 Q4_1
Qwen-7B-Chat Q4_1 Q4_1
Qwen1.5-0.5B-Chat Q4_1 Q4_1
Qwen1.5-1.8B-Chat Q4_1 Q4_1
Qwen1.5-4B-Chat Q4_1 Q4_1
Qwen1.5-7B-Chat Q4_1 Q4_1
Qwen2-0.5B-Instruct Q4_1 Q4_1
Qwen2-1.5B-Instruct Q4_1 Q4_1
Qwen2-7B-Instruct Q4_1 Q4_1
Qwen2-VL-2B-Instruct Q4_1 Q4_1
Qwen2-VL-7B-Instruct Q4_1 Q4_1
Qwen2.5-0.5B-Instruct Q4_1 Q4_1
Qwen2.5-1.5B-Instruct Q4_1 Q4_1
Qwen2.5-3B-Instruct Q4_1 Q4_1
Qwen2.5-7B-Instruct Q4_1 Q4_1
Qwen2.5-Coder-1.5B-Instruct Q4_1 Q4_1
Qwen2.5-Coder-7B-Instruct Q4_1 Q4_1
Qwen2.5-Math-1.5B-Instruct Q4_1 Q4_1
Qwen2.5-Math-7B-Instruct Q4_1 Q4_1
reader-lm-0.5b Q4_1 Q4_1
reader-lm-1.5b Q4_1 Q4_1
TinyLlama-1.1B-Chat-v1.0 Q4_1 Q4_1
Yi-6B-Chat Q4_1 Q4_1
QwQ-32B-Preview Q4_1 Q4_1
Previous Next

© Copyright 2022, Alibaba Group.

Built with Sphinx using a theme provided by Read the Docs.