模型 | 设备 | 资源 | 操作系统 | 推理支持 | 速度 | 简介 |
MiniCPM- V 2.6 | GPU | 17G | Linux | vllm transformers | vllm比较快 | 最新版本,提供最佳的端侧单图、多图、视频理解能力。 |
MiniCPM- V 2.6 gguf | CPU | 6G | Mac linux | Llamacpp ollama | cpu速度较慢 | gguf 版本,更低的内存占用和更高的推理效率。 |
MiniCPM- V 2.6 int4 (bnb量化) | GPU | 7G | linux | transformers | transformer上 速度低于非量化版本 | bnb int4量化版,更低显存占用。 |
MiniCPM-V 2.6 int4 (awq量化) | GPU | 7G | linux | vllm transformers | 支持vllm速度很快,transformer上速度和bnb量化差不多,比非量化版慢 | awq int4量化版,vllm速度最快,目前已经制作好,pr中,敬请期待 |