分享
【端侧ChatGPT】MiniCPM3.0
输入“/”快速插入内容
【端侧ChatGPT】MiniCPM3.0
📖
GitHub:
https://github.com/OpenBMB/MiniCPM
HF:
https://huggingface.co/openbmb/MiniCPM3-4B
MiniCPM 3.0 是一个 4B 参数量的语言模型,相比 MiniCPM1.0/2.0,功能更加全面,综合能力大幅提升,多数评测集上的效果比肩甚至超越众多 7B-9B 模型。
•
支持工具调用🛠️(Function Calling)和代码解释器💻(Code Interpreter)
:
Berkeley Function Calling Leaderboard (BFCL)
上取得 9B 规模以下 SOTA,超越 GLM-4-9B-Chat、Qwen2-7B-Instruct。
•
超强的推理能力🧮
:数学能力方面,
MathBench
上的效果超越 GPT-3.5-Turbo 以及多个 7B-9B 模型。在非常具有挑战性的
LiveCodeBench
上,效果超越 Llama3.1-8B-Instruct。
•
出色的中英文指令遵循能力🤖
:英文指令遵循
IFEval
、中文指令遵循
FollowBench-zh
效果超越 GLM-4-9B-Chat、Qwen2-7B-Instruct。
•
长文本能力
:原生支持 32k 上下文长度,32k 长度内大海捞针全绿。提出
LLM x MapReduce
,理论可处理的上下文长度达到 +∞。
•
RAG能力
:我们发布了
MiniCPM RAG 套件
。基于 MiniCPM 系列模型的
MiniCPM-Embedding
、
MiniCPM-Reranker
在中文、中英跨语言检索测试中取得 SOTA 表现;针对 RAG 场景的
MiniCPM3-RAG-LoRA
在开放域问答等多项任务上超越 Llama3-8B、Baichuan2-13B 等模型。