MacBook Pro M4 Pro私有化部署DeepSeek-R1

DeepSeek-R1 是 DeepSeek 的第一代推理模型，在数学、代码和推理任务中，其性能与 OpenAI-o1 相当（而OpenAI是闭源的），包括基于 Llama 和 Qwen 的六个从 DeepSeek-R1 蒸馏出的密集模型。

其中 671b 是教师模型（Teacher Model），另外的 6 个蒸馏模型为学生模型（Student Model）

蒸馏技术（Distillation）是一种模型压缩和优化的方法，主要用于将一个大型、复杂的模型的知识转移到一个较小的模型中。这个过程通常被称为“知识蒸馏”（Knowledge Distillation）

我们需要根据硬件的性能以及实际的需求来选择不同参数大小的模型：

ollama run deepseek-r1:1.5b
ollama run deepseek-r1:7b
ollama run deepseek-r1:8b
ollama run deepseek-r1:14b

没有配备专业级显卡的，推荐用14B以内的模型。

这个模型对硬件要求最低,适合基础任务如简单写作和快速对话。

硬件要求与7b模型相近:

这个模型适合更深入的推理、编码和研究任务。

ollama run deepseek-r1:32b
ollama run deepseek-r1:70b
ollama run deepseek-r1:671b

32b，70b，671b对机器的要求如下：

需要注意的是，对于671B模型：

总的来说，32B和70B模型可以在高端消费级硬件上运行，而671B模型则需要企业级或数据中心级的硬件配置。选择合适的硬件配置时，还需考虑具体的使用场景、性能需求和预算限制。

猫子的Mac配置如下：

由于M系列MacBook采用统一内存架构，这意味着CPU和GPU可以共享同一内存池。这种设计减少了数据在不同处理单元之间传输的需要，从而可以显著提高大型数据集处理的速度和效率。

所以，理论上我可以在本地跑DeepSeek-R1-Distill-Qwen-32B，一会儿我们来试试！

直接到官网下载即可。

Ollama 是一个便于本地部署和运行大型语言模型（Large Language Models, LLMs）的工具。使用通俗的语言来说，如果你想在自己的电脑上运行如 GPT-3 这样的大型人工智能模型，而不是通过互联网连接到它们，那么 Ollama 是一个实现这一目标的工具。

Ollama支持非常多的开源模型，比如：

Model	Parameters	Size	Download
DeepSeek-R1	7B	4.7GB	`ollama run deepseek-r1`
DeepSeek-R1	671B	404GB	`ollama run deepseek-r1:671b`
Llama 3.3	70B	43GB	`ollama run llama3.3`
Llama 3.2	3B	2.0GB	`ollama run llama3.2`
Llama 3.2	1B	1.3GB	`ollama run llama3.2:1b`
Llama 3.2 Vision	11B	7.9GB	`ollama run llama3.2-vision`
Llama 3.2 Vision	90B	55GB	`ollama run llama3.2-vision:90b`
Llama 3.1	8B	4.7GB	`ollama run llama3.1`
Llama 3.1	405B	231GB	`ollama run llama3.1:405b`
Phi 4	14B	9.1GB	`ollama run phi4`
Phi 3 Mini	3.8B	2.3GB	`ollama run phi3`
Gemma 2	2B	1.6GB	`ollama run gemma2:2b`
Gemma 2	9B	5.5GB	`ollama run gemma2`
Gemma 2	27B	16GB	`ollama run gemma2:27b`
Mistral	7B	4.1GB	`ollama run mistral`
Moondream 2	1.4B	829MB	`ollama run moondream`
Neural Chat	7B	4.1GB	`ollama run neural-chat`
Starling	7B	4.1GB	`ollama run starling-lm`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 Uncensored	7B	3.8GB	`ollama run llama2-uncensored`
LLaVA	7B	4.5GB	`ollama run llava`
Solar	10.7B	6.1GB	`ollama run solar`