Files
notes/resource/ai/大模型安装笔记/LLM 三件套.md
T
Docker7530 e4a339bd77 1774597379
2026-03-27 15:43:03 +08:00

2.8 KiB
Raw Blame History

1. Hugging Face 上的这些文件是什么?

👉 通俗比喻:这位天才大厨的“记忆、秘方和大脑说明书”

如果你点开 DeepSeek-R1-Distill-Qwen-7B 的网页,你会看到很多文件。这些文件加在一起,就是一个已经培训好的“数字大脑”(也就是模型本身)。

主要分为三类文件:

  • .safetensors 文件(大厨的烹饪经验/肌肉记忆):这是模型体积最大、最重要的文件,专业名词叫“权重(Weights)”。你可以把它理解为大厨脑子里记住的成千上万种调料的比例。它是 DeepSeek 团队花了海量数据和算力“训练”出来的精华。
  • config.json(大脑的生理结构/图纸):告诉电脑这个模型有几层神经网络、多大尺寸。就像是说明大厨的大脑神经元是怎么连接的。
  • tokenizer.json 等(翻译官/点菜单):AI 是不懂人类语言的,它只懂数字。Tokenizer 的作用就是把你打字的中文/英文,翻译成 AI 能看懂的数字编号(专业叫 Token)。就像餐厅前台的翻译,把你点的“宫保鸡丁”翻译成后厨看得懂的“菜品代码 1045”。

2. PyTorch 是什么?

👉 通俗比喻:打造这间厨房的基础设施(锅碗瓢盆、水电气)

PyTorch 是由 MetaFacebook)开发的一个深度学习基础框架

  • 在 AI 界的作用:AI 模型的计算全是极其复杂的矩阵数学题。如果没有 PyTorch,程序员需要自己从零开始写底层的数学公式,还要教电脑怎么控制显卡(GPU)去算。PyTorch 直接提供了一套“造物主工具箱”。
  • 回到比喻:PyTorch 就像是厨房里的燃气灶、平底锅、水电系统和物理定律。不管你是要做中餐(DeepSeek模型)、西餐(ChatGPT)还是烤肉(画图模型),你都得依赖这些基础工具才能把大厨的“秘方(模型文件)”变成一盘真正的菜。

3. vLLM 是什么?

👉 通俗比喻:一套极其高效的“麦当劳流水线管理系统”

vLLM 是一个专门用来加速大语言模型运行(推理)的引擎

  • 为什么需要它? 如果你只用 PyTorch 提供的基础锅碗瓢盆,大厨也能做菜,但他一次只能给一个客人做,做完一单再做下一单(速度慢,效率低)。而现实中,如果要把模型放到网上给成千上万人用,服务器会卡死。
  • vLLM 的作用:vLLM 就像引入了一套极致的流水线管理系统。它聪明地统筹安排:客人 A 和客人 B 都点了汉堡,它就让大厨一次性烤两块肉;它还能高效管理后厨的桌面空间(显存),不让食材堆得乱七八糟(这是 vLLM 的核心技术 PagedAttention)。用了 vLLM,大模型生成文字的速度会成倍飙升,能同时接待的客人也多得多。