Deepseek从入门到精通
清华大学余梦珑博士后团队精心撰写的一份Deepseek专业文档

happy-llm 是 Datawhale 团队推出的一个系统性的大语言模型 (LLM) 学习教程。该项目旨在帮助学习者深入理解 LLM 的核心原理与训练过程,从 NLP 基础概念出发,逐步剖析 Transformer 架构、预训练语言模型原理,直至大模型的定义、训练策略与涌现能力。其核心目标是为读者构建坚实的理论基础,清晰梳理 LLM 的技术脉络与发展。
项目显著特色在于强调动手实践,包含动手实现一个完整的 LLaMA2 模型(第5章)以及掌握从预训练到微调(包括LoRA/QLoRA)的全流程训练实践(第6章)。此外,还涵盖模型评测、RAG(检索增强生成)和 Agent(智能体)等前沿应用技术(第7章)。作为免费开源项目,它非常适合具备一定编程和深度学习基础的大学生、研究人员及 LLM 爱好者,通过理论与实践结合,真正掌握大模型开发。