Curated Open-Source Guide

从零学习
大模型 & AI Agent

GitHub 高质量开源项目完全指南 —— 系统梳理从入门到生产的每一个关键项目

更新于 2026-05-10 · Star 数据源自 GitHub API

第一部分:从零学习搭建大模型

1.1 入门级:理解核心原理

Andrej Karpathy Python 入门

一个微型的标量值自动求导引擎,以及基于它构建的微型神经网络库。整个项目的核心代码不到 200 行,是理解反向传播和自动微分的最佳起点。

为什么推荐:Karpathy 的代码以极致简洁著称。读完 micrograd,你会彻底理解「训练神经网络」到底在做什么——前向传播计算输出,反向传播计算梯度,梯度下降更新参数。这三个概念是所有深度学习(包括 LLM)的基石。
Andrej Karpathy Python 初级

Karpathy 著名的 4 小时 YouTube 课程「Let's Build GPT from Scratch」的配套代码。从零开始逐行编写 GPT 模型,最终生成类似莎士比亚风格的文本。

为什么推荐:目前互联网上最受欢迎的「从零写 GPT」教程。Karpathy 会解释每一步的设计动机,而不是简单地让你抄代码。配合视频食用效果最佳。
Andrej Karpathy Python 初级

「最简单、最快速的 GPT 训练/微调仓库」。nanoGPT 是 build-nanogpt 的工程化版本,代码结构清晰,核心约 300 行,覆盖数据加载、模型定义、训练循环、评估、推理全流程。

为什么推荐:nanoGPT 是学习 LLM 训练的黄金标准入口。很多后续项目(minimind 等)都受其启发。你可以在自己的 GPU 上训练一个能生成合理文本的小型 GPT。
jingyaogong Python 中文友好 初级

「2 小时从 0 训练 64M 参数的小 LLM」——中文社区最受欢迎的 LLM 入门项目。极简实现 Pretraining → SFT → DPO/RLHF 的完整流程,可在消费级 GPU 上跑通。

为什么推荐:中文用户学习 LLM 的最佳入口。文档全中文,代码注释详尽,数据处理针对中文语料优化。在 Colab 免费版上即可跑完全流程,真正建立起「训练大模型」的体感。
KellerJordan Python 中级

nanoGPT 的魔改加速版——124M 参数的 GPT 只需 90 秒完成训练(8×H100),展示现代 LLM 训练中各种加速技巧的极致应用。

为什么推荐:当你理解了基础版本后,这个项目告诉你「如何让训练快 100 倍」。引入混合精度训练、Flash Attention、Fused AdamW、torch.compile 等现代技巧,是「从玩具到工业级」的关键桥梁。

1.2 进阶级:动手实践

Sebastian Raschka Jupyter Notebook 中级

GitHub 上最受欢迎的 LLM 学习项目,配套 O'Reilly 畅销书。通过精心设计的 Jupyter Notebook 逐步实现 GPT 类模型的每一个组件。7 章覆盖:LLM 概述 → 文本处理 → Attention 机制 → GPT 实现 → 预训练 → 微调 → RLHF。

为什么推荐:这是目前最系统、最完整的「从零学 LLM」资源。Raschka 是顶级 AI 教育者,讲解严谨而不失可读。有中文翻译版(见下方 datawhalechina 项目)。
Datawhale Jupyter Notebook 中文 中级

Raschka《Build an LLM from Scratch》的中文社区翻译版,由国内知名开源学习社区 Datawhale 维护。补充了大量中文语境下的注释和扩展材料。

为什么推荐:中文读者的不二之选。Datawhale 是国内最好的 AI 开源学习社区之一,翻译质量有保障,社群活跃,遇到问题可以及时交流。
Lightning AI Python 中高级

20+ 高性能 LLM 实现 + 预训练/微调/部署配方。工业级 LLM 训练框架,支持 Llama 2/3、Mistral、Gemma、Falcon、Phi 等几乎所有主流开源模型。

为什么推荐:从「玩具级别」进入「实战级别」的最佳选择。在真实模型架构上实验,同时保持代码可读性。支持 LoRA、QLoRA、全参数微调、量化部署等完整功能。
George Hotz (geohot) Python 中高级

从零实现的深度学习框架,在极简代码量下实现完整的神经网络训练和推理。介于 PyTorch 和 micrograd 之间——比 PyTorch 简单得多,但比 micrograd 强大得多。

为什么推荐:tinygrad 让你理解「PyTorch 底层到底在做什么」。通过阅读源码深入理解张量运算、计算图构建优化、算子融合、多后端支持、JIT 编译等框架核心概念。
hyunwoongko Python 中级

纯 PyTorch 实现的 Transformer——「Attention Is All You Need」论文的最简洁复现。代码极其干净,注释详尽。

为什么推荐:在深入 GPT 类 Decoder-only 架构之前,理解完整的 Encoder-Decoder Transformer 非常重要。这个项目帮你建立对 Transformer 的完整认知。

1.3 高级 / 生产级:训练与微调

hiyouga Python ACL 2024 中级

LLM 微调的终极框架——支持 100+ 种模型的统一高效微调,提供 Web UI 操作界面。当前最流行的 LLM 微调工具,已被大量学术论文和企业项目采用。

为什么推荐:将 LLM 微调的门槛降到最低。Web UI 中配置参数即可完成微调,同时支持命令行精细化控制。支持 Full Fine-tuning、Freeze、LoRA、QLoRA、增量预训练、指令微调、RLHF/DPO 全流程。
Unsloth AI Python 中级

微调加速 2-5 倍,显存减半——通过手写 CUDA 内核和 Triton 算子大幅优化 LoRA/QLoRA 微调的速度和显存占用。与 HuggingFace 生态完全兼容,改 2 行代码即可加速。

为什么推荐:如果只有一张消费级显卡(RTX 3090/4090),Unsloth 让你能微调原本跑不动的模型。内置 250+ 微调 Notebook 示例,开箱即用。

1.4 推理与部署

GGML Org C/C++ 中高级

纯 C/C++ LLM 推理引擎,无需任何 Python 依赖。Ollama、LM Studio 等热门工具都基于它构建。包含模型量化(2-bit 到 8-bit)、KV Cache 管理、内存优化等核心实践。

为什么推荐:阅读源码是理解「LLM 推理底层」的最佳方式。包含 GGUF 格式、KV Cache、自回归推理流程、CPU 高性能矩阵运算等核心概念。
ollama/ollama 171,100+
Ollama Go 使用简单

「Docker for LLMs」——一条命令在本地运行各种开源大模型。封装了 llama.cpp 的复杂性,提供友好的 CLI 和 REST API。

为什么推荐:作为学习者,需要方便的方式实验不同模型。Ollama 让你轻松在本地试玩 Llama、Qwen、DeepSeek、Mistral 等模型,快速建立对模型能力和差异的认知。

1.5 推荐学习路径

大模型学习路径(8 周)

micrograd build-nanogpt nanoGPT minimind LLMs-from-scratch litgpt LlamaFactory llama.cpp

第1-2周:理解反向传播 + GPT 架构  |  第3-4周:完整训练流程实操  |  第5-6周:系统化深入学习  |  第7-8周:工业级实践  |  持续:推理底层

第二部分:学习搭建 AI Agent

2.1 入门级:理解 Agent 概念

Agent 的本质 = LLM + 工具调用 + 记忆 + 规划
HuggingFace Python 入门

HuggingFace 官方免费 AI Agent 课程。从基本概念到 Tool Use、Memory、Planning、Multi-Agent 等核心主题。理论清晰,代码可直接运行。

为什么推荐:学习 Agent 的最佳起点。HuggingFace 课程质量极高,且完全免费。6 章覆盖 Agent 全部核心概念。
HuggingFace Python 入门

「极简 Agent 库——agents that think in code」。核心理念是让 Agent 通过写代码来执行动作,而非 JSON 格式的 function call。代码量极低但功能完整。

为什么推荐:一个下午就能通读全部源码,彻底理解 Agent 内部如何工作。Code Agent 的设计理念让你用代码而非 JSON 表达动作,更直观。
Nir Diamant Python 入门

50+ 生成式 AI Agent 教程和完整实现——从最简单的对话机器人到复杂的多 Agent 协作系统,每个案例都有完整代码。

为什么推荐:练习 Agent 开发的「最佳习题集」。涵盖基础聊天 Agent、RAG Agent、Tool Use Agent、Planning Agent、Reflection Agent、Multi-Agent Collaboration 等全部模式。

2.2 进阶级:主流框架

LangChain AI TypeScript / Python 中级

Agent 开发的事实标准——最流行的 LLM 应用开发框架,拥有最丰富的生态:200+ 集成、海量教程和模板、活跃的社区。

为什么推荐:市场上大量 Agent 应用都用 LangChain 构建,学会它意味着你能理解和修改大量现有项目。建议先学 Agent 和 Tools 部分,理解核心概念后再深入。
LangChain AI TypeScript / Python 中高级

「用图来构建可控的 Agent」——将 Agent 决策流程建模为状态图(StateGraph),节点代表动作,边代表状态转移。比传统 ReAct Loop 更灵活、更可控。

为什么推荐:目前最值得深入学习的 Agent 框架。图结构天然适合表达复杂多步骤 Agent 逻辑,支持分支、循环、条件路由、人工审批、检查点恢复等高级控制流。
OpenAI Python 中级

OpenAI 官方 Agent SDK——轻量级但功能强大的多 Agent 工作流框架。Agent = instructions + tools + handoffs,设计理念清晰。

为什么推荐:最「官方」的 Agent 实现方式,代码质量极高。如果你的应用主要使用 OpenAI 模型,这是最佳选择。Handoff、Guardrails、Tracing 等特性开箱即用。
CrewAI Python 中级

「角色扮演式多 Agent 协作框架」——定义 Agent 的角色(Role)、目标(Goal)、背景故事(Backstory),让多个 Agent 像团队一样协作完成复杂任务。

为什么推荐:理念非常直观——像组建人类团队一样组建 Agent 团队。特别适合构建需要多视角、多步骤的复杂任务,如内容创作(研究员→写手→审核)。
Significant Gravitas Python 中高级

自主 Agent 鼻祖——2023 年引爆 AI Agent 热潮的项目,GitHub 历史上增长最快的开源项目之一。让 LLM 在「设定目标 → 制定计划 → 执行 → 评估 → 调整」的循环中自主运作。

为什么推荐:作为学习 Agent 架构设计的项目非常有价值。完整实现了自主 Agent 的所有核心组件:规划器、执行器、记忆系统、工具管理、反馈循环。

2.3 高级 / 生产级:企业级应用

langgenius/dify 140,800+
LangGenius TypeScript / Python 使用简单 · 二次开发高级

当前最火的 AI Agent 工作流平台——可视化拖拽编排 LLM、知识库、工具、API,构建复杂 Agent 应用。非技术用户的首选、开发者的原型利器。

为什么推荐:无需深入代码即可搭建功能完整的 Agent 应用。可视化工作流、知识库(RAG)、工具集成、API 发布、100+ 模型支持——是理解「生产级 Agent 系统由哪些组件构成」的最佳案例。
ByteDance 字节跳动 TypeScript 高级

字节跳动开源的「长周期 SuperAgent」框架——处理需数分钟到数小时的复杂任务。配备规划工具、沙箱执行、记忆系统、子 Agent 生成等生产级能力。

为什么推荐:目前最接近真实生产级 Agent 系统的开源项目。代表了大型科技公司对 Agent 的技术理解。适合有经验、想了解「真正的 SuperAgent 是如何设计的」的开发者。
Pydantic Team Python 中级

「Pydantic 风格的 Agent 框架」——以类型安全为核心设计理念,利用 Pydantic 的数据验证和序列化能力,构建结构化、可测试、可维护的 Agent 应用。

为什么推荐:后端开发者的最爱。用类型系统约束 Agent 输入输出,让 Agent 行为可预测、可测试。代码质量极高,是学习「如何优雅地构建 Agent 框架」的绝佳案例。

2.4 综合资源合集

AI Agent 领域最大的资源合集,涵盖框架、工具、平台、论文、教程等各类资源,持续更新。

2026 年最新 Agent 资源合集,300+ 资源、20+ 类别、每月更新。

主流 Agent 框架实战对比,从基础到生产级,帮你选择最合适的框架。

中文 Agent 开发完全指南,LangGraph 实战 + 高级 RAG + 面试题库。

2.5 推荐学习路径

Agent 学习路径(8 周)

agents-course smolagents GenAI_Agents langgraph crewAI deepagents dify

第1-2周:建立理论基础  |  第3-4周:源码理解 + 动手实践  |  第5-6周:掌握图状态机 Agent  |  第7-8周:多 Agent 协作 + 生产部署  |  持续:SuperAgent 架构

第三部分:综合建议

两条路同时走的综合学习计划

Phase 1:快速建立全局认知(2 周)
周次LLM 方向Agent 方向
第 1 周micrograd → build-nanogpt 视频HuggingFace Agents Course(第 1-3 章)
第 2 周nanoGPT 代码精读 + 本地训练HuggingFace Agents Course(第 4-6 章)

目标:理解 LLM 核心原理(Attention + Transformer),同时建立 Agent 全局认知。

Phase 2:动手实践加深理解(3 周)
周次LLM 方向Agent 方向
第 3 周minimind 完整流程(预训练→SFT→DPO)smolagents 源码精读
第 4 周LLMs-from-scratch(第 1-4 章)GenAI_Agents(选 5-10 个案例实践)
第 5 周LLMs-from-scratch(第 5-7 章)LangGraph 入门(构建第一个 Graph Agent)

目标:跑通 LLM 训练全流程,能独立构建简单 Agent 系统。

Phase 3:工业级进阶(3 周)
周次LLM 方向Agent 方向
第 6 周litgpt 深入研究多模型架构LangGraph 进阶(Subgraphs + Checkpointing)
第 7 周LlamaFactory + Unsloth 微调实战crewAI 多 Agent 协作
第 8 周用微调好的模型 + Ollama 部署Dify 搭建完整 Agent 应用(接入自己的模型)

目标:拥有自己微调的模型,并搭建接入自己模型的 Agent 应用。

Phase 4:持续深造

硬件建议

学习阶段最低配置推荐配置
micrograd / nanoGPTCPU 即可任意 GPU
minimind(64M)Google Colab 免费版(T4)RTX 3060+
LLMs-from-scratchGoogle Colab 免费版RTX 3060+
LlamaFactory 微调(7B+LoRA)RTX 3090/4090 24GBA100 40GB
Agent 框架学习CPU 即可(调用 API)任意配置

省钱技巧:LLM 训练可用 Google Colab(免费 T4 GPU)或 AutoDL(国内便宜租 GPU);Agent 框架学习完全不需要 GPU(调用云端 API 即可)。

核心原则

  1. 先理解原理,再追求规模——用 nanoGPT / minimind 理解 100M 参数模型的每一个细节,比直接跑 7B 模型收益大得多
  2. 先调 API,再训模型——Agent 学习用 API 即可,不要上来就想微调模型做 Agent(那是两个独立的复杂问题)
  3. 读源码比读文档更重要——这些精选项目都以代码简洁著称,每个都值得花时间精读源码
  4. 记录学习笔记——建议 fork 这些项目并在上面写注释,把理解沉淀下来
1,300,000+
本文档涵盖项目的 GitHub Stars 总和

Tweaks