- 📁 文档结构
- 📚 学习路线概览
- 📖 文档大纲速览
- 🎯 各文档详细介绍
- 🚀 如何开始学习
- 📚 推荐学习方式
- 📝 知识来源
- 📝 文档规范
欢迎来到AI学习路线!本文档是该系列的总览,帮助你了解完整的学习路径和各文档内容。
📁 文档结构
_posts/ailearn/
├── 2026-04-10-00-index.md # 本文档(总览索引)
├── 2026-04-10-01-ai-foundation.md # 第1篇:入门基础
├── 2026-04-10-02-machine-learning.md # 第2篇:机器学习
├── 2026-04-10-03-deep-learning.md # 第3篇:深度学习
├── 2026-04-10-04-nlp-basics.md # 第4篇:NLP基础
├── 2026-04-10-05-transformer-advanced.md # 第5篇:Transformer进阶
├── 2026-04-10-06-llm-application.md # 第6篇:大模型应用
├── 2026-04-10-07-rag-system.md # 第7篇:RAG系统
├── 2026-04-10-08-ai-tools.md # 第8篇:AI工具链
├── 2026-04-10-09-computer-vision.md # 第9篇:计算机视觉
├── 2026-04-10-10-multimodal-llm.md # 第10篇:多模态大模型
├── 2026-04-10-11-ai-agent.md # 第11篇:AI Agent
├── 2026-04-10-12-ai-project.md # 第12篇:项目实战
└── 2026-04-10-13-vibe-coding.md # 第13篇:Vibe Coding
📚 学习路线概览
本系列共 13篇文档,从零基础到实战应用,系统学习人工智能核心技术:
┌─────────────────────────────────────────────────────────────────────────────┐
│ AI学习路线 (共13篇) │
├─────────────────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 01 │ → │ 02 │ → │ 03 │ → │ 04 │ │
│ │ 入门基础 │ │ 机器学习 │ │ 深度学习 │ │ NLP基础 │ │
│ │ 数学+编程│ │ 算法原理 │ │ CNN/RNN │ │ 词向量 │ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ ↓ ↓ ↓ ↓ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 05 │ → │ 06 │ → │ 07 │ → │ 08 │ │
│ │Transf.进阶│ │ 大模型 │ │ RAG │ │ AI工具链│ │
│ │ 注意力机制│ │ 微调技术 │ │ 知识库 │ │ 开发环境│ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ ↓ ↓ ↓ ↓ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 09 │ → │ 10 │ → │ 11 │ → │ 12 │ │
│ │ 计算机视觉│ │ 多模态 │ │AI Agent │ │ 项目实战 │ │
│ │ 目标检测 │ │ 图文融合 │ │ 智能体 │ │ 完整应用 │ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ │
│ ┌─────────┐ │
│ │ 13 │ │
│ │Vibe Coding│ │
│ │ AI辅助编程│ │
│ └─────────┘ │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
📖 文档大纲速览
| 序号 | 文件 | 主题 | 核心内容 | 预计时间 |
|---|---|---|---|---|
| 01 | ai-foundation.md | 入门基础 | Python、NumPy/Pandas、线性代数、微积分 | 6-8周 |
| 02 | machine-learning.md | 机器学习 | 线性回归、决策树、随机森林、SVM、聚类、PCA | 4-6周 |
| 03 | deep-learning.md | 深度学习 | MLP、CNN、RNN/LSTM/GRU、PyTorch实战 | 6-8周 |
| 04 | nlp-basics.md | NLP基础 | 词向量、注意力机制、BERT、GPT、Hugging Face | 4-6周 |
| 05 | transformer-advanced.md | Transformer进阶 | 多头注意力、位置编码(RoPE)、完整实现 | 3-4周 |
| 06 | llm-application.md | 大模型应用 | Prompt工程、LoRA微调、量化推理、vLLM | 4-6周 |
| 07 | rag-system.md | RAG系统 | 向量数据库、LangChain、混合检索、重排序 | 4-5周 |
| 08 | ai-tools.md | AI工具链 | Conda/Docker、Git、Jupyter/Colab、MLflow | 1-2周 |
| 09 | computer-vision.md | 计算机视觉 | OpenCV、图像分类、YOLO、图像分割 | 4-6周 |
| 10 | multimodal-llm.md | 多模态大模型 | CLIP、LLaVA、Stable Diffusion、图文融合 | 3-4周 |
| 11 | ai-agent.md | AI Agent | Function Calling、ReAct、记忆系统、多Agent | 3-4周 |
| 12 | ai-project.md | 项目实战 | FastAPI、RAG服务、Vue前端、Docker部署 | 2-3周 |
| 13 | vibe-coding.md | Vibe Coding | Cursor、Copilot、AI编程最佳实践 | 1-2周 |
🎯 各文档详细介绍
第一阶段:基础知识 (01-02)
01 入门基础 - 数学与编程基础
适合人群:零基础入门者
主要内容:
- Python编程:语法基础、数据结构、面向对象编程
- 核心库:NumPy数组操作、Pandas数据处理、Matplotlib可视化
- 数学基础:
- 线性代数:向量、矩阵、特征值
- 微积分:导数、梯度、链式法则
- 概率统计:分布、贝叶斯、信息论
学习目标:建立扎实的数学与编程基础,能够进行数据处理和科学计算
前置要求:无
02 机器学习基础 - 从算法原理到实践
适合人群:有编程基础,想了解机器学习原理
主要内容:
- 监督学习:线性回归、逻辑回归、决策树、随机森林、SVM
- 无监督学习:K-Means聚类、层次聚类、PCA降维、DBSCAN
- 模型评估:准确率/召回率/F1、交叉验证、网格搜索
- 实战案例:完整分类流程代码
学习目标:理解常用机器学习算法原理,能够使用scikit-learn解决实际问题
前置要求:完成01入门基础
第二阶段:深度学习 (03-04)
03 深度学习基础 - 神经网络理论与实践
适合人群:有机器学习基础,想深入学习神经网络
主要内容:
- 神经网络基础:感知机、多层感知机、激活函数、损失函数
- 卷积神经网络CNN:卷积操作、池化层、LeNet、ResNet残差块
- 循环神经网络RNN:基本RNN、LSTM门控机制、GRU
- 训练技巧:正则化(Dropout/BatchNorm)、学习率调度、梯度裁剪
学习目标:理解深度学习核心架构,能够用PyTorch搭建和训练模型
前置要求:完成02机器学习基础
04 NLP基础 - 从词向量到Transformer
适合人群:有深度学习基础,想学习自然语言处理
主要内容:
- 文本表示:词袋模型、TF-IDF、Word2Vec、GloVe
- 注意力机制:自注意力计算、缩放点积
- Transformer架构:编码器/解码器结构
- 预训练模型:BERT原理与使用、GPT生成模型
- Hugging Face:Pipeline快速使用、模型加载
学习目标:理解NLP核心技术,能够使用预训练模型完成NLP任务
前置要求:完成03深度学习基础
第三阶段:大模型应用 (05-07)
05 Transformer进阶 - 深入理解注意力机制
适合人群:有NLP基础,想深入理解Transformer架构
主要内容:
- 注意力详解:缩放点积注意力的数学原理、为什么除以√d_k
- 多头注意力:为什么需要多头、完整实现代码
- 位置编码:正弦编码、可学习编码、旋转位置编码(RoPE)
- 归一化策略:LayerNorm、Pre-LN vs Post-LN
- 架构变体:Encoder-Only(BERT)、Decoder-Only(GPT)、Encoder-Decoder(T5)
学习目标:深入理解Transformer每个组件的设计原理,能够自己实现Transformer
前置要求:完成04 NLP基础
06 大模型应用 - 从Prompt工程到微调技术
适合人群:想应用大语言模型解决实际问题
主要内容:
- Prompt工程:角色设定、Few-shot、Chain of Thought
- API调用:OpenAI API使用、参数调优
- 高效微调:LoRA原理与实现、QLoRA量化微调
- 推理优化:模型量化(4-bit/8-bit)、vLLM加速、流式输出
- 应用开发:对话机器人、FastAPI服务搭建
学习目标:掌握大模型应用开发,能够进行Prompt设计和模型微调
前置要求:完成05 Transformer进阶
07 RAG系统 - 构建知识增强应用
适合人群:想构建能够利用外部知识的AI应用
主要内容:
- RAG原理:为什么需要RAG、工作流程
- 向量嵌入:Embedding模型选择、向量相似度计算
- 向量数据库:ChromaDB、FAISS、Milvus使用
- 文档处理:PDF/文本加载、切分策略
- 检索优化:混合检索、重排序(Reranking)
- LangChain实战:构建完整RAG应用
学习目标:能够构建完整的RAG应用,实现知识库问答系统
前置要求:完成06大模型应用
第四阶段:实践工具 (08)
08 AI工具链 - 开发环境与实践工具
适合人群:所有AI学习者
主要内容:
- 环境管理:Conda、Poetry、虚拟环境
- 开发工具:Jupyter Notebook、Google Colab(免费GPU)
- 版本控制:Git基础、Git LFS大文件管理
- 容器化:Docker、Docker Compose部署
- 实验管理:MLflow、TensorBoard、Weights & Biases
- 常用资源:Kaggle、Hugging Face、Papers with Code
学习目标:掌握AI开发必备工具,建立高效的开发工作流
前置要求:可随时学习,贯穿整个学习过程
第五阶段:前沿方向 (09-11)
09 计算机视觉基础 - 图像处理与目标检测
适合人群:对图像处理和视觉AI感兴趣
主要内容:
- OpenCV图像处理基础
- 图像分类与ResNet迁移学习
- 目标检测(YOLO使用与评估)
- 图像分割(语义分割、实例分割)
- 实战应用(人脸检测、OCR识别)
学习目标:掌握计算机视觉核心技术,能够开发视觉AI应用
前置要求:完成03深度学习基础
10 多模态大模型 - 图像与文本的融合
适合人群:想了解前沿多模态技术
主要内容:
- CLIP图文对齐原理与应用
- 视觉语言模型(LLaVA、Qwen-VL)
- GPT-4V API使用
- 图像生成(Stable Diffusion、ControlNet)
- 多模态应用实战
学习目标:掌握多模态模型技术,能够开发图文融合应用
前置要求:完成04 NLP基础、09计算机视觉
11 AI Agent智能体 - 自主决策与工具调用
适合人群:想构建自主AI系统
主要内容:
- Function Calling与工具调用
- Agent规划与执行(ReAct、Plan-and-Execute)
- 记忆系统设计
- 多Agent协作
- LangChain Agent开发
学习目标:掌握Agent技术,能够构建自主决策的AI系统
前置要求:完成06大模型应用
第六阶段:项目实战 (12)
12 AI项目实战 - 从零构建完整应用
适合人群:完成前11篇学习的同学
主要内容:
- 项目架构设计
- 文档处理服务实现
- RAG服务实现
- FastAPI接口开发
- 前端Vue组件
- Docker部署
学习目标:综合运用所学知识,构建完整的AI应用
前置要求:完成前11篇学习
第七阶段:AI辅助编程 (13)
13 Vibe Coding - AI辅助编程实践指南
适合人群:所有开发者,想提升编程效率
主要内容:
- Vibe Coding理念与方法论
- Cursor、Copilot、Claude Code工具使用
- AI辅助编程提示工程技巧
- 代码审查与安全检查
- 实战案例与最佳实践
学习目标:掌握AI辅助编程技术,显著提升开发效率
前置要求:有编程基础即可
🚀 如何开始学习
按基础选择起点
| 你的基础 | 建议起点 | 理由 |
|---|---|---|
| 零基础 | 01 入门基础 | 打好数学和编程基础 |
| 有编程基础 | 02 机器学习 | 跳过基础,直接学算法 |
| 有ML基础 | 03 深度学习 | 进入神经网络领域 |
| 想快速应用 | 06 大模型应用 | 快速上手大模型 |
按角色选择路径
| 目标角色 | 推荐路径 | 重点文档 |
|---|---|---|
| AI入门者 | 01 → 02 → 03 | 基础知识要扎实 |
| NLP工程师 | 01 → 02 → 03 → 04 → 05 | 专注NLP技术栈 |
| LLM应用开发者 | 04 → 05 → 06 → 07 | 大模型应用能力 |
| CV工程师 | 01 → 02 → 03 → 09 | 专注计算机视觉 |
| Agent开发者 | 04 → 05 → 06 → 11 | 智能体开发能力 |
| AI全栈工程师 | 全部13篇 | 全面掌握 |
学习时间规划
基础阶段 (01-02): 10-14周
深度学习 (03-04): 10-14周
大模型应用 (05-07): 11-15周
工具实践 (08): 持续使用
前沿方向 (09-11): 10-14周
项目实战 (12): 2-3周
总计: 约43-60周 (10-14个月)
📚 推荐学习方式
- 按顺序学习:文档由浅入深,建议按序号学习
- 动手实践:每个代码示例都可以运行,建议亲自尝试
- 完成项目:选择一个感兴趣的项目贯穿学习
- 关注来源:文档中标注了知识来源,建议阅读原文
- 社区交流:加入技术社区,参与讨论
📝 知识来源
本系列文档参考了以下权威资源:
官方文档
经典课程
- CS224N: NLP with Deep Learning - Stanford
- CS231n: CNN for Visual Recognition - Stanford
- Deep Learning Specialization - Andrew Ng
- 动手学深度学习 - 李沐
经典论文
- Attention Is All You Need - Transformer
- BERT - 预训练语言模型
- GPT-3 - 大语言模型
- LoRA - 高效微调
- RAG - 检索增强生成
技术博客
- The Illustrated Transformer - Jay Alammar
- Understanding LSTM Networks - Christopher Olah
- 3Blue1Brown - 数学可视化
📝 文档规范
本系列文档遵循以下规范:
- 文件命名:
YYYY-MM-DD-序号-主题.md - 标题格式:【AI学习路线 XX】主题名称
- 知识来源:重要知识点标注官方文档/论文来源
- 代码示例:所有代码均可运行
祝你学习顺利!
最后更新: 2026年4月10日