想飞的鱼 Java Dev Engineer

AI学习路线 - 完整学习指南

2026-04-10

欢迎来到AI学习路线!本文档是该系列的总览,帮助你了解完整的学习路径和各文档内容。

📁 文档结构

_posts/ailearn/
├── 2026-04-10-00-index.md          # 本文档(总览索引)
├── 2026-04-10-01-ai-foundation.md   # 第1篇:入门基础
├── 2026-04-10-02-machine-learning.md # 第2篇:机器学习
├── 2026-04-10-03-deep-learning.md   # 第3篇:深度学习
├── 2026-04-10-04-nlp-basics.md      # 第4篇:NLP基础
├── 2026-04-10-05-transformer-advanced.md # 第5篇:Transformer进阶
├── 2026-04-10-06-llm-application.md # 第6篇:大模型应用
├── 2026-04-10-07-rag-system.md      # 第7篇:RAG系统
├── 2026-04-10-08-ai-tools.md        # 第8篇:AI工具链
├── 2026-04-10-09-computer-vision.md # 第9篇:计算机视觉
├── 2026-04-10-10-multimodal-llm.md  # 第10篇:多模态大模型
├── 2026-04-10-11-ai-agent.md        # 第11篇:AI Agent
├── 2026-04-10-12-ai-project.md      # 第12篇:项目实战
└── 2026-04-10-13-vibe-coding.md     # 第13篇:Vibe Coding

📚 学习路线概览

本系列共 13篇文档,从零基础到实战应用,系统学习人工智能核心技术:

┌─────────────────────────────────────────────────────────────────────────────┐
│                           AI学习路线 (共13篇)                                 │
├─────────────────────────────────────────────────────────────────────────────┤
│                                                                             │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐                    │
│   │  01     │ → │  02     │ → │  03     │ → │  04     │                    │
│   │ 入门基础 │   │ 机器学习 │   │ 深度学习 │   │ NLP基础 │                    │
│   │ 数学+编程│   │ 算法原理 │   │ CNN/RNN │   │ 词向量  │                    │
│   └─────────┘   └─────────┘   └─────────┘   └─────────┘                    │
│        ↓             ↓             ↓             ↓                          │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐                    │
│   │  05     │ → │  06     │ → │  07     │ → │  08     │                    │
│   │Transf.进阶│   │ 大模型  │   │  RAG   │   │ AI工具链│                    │
│   │ 注意力机制│   │ 微调技术 │   │ 知识库  │   │ 开发环境│                    │
│   └─────────┘   └─────────┘   └─────────┘   └─────────┘                    │
│        ↓             ↓             ↓             ↓                          │
│   ┌─────────┐   ┌─────────┐   ┌─────────┐   ┌─────────┐                    │
│   │  09     │ → │  10     │ → │  11     │ → │  12     │                    │
│   │ 计算机视觉│   │ 多模态  │   │AI Agent │   │ 项目实战 │                    │
│   │ 目标检测 │   │ 图文融合 │   │ 智能体  │   │ 完整应用 │                    │
│   └─────────┘   └─────────┘   └─────────┘   └─────────┘                    │
│                                                                             │
│   ┌─────────┐                                                               │
│   │  13     │                                                               │
│   │Vibe Coding│                                                             │
│   │ AI辅助编程│                                                              │
│   └─────────┘                                                               │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

📖 文档大纲速览

序号 文件 主题 核心内容 预计时间
01 ai-foundation.md 入门基础 Python、NumPy/Pandas、线性代数、微积分 6-8周
02 machine-learning.md 机器学习 线性回归、决策树、随机森林、SVM、聚类、PCA 4-6周
03 deep-learning.md 深度学习 MLP、CNN、RNN/LSTM/GRU、PyTorch实战 6-8周
04 nlp-basics.md NLP基础 词向量、注意力机制、BERT、GPT、Hugging Face 4-6周
05 transformer-advanced.md Transformer进阶 多头注意力、位置编码(RoPE)、完整实现 3-4周
06 llm-application.md 大模型应用 Prompt工程、LoRA微调、量化推理、vLLM 4-6周
07 rag-system.md RAG系统 向量数据库、LangChain、混合检索、重排序 4-5周
08 ai-tools.md AI工具链 Conda/Docker、Git、Jupyter/Colab、MLflow 1-2周
09 computer-vision.md 计算机视觉 OpenCV、图像分类、YOLO、图像分割 4-6周
10 multimodal-llm.md 多模态大模型 CLIP、LLaVA、Stable Diffusion、图文融合 3-4周
11 ai-agent.md AI Agent Function Calling、ReAct、记忆系统、多Agent 3-4周
12 ai-project.md 项目实战 FastAPI、RAG服务、Vue前端、Docker部署 2-3周
13 vibe-coding.md Vibe Coding Cursor、Copilot、AI编程最佳实践 1-2周

🎯 各文档详细介绍

第一阶段:基础知识 (01-02)

01 入门基础 - 数学与编程基础

适合人群:零基础入门者

主要内容

  • Python编程:语法基础、数据结构、面向对象编程
  • 核心库:NumPy数组操作、Pandas数据处理、Matplotlib可视化
  • 数学基础
    • 线性代数:向量、矩阵、特征值
    • 微积分:导数、梯度、链式法则
    • 概率统计:分布、贝叶斯、信息论

学习目标:建立扎实的数学与编程基础,能够进行数据处理和科学计算

前置要求:无


02 机器学习基础 - 从算法原理到实践

适合人群:有编程基础,想了解机器学习原理

主要内容

  • 监督学习:线性回归、逻辑回归、决策树、随机森林、SVM
  • 无监督学习:K-Means聚类、层次聚类、PCA降维、DBSCAN
  • 模型评估:准确率/召回率/F1、交叉验证、网格搜索
  • 实战案例:完整分类流程代码

学习目标:理解常用机器学习算法原理,能够使用scikit-learn解决实际问题

前置要求:完成01入门基础


第二阶段:深度学习 (03-04)

03 深度学习基础 - 神经网络理论与实践

适合人群:有机器学习基础,想深入学习神经网络

主要内容

  • 神经网络基础:感知机、多层感知机、激活函数、损失函数
  • 卷积神经网络CNN:卷积操作、池化层、LeNet、ResNet残差块
  • 循环神经网络RNN:基本RNN、LSTM门控机制、GRU
  • 训练技巧:正则化(Dropout/BatchNorm)、学习率调度、梯度裁剪

学习目标:理解深度学习核心架构,能够用PyTorch搭建和训练模型

前置要求:完成02机器学习基础


04 NLP基础 - 从词向量到Transformer

适合人群:有深度学习基础,想学习自然语言处理

主要内容

  • 文本表示:词袋模型、TF-IDF、Word2Vec、GloVe
  • 注意力机制:自注意力计算、缩放点积
  • Transformer架构:编码器/解码器结构
  • 预训练模型:BERT原理与使用、GPT生成模型
  • Hugging Face:Pipeline快速使用、模型加载

学习目标:理解NLP核心技术,能够使用预训练模型完成NLP任务

前置要求:完成03深度学习基础


第三阶段:大模型应用 (05-07)

05 Transformer进阶 - 深入理解注意力机制

适合人群:有NLP基础,想深入理解Transformer架构

主要内容

  • 注意力详解:缩放点积注意力的数学原理、为什么除以√d_k
  • 多头注意力:为什么需要多头、完整实现代码
  • 位置编码:正弦编码、可学习编码、旋转位置编码(RoPE)
  • 归一化策略:LayerNorm、Pre-LN vs Post-LN
  • 架构变体:Encoder-Only(BERT)、Decoder-Only(GPT)、Encoder-Decoder(T5)

学习目标:深入理解Transformer每个组件的设计原理,能够自己实现Transformer

前置要求:完成04 NLP基础


06 大模型应用 - 从Prompt工程到微调技术

适合人群:想应用大语言模型解决实际问题

主要内容

  • Prompt工程:角色设定、Few-shot、Chain of Thought
  • API调用:OpenAI API使用、参数调优
  • 高效微调:LoRA原理与实现、QLoRA量化微调
  • 推理优化:模型量化(4-bit/8-bit)、vLLM加速、流式输出
  • 应用开发:对话机器人、FastAPI服务搭建

学习目标:掌握大模型应用开发,能够进行Prompt设计和模型微调

前置要求:完成05 Transformer进阶


07 RAG系统 - 构建知识增强应用

适合人群:想构建能够利用外部知识的AI应用

主要内容

  • RAG原理:为什么需要RAG、工作流程
  • 向量嵌入:Embedding模型选择、向量相似度计算
  • 向量数据库:ChromaDB、FAISS、Milvus使用
  • 文档处理:PDF/文本加载、切分策略
  • 检索优化:混合检索、重排序(Reranking)
  • LangChain实战:构建完整RAG应用

学习目标:能够构建完整的RAG应用,实现知识库问答系统

前置要求:完成06大模型应用


第四阶段:实践工具 (08)

08 AI工具链 - 开发环境与实践工具

适合人群:所有AI学习者

主要内容

  • 环境管理:Conda、Poetry、虚拟环境
  • 开发工具:Jupyter Notebook、Google Colab(免费GPU)
  • 版本控制:Git基础、Git LFS大文件管理
  • 容器化:Docker、Docker Compose部署
  • 实验管理:MLflow、TensorBoard、Weights & Biases
  • 常用资源:Kaggle、Hugging Face、Papers with Code

学习目标:掌握AI开发必备工具,建立高效的开发工作流

前置要求:可随时学习,贯穿整个学习过程


第五阶段:前沿方向 (09-11)

09 计算机视觉基础 - 图像处理与目标检测

适合人群:对图像处理和视觉AI感兴趣

主要内容

  • OpenCV图像处理基础
  • 图像分类与ResNet迁移学习
  • 目标检测(YOLO使用与评估)
  • 图像分割(语义分割、实例分割)
  • 实战应用(人脸检测、OCR识别)

学习目标:掌握计算机视觉核心技术,能够开发视觉AI应用

前置要求:完成03深度学习基础


10 多模态大模型 - 图像与文本的融合

适合人群:想了解前沿多模态技术

主要内容

  • CLIP图文对齐原理与应用
  • 视觉语言模型(LLaVA、Qwen-VL)
  • GPT-4V API使用
  • 图像生成(Stable Diffusion、ControlNet)
  • 多模态应用实战

学习目标:掌握多模态模型技术,能够开发图文融合应用

前置要求:完成04 NLP基础、09计算机视觉


11 AI Agent智能体 - 自主决策与工具调用

适合人群:想构建自主AI系统

主要内容

  • Function Calling与工具调用
  • Agent规划与执行(ReAct、Plan-and-Execute)
  • 记忆系统设计
  • 多Agent协作
  • LangChain Agent开发

学习目标:掌握Agent技术,能够构建自主决策的AI系统

前置要求:完成06大模型应用


第六阶段:项目实战 (12)

12 AI项目实战 - 从零构建完整应用

适合人群:完成前11篇学习的同学

主要内容

  • 项目架构设计
  • 文档处理服务实现
  • RAG服务实现
  • FastAPI接口开发
  • 前端Vue组件
  • Docker部署

学习目标:综合运用所学知识,构建完整的AI应用

前置要求:完成前11篇学习


第七阶段:AI辅助编程 (13)

13 Vibe Coding - AI辅助编程实践指南

适合人群:所有开发者,想提升编程效率

主要内容

  • Vibe Coding理念与方法论
  • Cursor、Copilot、Claude Code工具使用
  • AI辅助编程提示工程技巧
  • 代码审查与安全检查
  • 实战案例与最佳实践

学习目标:掌握AI辅助编程技术,显著提升开发效率

前置要求:有编程基础即可


🚀 如何开始学习

按基础选择起点

你的基础 建议起点 理由
零基础 01 入门基础 打好数学和编程基础
有编程基础 02 机器学习 跳过基础,直接学算法
有ML基础 03 深度学习 进入神经网络领域
想快速应用 06 大模型应用 快速上手大模型

按角色选择路径

目标角色 推荐路径 重点文档
AI入门者 01 → 02 → 03 基础知识要扎实
NLP工程师 01 → 02 → 03 → 04 → 05 专注NLP技术栈
LLM应用开发者 04 → 05 → 06 → 07 大模型应用能力
CV工程师 01 → 02 → 03 → 09 专注计算机视觉
Agent开发者 04 → 05 → 06 → 11 智能体开发能力
AI全栈工程师 全部13篇 全面掌握

学习时间规划

基础阶段 (01-02): 10-14周
深度学习 (03-04): 10-14周
大模型应用 (05-07): 11-15周
工具实践 (08): 持续使用
前沿方向 (09-11): 10-14周
项目实战 (12): 2-3周

总计: 约43-60周 (10-14个月)

📚 推荐学习方式

  1. 按顺序学习:文档由浅入深,建议按序号学习
  2. 动手实践:每个代码示例都可以运行,建议亲自尝试
  3. 完成项目:选择一个感兴趣的项目贯穿学习
  4. 关注来源:文档中标注了知识来源,建议阅读原文
  5. 社区交流:加入技术社区,参与讨论

📝 知识来源

本系列文档参考了以下权威资源:

官方文档

经典课程

经典论文

技术博客


📝 文档规范

本系列文档遵循以下规范:

  • 文件命名YYYY-MM-DD-序号-主题.md
  • 标题格式:【AI学习路线 XX】主题名称
  • 知识来源:重要知识点标注官方文档/论文来源
  • 代码示例:所有代码均可运行

祝你学习顺利!

最后更新: 2026年4月10日


Similar Posts

Comments