LangChain入门教程大纲：从零开始构建你的第一个LLM应用 | MYAIGC

Author

Published On

Sep 1, 2025

Category

LangChain入门教程大纲：从零开始构建你的第一个LLM应用

课程目标：

理解LangChain的核心概念、架构和价值。

掌握LangChain核心模块（模型I/O、数据增强、记忆、Agent、回调）的使用方法。

能够独立使用LangChain构建简单的LLM应用，如问答机器人、文档总结工具等。

培养解决实际问题的思路，为进阶学习打下基础。 目标受众：

对大语言模型（LLM）感兴趣的开发者。

希望将LLM集成到实际项目中的产品经理、创业者。

具备Python基础，了解API调用者优先。

第一部分：开篇导学 (1-2课时)

课程介绍与学习路径

LangChain是什么？为什么需要它？（LLM的局限性，LangChain的桥梁作用）

本课程能学到什么？如何高效学习？

LangChain生态概览与版本说明

环境搭建与第一个LangChain应用

Python环境准备（虚拟环境）

安装LangChain及相关依赖（openai, chromadb等）

配置API密钥（OpenAI为例）

实战： 编写第一个LangChain程序 - 调用LLM说“Hello, LangChain!”

LangChain核心概念概览

Components（组件）与 Chains（链）

简要介绍六大核心模块：Models I/O, Data Connection, Memory, Agents, Chains, Callbacks（为后续学习铺垫）

第二部分：核心模块详解 (8-12课时)

模块一：模型I/O (Models I/O) - 与LLM对话的基础 (2课时)

LLM模型：与语言模型直接对话

什么是LLM？LangChain中的LLM抽象

常用LLM提供商接入（OpenAI, Hugging Face Hub, 本地模型等）

实战： 使用LLM进行文本生成、翻译、问答

Chat Models：对话模型的魅力

Chat Models与LLM的区别

消息类型：SystemMessage, HumanMessage, AIMessage

实战： 构建简单的多轮对话

文本嵌入模型 (Text Embedding Models)：文本的向量化表示

什么是文本嵌入？为什么需要它？

常用Embedding模型（OpenAI Embeddings, Hugging Face Embeddings）

实战： 生成文本嵌入向量，计算文本相似度

提示词模板 (Prompt Templates)：结构化你的输入

为什么需要Prompt Template？

PromptTemplate, ChatPromptTemplate, FewShotPromptTemplate

变量注入、格式化输出

实战： 使用Prompt Template优化问答效果，实现个性化提示

模块二：数据增强模块 (Data Augmentation / Retrieval Augmented Generation, RAG) - 让LLM拥有“外部知识” (3-4课时)

为什么需要数据增强？RAG简介

LLM知识的局限性（时效性、私有数据）

RAG（检索增强生成）原理与优势

文档加载 (Document Loaders)：从各种数据源读取

常用Loader：TextLoader, CSVLoader, PDFLoader, DirectoryLoader, WebBaseLoader

实战： 加载本地TXT/PDF文档，加载网页内容

文本分割器 (Text Splitters)：切分大文档

为什么需要分割？分割策略

常用Splitter：CharacterTextSplitter, RecursiveCharacterTextSplitter, TokenTextSplitter

实战： 对加载的长文档进行有效分割

向量存储 (Vector Stores)：存储与检索嵌入向量

什么是向量数据库？为什么需要它？

常用Vector Store：Chroma, FAISS, Pinecone (简介)

实战： 将分割后的文档嵌入并存储到Chroma/FAISS

检索器 (Retrievers)：获取相关文档

Retriever的概念与作用

基于向量存储的检索器

实战： 根据用户问题从向量存储中检索相关文档片段

完整的RAG链构建实战

组合：Retriever + Prompt Template + LLM

实战： 构建一个基于私有文档的问答机器人

模块三：记忆模块 (Memory) - 让LLM“记住”对话 (2课时)

为什么需要记忆？对话上下文管理

无状态LLM的挑战

Memory组件的作用

记忆组件的类型与选择

ConversationBufferMemory：最简单的缓冲记忆

ConversationBufferWindowMemory：固定窗口大小的记忆

ConversationSummaryMemory：对话摘要记忆

VectorStoreRetrieverMemory：基于向量检索的长期记忆

(可选) KnowledgeGraphMemory：知识图谱记忆

在Chain和Agent中集成记忆

实战： 为之前的问答机器人添加短期记忆，实现多轮问答连贯性

实战： 使用摘要记忆处理长对话

模块四：Agent模块 - 让LLM具备“思考和行动”能力 (3-4课时)

Agent是什么？让LLM具备思考和行动能力

Agent的核心思想：LLM作为“大脑”，工具作为“手脚”

Agent vs Chain：区别与联系

核心组件：Tools、Toolkits、Agent Executor

Tools： 定义LLM可以使用的工具（搜索、计算、API调用等）

内置Tools：搜索工具（Google Search, Wikipedia）、计算器等
实战： 创建自定义Tool（如查询天气、获取当前时间）

Toolkits： 工具集合

Agent Executor： Agent的执行引擎，驱动Agent思考和行动

Agent的类型与选择

ReAct Agent：推理-行动循环

Self Ask with Search Agent

OpenAI Functions Agent (针对支持Function Calling的模型)

(可选) Conversational Chat Agent

构建自定义Agent实战

实战： 构建一个能查询天气、计算简单表达式的Agent

实战： 构建一个能搜索网络信息并总结的Agent

模块五：回调处理 (Callbacks) - 监控、调试与扩展 (1课时)

为什么需要回调？监控与调试LangChain应用

Callbacks的作用：日志记录、性能监控、流式输出、自定义逻辑

内置回调处理器 (Built-in Callback Handlers)

StdOutCallbackHandler：控制台输出

FileCallbackHandler：输出到文件

LoggingCallbackHandler：集成Python logging

(可选) Tracing (LangSmith简介)

自定义回调处理器

继承BaseCallbackHandler

实战： 创建一个自定义回调，记录Token消耗或特定事件

在Chain、Agent、Tool中应用回调

实战： 为RAG链添加回调，监控检索和生成过程

第三部分：进阶与实战 (2-3课时)

链 (Chains) 的组合与自定义

SequentialChain：顺序执行多个链

RouterChain：根据条件路由到不同链

自定义Chain：继承Chain类

LangChain表达式语言 (LCEL) 简介

LCEL的优势：简洁、可组合、异步支持

使用LCEL重构之前的Chain

实战项目一：构建个人知识库问答机器人

需求分析：支持文档上传、智能问答、多轮对话

技术选型与架构设计

编码实现与调试

实战项目二：构建自动化任务Agent

需求分析：例如，自动收集特定主题信息并生成简报

工具设计与集成

Agent逻辑实现

LangChain生态与工具链概览

LangSmith：调试、监控、评估平台

LangServe：将LangChain链部署为API

其他相关工具和资源

第四部分：总结与展望 (1课时)

课程回顾与核心要点总结

LangChain最佳实践与常见问题

Prompt工程技巧

性能优化建议

错误处理与调试经验

LangChain未来发展与学习资源推荐

官方文档、GitHub、社区

进阶学习方向（多模态、更复杂的Agent架构等）

Q&A 与学习交流

教学特色：

代码驱动： 每个知识点都配合清晰、可运行的代码示例。

循序渐进： 从简单到复杂，逐步构建复杂应用。

强调实战： 多安排小型实战和最终的综合项目。

互动答疑： 鼓励学员提问，及时解决问题。

更新及时： LangChain迭代较快，注意教程内容的时效性。

Loading...

目录

0%

数字Baby

AIGC加速人类文明

最新发布

轻量逆袭：百度 PaddleOCR‑VL 0.9B 参数狂夺 OmniDocBench 最高分，秒杀 GPT‑4o！

颠覆语音大模型！LongCat‑Audio‑Codec 实现百毫秒超低延迟·极致压缩·高保真音频编解码全新方案

8K文档秒级解析神器！MinerU2.5仅1.2B参数轻松超越GPT‑4o！

Arm全新边缘AI平台Armv9免费开放！零成本“先试后买”，助创业公司极速打造本地智能芯片！

突破视觉极限！UniPixel首次实现像素级语言理解，AI秒抓图像细节，让机器真正“看懂”你的指令！

🔥全网首发！DiaMoE‑TTS仅几小时语料实现11大方言零样本合成，开源神器抢先体验！

公告

🎉Dify/n8n视频课程已经上线🎉

-- 感谢您的支持 ---

👏欢迎体验👏

🎉更多惊喜🎉

咨询微信:myaigcpro

目录

0%