null | MYAIGC

Author

Published On

Sep 9, 2025

模块一：模型I/O (Models I/O) - 与LLM对话的基础

第三课时：文本的“灵魂”与“骨架”——嵌入模型与提示词模板

Part 1: 前言：从“能对话”到“善解人意”

在前两节课，我们学会了如何与LLM和Chat Models进行基础对话。这就像我们学会了用一门新语言说“你好”和“谢谢”。但要想进行真正有深度的交流，我们还需要两样东西：

让机器理解文字背后的“意义”，而不仅仅是字面符号。

用一种更结构化、更高效的方式“下达指令”，而不是每次都手忙脚乱地组织语言。今天，我们就来掌握这两个强大的工具：文本嵌入模型和提示词模板。它们将是我们构建高级AI应用的“左膀右臂”。

Part 2: 文本嵌入模型——捕捉文字的“灵魂”

2.1 什么是文本嵌入？为什么需要它？

想象一下，你有一个巨大的图书馆，里面有数百万本书，但没有任何分类和索引。如果你想找一本关于“人工智能”的书，你只能一本一本地翻，这几乎是不可能完成的任务。现在，想象一位神奇的图书管理员，他能把每一本书的内容都“理解”并转换成一个精确的坐标（比如 x: 0.8, y: 0.2, z: -0.5）。在这个坐标系中：

内容相似的书（比如“机器学习”和“深度学习”）的坐标会非常接近。

内容毫不相干的书（比如“人工智能”和“古代史”）的坐标会相距甚远。 文本嵌入做的就是这件事！ 它是一种将文本（单词、句子、段落）转换成一串数字（一个向量）的技术。这个向量就是文本在“语义空间”中的坐标。它捕捉了文本的核心语义。 为什么这如此重要？ 因为计算机不擅长理解文字，但极其擅长计算数字。一旦文本变成了向量，我们就可以用数学方法（比如计算距离）来衡量它们在意义上的相似度。这是未来实现智能搜索、问答、推荐等功能的基石。

2.2 常用Embedding模型与实战

和LLM一样，LangChain也为各种Embedding模型提供了统一的接口。 【实战：生成嵌入向量并计算相似度】 创建一个新文件 embedding_demo.py。

运行这个文件，你会清晰地看到：“国王”和“女王”的相似度远高于“国王”和“香蕉”。这就是嵌入模型的魔力——它量化了“意义”。

Part 3: 提示词模板——构建指令的“骨架”

3.1 为什么需要Prompt Template？

现在我们知道如何让机器理解“意义”了。但作为开发者，我们每天要写成百上千条指令。如果每次都用字符串拼接，代码会变得一团糟。 糟糕的例子：

提示词模板就是为了解决这个问题而生的。 它是一个预定义的、包含占位符的“指令骨架”。我们只需要往里面填充具体内容，就能快速生成结构化的提示词。 好处：

代码复用：一次定义，多次使用。

结构清晰：将指令逻辑与数据分离。

易于维护：修改提示词时，只需改动模板一处。

3.2 三种核心模板与实战

LangChain提供了几种强大的模板，让我们逐一攻破。 【实战：掌握三种核心模板】 创建一个新文件 template_demo.py。

看到了吗？`FewShotPromptTemplate` 自动将我们的示例和新的问题组合成了一个完美的提示词，让模型可以轻松“举一反三”。

总结与预告

今天，我们完成了模型I/O模块的最后两块拼图，我们的工具箱变得空前强大！

文本嵌入模型：让我们能捕捉文字的“灵魂”（语义），为未来的智能检索打下基础。

提示词模板：让我们能构建指令的“骨架”（结构），让代码更优雅、提示更高效。我们已经掌握了与LLM进行输入、输出、结构化对话、语义理解的全套本领。我们已经准备好，让LLM不再仅仅依赖它“脑子”里的知识。下一模块，我们将进入一个全新的、激动人心的领域：数据增强（RAG）！我们将学习如何给LLM连接一个“外部大脑”——让它能阅读你的私人文档、查询最新的网络信息，回答它原本无法回答的问题。这将是LangChain最核心、最实用的能力之一，你绝对不想错过！