Author
Published On
Sep 9, 2025
Category

模块一:模型I/O (Models I/O) - 与LLM对话的基础

第三课时:文本的“灵魂”与“骨架”——嵌入模型与提示词模板

Part 1: 前言:从“能对话”到“善解人意”

在前两节课,我们学会了如何与LLM和Chat Models进行基础对话。这就像我们学会了用一门新语言说“你好”和“谢谢”。 但要想进行真正有深度的交流,我们还需要两样东西:
  1. 让机器理解文字背后的“意义”,而不仅仅是字面符号。
  1. 用一种更结构化、更高效的方式“下达指令”,而不是每次都手忙脚乱地组织语言。 今天,我们就来掌握这两个强大的工具:文本嵌入模型提示词模板。它们将是我们构建高级AI应用的“左膀右臂”。

Part 2: 文本嵌入模型——捕捉文字的“灵魂”

2.1 什么是文本嵌入?为什么需要它?

想象一下,你有一个巨大的图书馆,里面有数百万本书,但没有任何分类和索引。如果你想找一本关于“人工智能”的书,你只能一本一本地翻,这几乎是不可能完成的任务。 现在,想象一位神奇的图书管理员,他能把每一本书的内容都“理解”并转换成一个精确的坐标(比如 x: 0.8, y: 0.2, z: -0.5)。在这个坐标系中:
  • 内容相似的书(比如“机器学习”和“深度学习”)的坐标会非常接近。
  • 内容毫不相干的书(比如“人工智能”和“古代史”)的坐标会相距甚远。 文本嵌入做的就是这件事! 它是一种将文本(单词、句子、段落)转换成一串数字(一个向量)的技术。这个向量就是文本在“语义空间”中的坐标。它捕捉了文本的核心语义为什么这如此重要? 因为计算机不擅长理解文字,但极其擅长计算数字。一旦文本变成了向量,我们就可以用数学方法(比如计算距离)来衡量它们在意义上的相似度。这是未来实现智能搜索、问答、推荐等功能的基石。

2.2 常用Embedding模型与实战

和LLM一样,LangChain也为各种Embedding模型提供了统一的接口。 【实战:生成嵌入向量并计算相似度】 创建一个新文件 embedding_demo.py

运行这个文件,你会清晰地看到:“国王”和“女王”的相似度远高于“国王”和“香蕉”。这就是嵌入模型的魔力——它量化了“意义”。

Part 3: 提示词模板——构建指令的“骨架”

3.1 为什么需要Prompt Template?

现在我们知道如何让机器理解“意义”了。但作为开发者,我们每天要写成百上千条指令。如果每次都用字符串拼接,代码会变得一团糟。 糟糕的例子:
提示词模板就是为了解决这个问题而生的。 它是一个预定义的、包含占位符的“指令骨架”。我们只需要往里面填充具体内容,就能快速生成结构化的提示词。 好处:
  • 代码复用:一次定义,多次使用。
  • 结构清晰:将指令逻辑与数据分离。
  • 易于维护:修改提示词时,只需改动模板一处。

3.2 三种核心模板与实战

LangChain提供了几种强大的模板,让我们逐一攻破。 【实战:掌握三种核心模板】 创建一个新文件 template_demo.py

看到了吗?FewShotPromptTemplate 自动将我们的示例和新的问题组合成了一个完美的提示词,让模型可以轻松“举一反三”。

总结与预告

今天,我们完成了模型I/O模块的最后两块拼图,我们的工具箱变得空前强大!
  • 文本嵌入模型:让我们能捕捉文字的“灵魂”(语义),为未来的智能检索打下基础。
  • 提示词模板:让我们能构建指令的“骨架”(结构),让代码更优雅、提示更高效。 我们已经掌握了与LLM进行输入、输出、结构化对话、语义理解的全套本领。我们已经准备好,让LLM不再仅仅依赖它“脑子”里的知识。 下一模块,我们将进入一个全新的、激动人心的领域:数据增强(RAG)!我们将学习如何给LLM连接一个“外部大脑”——让它能阅读你的私人文档、查询最新的网络信息,回答它原本无法回答的问题。这将是LangChain最核心、最实用的能力之一,你绝对不想错过!
 
Loading...
数字Baby
数字Baby
AIGC加速人类文明
公告
🎉Dify/n8n视频课程已经上线🎉
-- 感谢您的支持 ---
👏欢迎体验👏
🎉更多惊喜🎉
咨询微信:myaigcpro