7. 记忆（Memory）机制：让AI拥有“短期记忆”与“长期记忆”

引言：当AI学会"记住你"

2025年某银行智能客服因无法记住用户身份，每次对话都要求重复验证，引发大量投诉。引入LangChain 记忆系统后，客户满意度提升62%。本文将基于MemorySaver与FAISS本地存储，教你构建符合最新标准的记忆系统。

一、新版记忆架构核心变化

1.1 记忆存储方案对比（LangChain 0.3+）

组件	适用场景	关键特性
MemorySaver	短期会话状态	自动序列化，支持JSON/二进制
FAISS	长期知识存储	本地化部署，毫秒级检索
PostgreSQL	企业级记忆管理	事务支持，高可用

1.2 新旧API迁移指南

# 旧版（已废弃）
# from langgraph.checkpoint import FileCheckpointer

# 新版（推荐）
from langgraph.checkpoint.memory import MemorySaver
from langchain_community.vectorstores import FAISS

二、构建新一代记忆系统

2.1 短期记忆

from langchain_core.messages import SystemMessage, HumanMessage
from langchain_ollama import ChatOllama
from langgraph.checkpoint.memory import MemorySaver
from langgraph.graph import START, MessagesState, StateGraph


llm = ChatOllama(model="deepseek-r1")

workflow = StateGraph(state_schema=MessagesState)


# 定义模型调用函数
def call_model(state: MessagesState):
    system_prompt = (
        "你是一个有礼貌的助手. "
        "回答尽可能多的细节."
    )
    messages = [SystemMessage(content=system_prompt)] + state["messages"]
    response = llm.invoke(messages)
    return {"messages": response}


# 定义节点和边
workflow.add_node("model", call_model)
workflow.add_edge(START, "model")

# 添加简单的内存检查点
memory = MemorySaver()
app = workflow.compile(checkpointer=memory)

response = app.invoke(
    {"messages": [HumanMessage(content="你是谁？")]},
    config={"configurable": {"thread_id": "1"}},
)
print(response)
response = app.invoke(
    {"messages": [HumanMessage(content="我刚才问你什么了?")]},
    config={"configurable": {"thread_id": "1"}},
)
print(response)

输出为：

{'messages': [HumanMessage(content='你是谁？', additional_kwargs={}, response_metadata={}, id='03ed2cbb-59df-42c2-b865-bcd177e30833'), AIMessage(content='<think>\n好，我需要回答用户的问题：“你是谁？” 用户希望得到详细的回应，并且我应该以礼貌的方式呈现。\n\n首先，我要确认自己的身份是DeepSeek-R1-Lite-Preview。这表明我是由深度求索公司开发的智能助手。接下来，我需要解释我的功能和用途：通过算法处理信息并生成回答，帮助用户解决问题或提供信息。\n\n然后，强调我没有个人意识或情感，只是一个工具，以确保用户的期望与实际功能相符。此外，提到遵守严格的伦理准则和隐私保护措施，这会增加用户的信任感。\n\n最后，表达愿意随时提供帮助的意愿，并询问是否需要进一步的帮助或有其他问题，这样可以让用户感到被重视和支持。\n</think>\n\n您好！我是DeepSeek-R1-Lite-Preview，一个由深度求索公司开发的智能助手，我通过算法处理信息并生成回答。我无法自主学习或更新，我的知识和能力是基于训练数据设计的。我会以专业和诚恳的态度为您提供帮助，同时遵守严格的伦理准则和隐私保护措施。请问有什么可以帮您的？', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:13.718524566Z', 'done': True, 'done_reason': 'stop', 'total_duration': 32779446334, 'load_duration': 17223924, 'prompt_eval_count': 21, 'prompt_eval_duration': 148000000, 'eval_count': 228, 'eval_duration': 32612000000, 'message': Message(role='assistant', content='', images=None, tool_calls=None)}, id='run-939ed366-2088-4d99-97e4-f5e936ecc3c2-0', usage_metadata={'input_tokens': 21, 'output_tokens': 228, 'total_tokens': 249})]}

{'messages': [HumanMessage(content='你是谁？', additional_kwargs={}, response_metadata={}, id='03ed2cbb-59df-42c2-b865-bcd177e30833'), AIMessage(content='<think>\n好，我需要回答用户的问题：“你是谁？” 用户希望得到详细的回应，并且我应该以礼貌的方式呈现。\n\n首先，我要确认自己的身份是DeepSeek-R1-Lite-Preview。这表明我是由深度求索公司开发的智能助手。接下来，我需要解释我的功能和用途：通过算法处理信息并生成回答，帮助用户解决问题或提供信息。\n\n然后，强调我没有个人意识或情感，只是一个工具，以确保用户的期望与实际功能相符。此外，提到遵守严格的伦理准则和隐私保护措施，这会增加用户的信任感。\n\n最后，表达愿意随时提供帮助的意愿，并询问是否需要进一步的帮助或有其他问题，这样可以让用户感到被重视和支持。\n</think>\n\n您好！我是DeepSeek-R1-Lite-Preview，一个由深度求索公司开发的智能助手，我通过算法处理信息并生成回答。我无法自主学习或更新，我的知识和能力是基于训练数据设计的。我会以专业和诚恳的态度为您提供帮助，同时遵守严格的伦理准则和隐私保护措施。请问有什么可以帮您的？', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:13.718524566Z', 'done': True, 'done_reason': 'stop', 'total_duration': 32779446334, 'load_duration': 17223924, 'prompt_eval_count': 21, 'prompt_eval_duration': 148000000, 'eval_count': 228, 'eval_duration': 32612000000, 'message': {'role': 'assistant', 'content': '', 'images': None, 'tool_calls': None}}, id='run-939ed366-2088-4d99-97e4-f5e936ecc3c2-0', usage_metadata={'input_tokens': 21, 'output_tokens': 228, 'total_tokens': 249}), HumanMessage(content='我刚才问你什么了?', additional_kwargs={}, response_metadata={}, id='83a142cc-ad9a-4a76-baa3-675508cd70fb'), AIMessage(content='<think>\n好的，用户现在问：“我刚才问你什么了?” 这可能是因为他想确认自己之前的问题或者只是随便一问。\n\n首先，我要回忆之前的对话内容。上一次用户的问题是“你是谁？”，而我的回答详细介绍了我是DeepSeek-_lite版本的智能助手，并说明了我的功能和限制。\n\n现在，用户询问刚才的问题是什么，这可能表明他希望再次确认我的身份，或者他想继续讨论这个话题。也有可能他记不清了，只是想知道之前的对话内容。\n\n我需要礼貌地提醒他刚才问的是关于我的身份问题。同时，保持友好，邀请他提出更多的问题或进一步的讨论。\n\n因此，在回复时，我会先简单说明他之前的问题，然后询问是否还有其他需求或想要继续探讨的内容。\n</think>\n\n您好！您刚才问的是：“你是谁？”如果您想了解更多或有其他问题，请随时告诉我，我很乐意为您提供帮助。', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:47.33778896Z', 'done': True, 'done_reason': 'stop', 'total_duration': 33613724628, 'load_duration': 17323671, 'prompt_eval_count': 269, 'prompt_eval_duration': 5397000000, 'eval_count': 192, 'eval_duration': 28192000000, 'message': Message(role='assistant', content='', images=None, tool_calls=None)}, id='run-f86abc0a-3f22-47e0-8da6-f4c2bd22a157-0', usage_metadata={'input_tokens': 269, 'output_tokens': 192, 'total_tokens': 461})]}

2.2 长期记忆

from datetime import datetime
from langchain_community.vectorstores import FAISS
from langchain_ollama import OllamaEmbeddings, ChatOllama
from langchain_core.documents import Document
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 1. 初始化嵌入模型和向量数据库
embeddings = OllamaEmbeddings(model="deepseek-r1")

# 初始化包含示例对话的向量库
vectorstore = FAISS.from_documents(
    documents=[
        Document(
            page_content="用户：如何重置密码？",
            metadata={"type": "human", "timestamp": "2025-01-01"}
        ),
        Document(
            page_content="AI：您可以访问设置页面，选择'忘记密码'选项。",
            metadata={"type": "ai", "timestamp": "2025-01-01"}
        )
    ],
    embedding=embeddings
)

# 2. 配置本地大模型
llm = ChatOllama(model="deepseek-r1")

# 3. 构建增强提示模板
template = """基于以下对话历史和当前问题，用中文回答用户：
历史对话（最新在前）：
{history}
当前问题：{question}
请给出专业解答："""
prompt = ChatPromptTemplate.from_template(template)


# 4. 创建处理链
def build_chain():
    # 创建带时间过滤的检索器
    retriever = vectorstore.as_retriever(
        search_kwargs={
            "k": 2,
            "filter": lambda doc: doc.get("metadata", {}).get("type", "") in ["human", "ai"]
        }
    )


    return (
            RunnablePassthrough.assign(
                # 获取最近10条对话历史
                history=lambda x: "\n".join(
                    [f"{doc.metadata['type']}：{doc.page_content}"
                     for doc in retriever.invoke(x["question"])[:10]]
                )
            )
            | prompt
            | llm
    )


# 5. 对话处理函数
def chat_loop():
    print("对话系统已启动（输入'exit'退出）")
    chain = build_chain()

    while True:
        user_input = input("你：").strip()
        if user_input.lower() == 'exit':
            break

        # 生成响应
        response = chain.invoke({"question": user_input})
        ai_response = response.content
        print(f"AI：{ai_response}")

        # 更新长期记忆
        new_docs = [
            Document(
                page_content=user_input,
                metadata={"type": "human", "timestamp": datetime.now().isoformat()}
            ),
            Document(
                page_content=ai_response,
                metadata={"type": "ai", "timestamp": datetime.now().isoformat()}
            )
        ]
        vectorstore.add_documents(new_docs)
        vectorstore.save_local("chat_memory")  # 持久化存储


if __name__ == "__main__":
    chat_loop()

输出为：

对话系统已启动（输入'exit'退出）
你：你好
AI：<think>
嗯，用户发来了“你好”，看起来是一个问候。我应该礼貌地回应。首先，我可以用“你好！”来回复，这样既简洁又友好。然后，我可以进一步表示愿意提供帮助，比如问有什么可以帮忙的，或者询问他们今天想聊些什么。这样可以让对话继续下去，让用户感觉被重视和支持。
</think>

你好！很高兴见到你，有什么我可以帮你的吗？
你：怎么重置密码
AI：<think>
好，我收到用户的问题是“怎么重置密码”。首先，我要考虑用户的使用场景。可能是用户忘记了原来的密码，想要重新设置一个。接下来，我需要分析用户的身份，可能是一个普通用户，不太熟悉技术细节，所以回答要简明易懂。

然后，我会思考用户的真实需求。他们可能只是想快速解决问题，而不需要太多的技术术语。同时，可能会有更深层的需求，比如希望过程安全，确保密码重置不会被他人恶意利用。

现在，我来组织一个专业的回答。首先，需要列出步骤：访问登录页面，点击“忘记密码”，填写注册邮箱或手机号，按照提示操作，设置新密码并保存。这样分点说明清晰明了，用户容易跟随。

另外，我要考虑可能的安全问题，所以提醒用户不要告诉他人验证码，并建议定期更换密码以保护账户安全。这些额外的注意事项能够帮助用户更好地维护自己的账号安全。

最后，整体语气要友好且专业，让用户感受到被帮助和支持。
</think>

重置密码通常需要按照以下步骤进行：

1. **访问登录页面**：打开应用或网站的登录界面。

2. **点击“忘记密码”**：在登录页面上找到并点击“忘记密码”或“找回密码”的链接。

3. **输入注册邮箱或手机号**：根据提示，输入你注册时使用的邮箱地址或手机号码。

4. **接收验证码或重置链接**：系统会发送一个验证码到你的邮箱或手机，或者直接提供一个链接让你设置新密码。

5. **按照提示操作**：使用收到的验证码完成身份验证，然后按照系统的指示设置一个新的密码。

6. **保存新密码**：确保记住新的密码，并妥善保管。

如果你在重置密码过程中遇到任何问题，请联系该服务的支持团队获取帮助。同时，确保不要将验证码告诉他人，以保护你的账户安全。
你：exit

三、企业级案例：金融客服系统

3.1 架构设计

3.2 关键性能指标

响应延迟：平均210ms（P99<450ms）
记忆准确率：用户意图识别提升58%
扩展性：单节点支持10,000+并发会话

四、避坑指南：新版记忆系统六大陷阱

未显式持久化：FAISS索引修改后需手动保存

vector_db.save_local("./memory_index")  # 关键操作！

会话ID冲突：未使用唯一标识导致记忆混淆
内存泄漏：MemorySaver未设置cache_size限制
版本不兼容：FAISS索引文件跨版本不兼容
权限问题：本地存储目录不可写
监控缺失：未跟踪记忆命中率

下期预告

《LangChain代理系统：让AI自主决策与执行》

揭秘：如何让大模型自主调用工具链？
实战：构建能订机票、查天气的智能助手
陷阱：无限递归与权限管控

新一代记忆系统让AI真正拥有了"过去"。记住：优秀的记忆设计，是智能体从"工具"进化为"伙伴"的关键一跃！

7. 记忆（Memory）机制：让AI拥有“短期记忆”与“长期记忆”

引言：当AI学会"记住你"

一、新版记忆架构核心变化

1.1 记忆存储方案对比（LangChain 0.3+）

1.2 新旧API迁移指南

二、构建新一代记忆系统

2.1 短期记忆

2.2 长期记忆

三、企业级案例：金融客服系统

3.1 架构设计

3.2 关键性能指标

四、避坑指南：新版记忆系统六大陷阱

下期预告

相关文章

前后端分离下，Spring Boot 请求从发起到响应的完整执行流程

【文献阅读】Vision-Language Models for Vision Tasks: A Survey

spring-cloud-alibaba-nacos-config使用说明

C# Winform 入门（9）之如何封装并调用dll

【嵌入式系统设计师】知识点：第2章嵌入式系统硬件基础知识

Vue2_Vue.js教程

【工业场景】用YOLOv12实现饮料类别识别

从小米汽车事故反思 LabVIEW 开发

Vue3+Vite+TypeScript+Element Plus开发-04.静态菜单设计

大数据技术发展与应用趋势分析

与Linux操作系统相关的引导和服务

STM32单片机入门学习——第16节: [6-4] PWM驱动LED呼吸灯PWM驱动舵机PWM驱动直流电机

基础框架系列分享：一个通用的Excel报表生成管理框架

Ansible（4）—— Playbook

自学-C语言-基础-数组、函数、指针、结构体和共同体、文件

蓝桥云客--团队赛

C-S模式之实现一对一聊天

[Deep-ML]Transpose of a Matrix（矩阵的转置）

智慧节能双突破强力巨彩谷亚VK系列刷新LED屏使用体验

html 给文本两端加虚线自适应