【ChatGPT】解锁AI思维链：如何让机器像人类一样思考？

news2025/2/24 21:28:54

在人工智能领域，我们一直在追求让机器像人类一样思考。然而，即使是最先进的AI，也常常被诟病缺乏“常识”，难以理解复杂问题，更不用说像人类一样进行逻辑推理和解决问题了。最经常的表现就是遇到不会的地方，或者一些人一眼能看出来的地方AI在那里胡扯。🤔

为了解决这个问题，一种名为“思维链（Chain of Thought, COT）”的技术应运而生。COT的核心思想是：将复杂问题分解成一系列简单的子问题，并逐步推理出最终答案。这就像人类在解决问题时，会先将问题拆解成一个个小步骤，然后一步步推理，最终得出结论。🧩

在这里插入图片描述

什么是思维链（COT）？

思维链（COT）是一种新兴的AI技术，旨在通过将复杂问题分解为多个简单的子问题来提高AI的推理能力。COT不仅提升了AI解决复杂问题的能力，还增强了模型的可解释性，使得AI的决策过程更加透明，便于人类理解和调试。🔍

理解COT的实践

为了更好地理解COT，我们来看一个简单的例子：数单词“strawberry”中有几个字母“r”。

from langchain_openai import ChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# 模型
model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='sk-xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)
# 定义一个简单的提示模板
prompt_template = PromptTemplate(
    input_variables=["user_input"],
    template="用户: {user_input}\nAI:"
)
# 创建一个链，将提示模板与模型连接起来
chain = LLMChain(llm=model, prompt=prompt_template)

# 手动输入一个值并发送给模型
user_input = "strawberry里面有几个r"
# 发送消息给模型并获取响应
response = chain.run(user_input=user_input)
print(f"\n\nAI: {response}\n")

初步结果

我们得到的结果是：

AI: 在单词 "strawberry" 中，有两个字母 "r"。

显然，这个结果是错误的。AI没有正确地数出“r”的数量。😅

使用COT解决问题

接下来，我们尝试使用COT来解决这个问题。通过将问题分解为多个步骤，AI可以更准确地得出答案。

user_input = '''
回答下面问题并注意回答的时候严格按照以下步骤，逐步进行：
1．将单词拆开
2．从左到右一个,一个对比字母是不是，是的话你要记录他的位置，并记住数量加一
3，第2步数出来多少个r直接输出 
问题：'strawberry'里面有几个r
'''

# 发送消息给模型并获取响应
response = chain.run(user_input=user_input)
print(f"\n\nAI: {response}\n")

改进后的结果

通过使用COT，AI得到了正确的答案：

AI: 1. 将单词拆开: s, t, r, a, w, b, e, r, r, y
2. 从左到右一个,一个对比字母是不是r:
   - 第1个字母是s，不是r
   - 第2个字母是t，不是r
   - 第3个字母是r，是r，记录位置3，数量加一
   - 第4个字母是a，不是r
   - 第5个字母是w，不是r
   - 第6个字母是b，不是r
   - 第7个字母是e，不是r
   - 第8个字母是r，是r，记录位置8，数量加一
   - 第9个字母是r，是r，记录位置9，数量加一
   - 第10个字母是y，不是r
3. 第2步数出来多少个r直接输出: 3

通过逐步推理，AI成功地数出了三个“r”。🎉

内置COT的优势

在上面的例子中，我们引导AI解决了一个具体的问题。但如果我们不知道用户想问什么，又想内置思维链怎么办呢？我们可以通过编写一个通用的COT框架来实现这一点。

from langchain_openai import ChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
import json

# 模型
model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='sk-xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)
# 定义一个简单的提示模板
prompt_template = PromptTemplate(
    input_variables=["user_input"],
    template="用户: {user_input}\nAI:"
)
# 创建一个链，将提示模板与模型连接起来
chain = LLMChain(llm=model, prompt=prompt_template)

# 手动输入一个值并发送给模型
initial_prompt = '''
你是一个能够逐步解释推理过程的专家AI助手。对于每一步，提供一个描述你在该步骤中所做内容的标题，以及相应的内容。决定是否需要另一步骤或你已准备好给出最终答案，
，且每次推理你仅执行一步等我说继续才能执行下一步。输出以JSON格式响应，包含 ‘title’, ‘content’, 和 ‘next_action’（要么是 ‘continue’，要么是 ‘final_answer’）键值。

为了提高指令遵从性，通过大写字母强调指令的重要性，包括一组提示和最佳实践：
1、尽可能多地使用推理步骤。至少5步，且每次推理你仅执行一步等我说继续才能执行下一步
2、意识到作为语言模型你的限制以及你能做什么和不能做什么。
3、包括探索替代答案。考虑你可能是错误的，如果你的推理是错误的，错误可能在哪里。
4、当你说你在重新检查时，实际上要重新检查，并采用另一种方法来做。不要只是说你在重新检查。
5、至少使用3种方法得出答案。
6、使用最佳实践。

问题如下：周五昨天的后天是周几
'''

# 发送消息给模型并获取响应
response = chain.run(user_input=initial_prompt)
print(f"\n\nAI: {response}\n")