背景
收到GLM沉思的消息,立马试用下。感觉真的太及时了。
(背景:为了客户的需求“AI辅助写作”实验了2款开源workflow,2款在线workflow,好几款多智能体框架后,心中无底之际。。。)
1. GLM(开启沉思)
请帮我写个“写作智能体”的发展报告,500字内,谢谢。
# 写作智能体发展报告:从自动化到智能化的文本创作革命
## 引言
写作智能体作为一种结合大语言模型(LLM)、规划能力和工具使用能力的AI系统,正逐渐成为文本创作领域的重要力量。本报告将探讨写作智能体的发展历程、当前应用以及未来趋势,揭示这一技术如何改变传统的写作方式。
## 写作智能体的定义与特点
写作智能体是一种具备智能的软件实体,它能够感知环境,基于知识储备与算法模型进行推理决策,并通过执行相应行动来实现特定目标[[13](http://www.news.cn/info/20250327/3e204552da604ff7a9cd890b07920d36/c.html)]。简单来说,它就像是拥有"智慧大脑"的虚拟助手,能理解外界信息、思考应对策略并付诸行动。
写作智能体的特点在于:
1. 具备规划思考能力、记忆能力和使用工具函数的能力[[0](https://zhuanlan.zhihu.com/p/696599111)]
2. 能够执行迭代工作流,使用一系列工具自主处理复杂开放式任务[[2](https://www.nvidia.cn/glossary/ai-agents/)]
3. 不仅能生成文本,还能检查语法错误、优化语言表达、提高文本可读性[[1](https://zhuanlan.zhihu.com/p/717707464)]
## 发展历程
### 早期阶段:文本生成的起源
AI写作的历史可以追溯到20世纪中叶,当时研究者开始尝试使用计算机进行自动文本生成[[5](https://zhuanlan.zhihu.com/p/660788172)]。文本生成的目标是创建不仅语法正确、符合语境且对目标受众有吸引力的文本[[6](https://www.ibm.com/cn-zh/think/topics/text-generation)]。
早期的文本生成主要集中在两个方向:自然语言处理(NLP)和统计方法。研究者使用马尔可夫链和n-gram模型等技术,基于统计方法生成文本。这些早期尝试为后来的AI写作奠定了基础。
### 发展阶段:从简单到复杂
随着人工智能的发展和机器学习算法的兴起,文本生成领域在1980年代和1990年代开始获得动力[[7](https://www.ibm.com/cn-zh/topics/text-generation)]。这一时期,AI写作开始应用于特定领域,如历史学研究中使用生成式AI工具对相关史料进行检索及整理[[8](https://www.nju.edu.cn/info/1056/411081.htm)]。
生成式模型在AI领域有着悠久的历史,从隐马尔可夫模型(HMMs)和高斯混合模型(GMMs)开始,到后来的循环神经网络(RNNs)和变换器(transformers),这些模型的演进显著提高了文本生成的质量和连贯性[[9](https://zhuanlan.zhihu.com/p/637205203)]。
### 现代阶段:大语言模型与智能体的结合
近年来,随着大语言模型(LLM)的发展,写作智能体迎来了质的飞跃。现代写作智能体结合了大语言模型的文本生成能力和智能体的规划、推理和工具使用能力,形成了更强大的系统。
百度的文心智能体平台AgentBuilder是基于文心大模型的智能体平台,支持开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力[[11](https://agents.baidu.com/)]。字节的豆包智能体和智谱清言等也是当前流行的写作类GPT,功能包括论文写作、商业文案写作、搜索引擎优化、个性化改写等多方面[[12](https://zhuanlan.zhihu.com/p/695667875)]。
## 当前应用
### 学术研究领域
在学术研究中,写作智能体被广泛应用于论文写作、文献综述和研究数据分析。它能够快速处理大量文献,提取关键信息,并以连贯的方式呈现。例如,研究人员可以使用写作智能体帮助撰写研究论文、整理实验数据和生成研究报告。
### 商业应用领域
在商业领域,写作智能体被用于创建营销文案、商业计划书和市场分析报告。它能够根据市场需求和用户偏好,生成具有吸引力和说服力的文本内容。例如,企业可以使用写作智能体帮助撰写产品说明书、广告文案和客户沟通材料。
### 内容创作领域
在内容创作领域,写作智能体被用于生成各类文章、博客和社交媒体内容。它能够根据不同的风格和语调要求,创作出符合特定用户偏好的内容。例如,内容创作者可以使用写作智能体帮助生成新闻报道、专栏文章和视频脚本。
## 技术实现
### 基于大语言模型的技术架构
现代写作智能体通常基于大型语言模型(LLM),这些模型在海量数据上进行训练,能够理解和生成人类语言。常见的大语言模型包括GPT系列、BERT系列和各种开源模型。
### 多模态AI Agent创作平台
一些平台如Gnomic智能体平台,支持多模态AI Agent创作,可轻松接入智谱ChatGLM、文心一言等多种大模型,并在模型间无缝切换[[14](https://www.woshipm.com/aigc/6089895.html)]。这些平台提供了丰富的工具和接口,使开发者能够创建功能强大的写作智能体。
### 开发框架与工具
为了促进写作智能体的开发,各种开源框架和工具被创建出来。例如,知乎专栏提到的11个最流行的AI智能体开发框架,为开发者提供了构建和训练智能体的基础设施[[10](https://zhuanlan.zhihu.com/p/709029523)]。
## 未来趋势
### 智能体工作流程的重要性
斯坦福大学教授吴恩达指出,AI智能体的工作流程将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁AI领域的工作人员关注智能体的工作流程[[16](https://zhuanlan.zhihu.com/p/690202723)]。这表明智能体的工作流程优化将成为未来研究的重点。
### 从Manus引爆到产业重塑
AI智能体已广泛应用于教育、金融、医疗等多个领域,并在软件开发、科学研究等方面取得突飞猛进的成果。近期备受关注的移动应用智能体能够自主操控设备完成复杂的交互[[18](https://www.ccf.org.cn/ccfdl/ccf_dl_focus/new/25-9-53/)]。这表明AI智能体正在从理论研究走向实际应用,并对各产业产生深远影响。
### 基于LLM的智能体前景
基于大语言模型的智能体在不同领域都有应用,包括自然科学、社会科学、工程系统和普通领域。未来,智能体的发展将涉及增强基于LLM的智能体的能力,使它们能够更好地处理复杂任务和环境[[19](https://zhuanlan.zhihu.com/p/677778544)]。
## 结论
写作智能体作为AI技术的重要应用,正在改变传统的写作方式。从早期的简单文本生成,到现代的智能体系统,写作智能体经历了显著的发展。目前,它已广泛应用于学术研究、商业应用和内容创作等领域,并展现出强大的潜力。
随着技术的不断进步,写作智能体将变得更加智能和强大,能够处理更复杂的任务和环境。未来,我们有理由期待写作智能体在更多领域发挥重要作用,为人类创造更大的价值。
## 参考文献
[0] 一文带你了解智能体(Agent) - 知乎专栏. https://zhuanlan.zhihu.com/p/696599111.
[1] 小白入门,大模型LLM的Agent智能体到底是什么? - 知乎专栏. https://zhuanlan.zhihu.com/p/717707464.
[2] 什么是AI 智能体? - 英伟达. https://www.nvidia.cn/glossary/ai-agents/.
[5] AI写作的历史 - 知乎专栏. https://zhuanlan.zhihu.com/p/660788172.
[6] 什么是AI 写作文本生成? - IBM. https://www.ibm.com/cn-zh/think/topics/text-generation.
[7] 什么是文本生成? - IBM. https://www.ibm.com/cn-zh/topics/text-generation.
[8] AI应用对历史学界产生多维影响 - 南京大学. https://www.nju.edu.cn/info/1056/411081.htm.
[9] 生成式AI的历史和发展(关键技术) - 知乎专栏. https://zhuanlan.zhihu.com/p/637205203.
[10] 11个最流行的AI智能体开发框架 - 知乎专栏. https://zhuanlan.zhihu.com/p/709029523.
[11] 文心智能体平台AgentBuilder | 想象即现实. https://agents.baidu.com/.
[12] 【AI Agent系列】最近爆火的AI Agent究竟是啥?20篇论文全面调研带 .... https://zhuanlan.zhihu.com/p/695667875.
[13] AI智能体:走进百姓生活的科技新力量 - 新华网. http://www.news.cn/info/20250327/3e204552da604ff7a9cd890b07920d36/c.html.
[14] 国内大模型/智能体盘点丨16家公司,13款大模型,19个智能体. https://www.woshipm.com/aigc/6089895.html.
[16] 【Agent设计模式】00-AI智能体工作流 - 知乎专栏. https://zhuanlan.zhihu.com/p/690202723.
[18] AI 智能体:从Manus引爆到产业重塑 - 中国计算机学会. https://www.ccf.org.cn/ccfdl/ccf_dl_focus/new/25-9-53/.
[19] 综述:探索基于大型语言模型的智能体:定义、方法与前景 - 知乎专栏. https://zhuanlan.zhihu.com/p/677778544.
转PDF
import markdown
import pdfkit
import subprocess
# 指定编码格式为UTF-8
options = {
'encoding': "UTF-8",
'custom-header': [
('Content-Disposition', 'attachment; filename=output.pdf')
]
}
# 将Markdown文本转换为HTML
def markdown_to_html(markdown_text):
return markdown.markdown(markdown_text, extensions=['nl2br'])
# 将HTML转换为PDF
def html_to_pdf(html_text, output_file):
pdfkit.from_string(html_text, output_file, options=options)
def html_to_image(html_content, output_file):
# 将HTML内容写入临时文件
with open('temp.html', 'w') as f:
f.write(html_content)
# 调用wkhtmltoimage命令行工具
subprocess.run(['wkhtmltoimage', 'temp.html', output_file])
file='writerAgent'
#file='写作智能体'
# 从D:\PyCharmWorkspace\AITutorial02\zhipu\articles\writerAgent.md 读取text
markdown_text = open(f'D:\\PyCharmWorkspace\\AITutorial02\\zhipu\\articles\\{file}.md', 'r', encoding='utf-8').read()
# 转换流程
html_text = markdown_to_html(markdown_text)
print(html_text)
html_to_pdf(html_text, f'./{file}.pdf')
有理有据,数据真实可查,引用到位。
2. AutoGLM沉思
输出参考:绑定资源
试用的感受:
1. 通过浏览器自动浏览可以发挥出 个性化 的输出优势,可以任意扩展专业的知识源。满足客户对自己行业的互联网检索信息需求。
2. 浏览器本身是人的工具,也就是说,除了code interprector(含SQLexecute),智能体拥有了与人兼容的工具调用能力,为智能体真的成为人的代理创造了条件。(也许以后一句话,agent就帮我买奶茶了)
*关于这一点,OpenAI的AgentSDK推出的浏览工具好像是“视觉理解”(我认为这个最牛)。
3. 万字长文!13787字(30分钟内完成,含浏览过程中的人工登录环节等)。对agent来说输入可能是100万字或更多(1个网页可能就有1w),最终输出没有重叠,就是将每个阶段的结果总结的非常好。(我想,一定有些技术提升超大上下文的归纳能力。)
4. 目前是beta版,已经是完整的一套应用(不是框架)。GLM还有其他的agent,数据分析,代码执行等,难怪大家都甚至开始“担心”这种潜力。
5. 输出很快,免费!(*项目需要,曾经初步估算过部署一个Deepseek-distill 32B的价格)
总结
我觉得,今年由manus开始的多智能体应用已经展开赛道,大厂们陆续推出更重量级更成熟的应用 ...