ChatGPT推出Canvas功能

news2026/2/11 2:31:11

"Canvas" 是 OpenAI 推出的全新界面，专为增强写作和编程协作而设计。它让用户能够在聊天之外更高效地进行编辑、审阅和反馈，提供了内联编辑、代码调试和文档版本控制等功能。目前，"Canvas" 已面向 ChatGPT Plus 和 Team 用户推出，未来将扩大适用范围。这个新工具旨在提升用户与 ChatGPT 的互动体验，成为创意和技术上的强力助手。

ChatGPT画布

使用 ChatGPT 编写和编码的全新工作方式

我们即将推出全新的“画布”界面，为与 ChatGPT 协作开展写作和编程项目提供了更加沉浸的体验。与简单的对话不同，画布在独立窗口中打开，让您和 ChatGPT 共同探索、精雕细琢创意。这一测试版标志着合作方式的革新，不再局限于语言交流，而是通过协同创作推动项目的发展。在这里，灵感得以升华，想法得以打磨，真正实现了人机携手并肩的创作之旅。

Canvas 是基于 GPT-4 构建的，目前处于测试阶段，用户可以在模型选择器中手动选择该功能。我们从今天开始向全球的 ChatGPT Plus 和 Team 用户推送该功能，企业和教育用户将在下周获得访问权限。等到测试结束后，所有免费用户也将能够使用画布功能。

更好地与 ChatGPT 合作

人们每天使用 ChatGPT 进行写作和编程帮助，尽管聊天界面简单易用，适合许多任务，但在处理需要多次编辑和修改的项目时存在局限性。为此，Canvas 提供了一种全新的界面，专门用于处理这类复杂工作。

使用 Canvas 时，ChatGPT 可以更好地理解您要完成的任务的上下文。您可以突出特定部分，明确指出希望 ChatGPT 关注的内容。就像一名文稿编辑或代码审查员一样，它能够在项目整体的基础上提供内联反馈和建议，帮助您更精准地完成目标。

在 Canvas 中，您完全掌控项目的进展。您可以直接编辑文本或代码，并使用快捷菜单让 ChatGPT 调整写作长度、调试代码等操作。此外，Canvas 还提供了一个“撤销”按钮，帮助您恢复之前的工作版本。这种灵活性让您在项目中轻松进行调整和优化。

当 ChatGPT 检测到适合使用 Canvas 的场景时，它会自动打开 Canvas。您也可以在提示中加入“使用 Canvas”来手动启动，并在现有项目中进行编辑和工作。

写作快捷方式包括：

建议修改：ChatGPT 提供内联建议和反馈。
调整长度：修改文档长度，缩短或延长内容。
更改阅读水平：根据需要调整阅读难度，从幼儿园到研究生水平。
最终润色：检查语法、清晰度和一致性。
添加表情符号：增加相关表情符号以增强表达效果和色彩。

在Canvas中编程

编程是一个反复迭代的过程，跟踪代码的修改在聊天中可能很困难。Canvas 让追踪和理解 ChatGPT 的代码更简单透明，并计划进一步提升这些编辑的清晰度。

编程快捷方式包括：

审查代码：ChatGPT 提供代码优化建议。
添加日志：插入打印语句帮助调试代码。
添加注释：为代码添加注释，提升可读性。
修复错误：检测并重写问题代码。
移植语言：将代码翻译为 JavaScript、TypeScript、Python、Java、C++ 或 PHP。

将模型训练为合作者

我们训练 GPT-4o 作为创意伙伴进行合作。该模型知道何时打开画布、进行有针对性的编辑以及完全改写。它还能理解更广泛的背景，提供精确的反馈和建议。

为此，我们的研究团队制定了以下核心行为：

触发书写和编码画布
生成多种内容类型
进行有针对性的编辑
改写文件
提供在线评论

我们通过 20 多项自动内部评估来衡量进展情况。我们使用了新颖的合成数据生成技术，例如从 OpenAI o1-preview 中提炼输出，对模型的核心行为进行后期训练。这种方法使我们能够快速解决写作质量和新的用户交互问题，而无需依赖人工生成的数据。

一个关键的挑战是确定何时触发画布。我们让模型学会为 "写一篇关于咖啡豆历史的博文 "这样的提示打开画布，同时避免过度触发 "帮我做一份新的晚餐食谱 "这样的一般问答任务。对于写作任务，我们优先提高了 "触发正确率"（以牺牲 "非触发正确率 "为代价），与带有提示指令的基线零触发 GPT-4o 相比，达到了 83%。

值得注意的是，此类基线的质量对所使用的特定提示非常敏感。使用不同的提示时，基线可能仍然表现不佳，但表现方式会有所不同--例如，在编码和写作任务中平均不准确，从而导致错误分布不同，以及其他形式的次优表现。在编码方面，我们有意使模型偏向于不触发，以避免干扰我们的高级用户。我们将根据用户反馈继续改进。

在写作和编码任务中，我们提高了对画布决策边界的正确触发率，与带有提示指令的基线零镜头 GPT-4o 相比，分别达到了 83% 和 94%。

第二个挑战是在画布触发后调整模型的编辑行为，特别是决定何时进行有针对性的编辑，而不是重写整个内容。我们对模型进行了训练，使其在用户通过界面明确选择文本时执行有针对性的编辑，否则则倾向于重写。随着我们对模型的不断完善，这种行为还会继续演变。

对于写作和编码任务，我们优先改进了画布定向编辑。带有画布的 GPT-4o 比基线提示的 GPT-4o 性能高出 18%。

最后，训练模型以生成高质量的评论需要仔细的反复练习。与前两种情况不同的是，前两种情况很容易通过彻底的人工审核实现自动评估，而以自动方式衡量质量则特别具有挑战性。因此，我们使用人工评测来评估评论的质量和准确性。我们的集成画布模型在准确性和质量方面分别比带有提示说明的零点击 GPT-4o 高出 30% 和 16%，这表明与带有详细说明的零点击提示相比，合成训练能显著提高回复质量和行为。