相信不少朋友都遇到过想要在工作流中处理图片但是却无从下手的情况
举个例子,扣子中有个插件叫OCR,是可以用来识别图中的文字的
然而作为一个插件,它只能在工作流中被调用,如下图 工作流 vs. 图像流
这就意味着,要使用OCR的插件就需要在工作流中上传图片。
然而,目前Coze中只有图像流是可以直接选择Image类型的输入参数进行图片上传,工作流里并没有这个类型选项
那么问题来了,如何让工作流接收并处理图片呢?
答案就是使用提示词,不过这个提示词的用法程哥也是反复尝试了多遍,最后总结出来的。
下面程哥就用这个OCR插件来做个演示,给大家做个参考:
1. 新建一个工作流test,在开始节点中添加一个输入参数pic_url,类型选择String
2. 在工作流中添加OCR的Image2tex的插件工具,并将参数url设为引用开始节点的pic_url
3. 连接各节点,试运行后发布工作流
试运行的时候需要准备一个图片的链接,作为输入参数
发布工作流并将工作流test添加到bot中
4. 设置人设与回复逻辑的提示词
关键点就是:在提示词里要明确指明,将图片链接传递给工作流的输入参数
5. 选择模型
程哥在做了多次尝试后发现,在这种应用场景下豆包的Function call模型工作不稳定,经常无法正常返回识别的内容。
但是通义千问-Max和GLM-4都没问题,其他模型暂时还没尝试。
6. 预览与调试
程哥上传了一张”证件照生成器“的截图,运行之后顺利识别出了图片中的文字,如下:
就是这样,使用这个方法就可以让一个工作流顺利地处理图片了,快去试试吧~~
Bot体验地址:https://www.coze.cn/store/bot/7402108917955870754
如果觉得程哥的文章对你有帮助,记得点赞,转发,关注哦,你的支持是我的动力
智能体精彩内容推荐:
-> AI智能体 | 智能体综合系列
-> AI智能体 | 100个好用的智能体
-> AI智能体 | 100个智能体实战技巧
-> AI智能体 | 100个好用的智能体插件