有主题的图文内容创作 | AIGC实践

news2024/12/25 23:49:31

话说,昨天我发布了第一篇,内容由ChatGPT和Midjourney协助完成的文章:胡同与侏罗纪公园的时空交错 | 胡同幻想

在这篇文章中,大约70%+图文内容由ChatGPT和Midjourney输出。我个人参与的部分,主要是提出指令(Prompt),审核AI应用输出的图文内容,并完成文章的最终编辑和发布。

由此不禁感叹,得益于科技发展,才有此机会,将头脑中超现实的幻想加以呈现。

那么今天就来简单复盘和分享一下,我的第一次AIGC实践。

操作说明

制作这篇文章的主要操作思路是这样的:

479a6942057a101c72333bb03dfb738c.png

策划与编辑发布

由于第一次实践AIGC缺乏创作经验,过分沉迷于通过AI应用输出文本和图像的过程,造成策划部分相对薄弱,直接导致在编辑发布阶段,发现AI应用输出的文本和图像存在不满足的情况,因此人为地进行了比较大的调整,包括但不限于:

  • 手动编写Midjourney指令,补充图像。

  • 根据ChatGPT输出文本,重新编写文章标题、正文和图像说明。

后续实践,会更加重视策划环节,提升Prompt和AIGC输出的质量,减少后期编辑发布的工作。

本文主要介绍AIGC操作(输出图片/文本)的部分,策划与编辑发布的部分会在后续的实践中改进后,再做复盘分享。

输出图片

步骤1:输入ChatGPT指令【Prompt1】,生成图像描述。

ChatGPT指令:

我想让你充当Midjourney人工智能程序的提示生成器。你的工作是提供详细和有创意的描述,以激发人工智能的独特和有趣的图像。请记住,人工智能能够理解广泛的语言,并能解释抽象的概念,所以请自由发挥想象力和描述力,尽可能地发挥。例如,你可以描述一个未来城市的场景,或一个充满奇怪生物的超现实景观。你的描述越详细,越有想象力,产生的图像就越有趣。

请以北京胡同为背景,构思1条与恐龙有关,具有科幻色彩的场景描述。要求: 

- 恐龙的种类有所区别,包括但不限于:霸王龙;迅猛龙;角鸟龙;暴龙;三角龙;剑龙。

- 画面的景别有所区别,包括:广角;全景;中景;近景;特写。

- 画面细节尽可能丰富;描述中应包含“北京胡同”作为关键字。

说明:

  • 在此可以要求ChatGPT同时输出多条描述,但出于缩减篇幅的考虑,在此仅以输出1条描述作为举例。

  • 指令包含2个部分。第一部分来自于网络;后面补充上我的具体要求。

  • 具体要求已尽可能地包含了当时想到的全部,但从输出结果来看,仍有进一步细化和提高的空间。

ChatGPT输出:

广角全景:在北京胡同的拐角处,一只巨型蜥蜴类恐龙正在穿越狭窄的巷道。它的长尾巴拖过石板路,传出震天动地的声响。街道两旁的房屋被它的龙尾扫倒,墙体上裂出了深深的痕迹。

步骤2:从ChatGPT输出的图片中,选取自己比较感兴趣的描述,进行必要修改。

修改包括但不限于:

  • 删除冗余信息。例如,“传出震天动地的声响”这种对于声音的描写,个人认为无法通过画面表现,因此删除。

  • 添加元素和细节描写。例如,增加“路人惊恐地望着这一切”与主体形成对比。

  • 添加风格说明等。例如,我个人比较偏好纪实摄影,为公众号策划内容时,会考虑希望能够延续以往的拍摄风格,因此增加了“纪实照片风格”。

于是图像描述修改为:

广角全景:在北京胡同的拐角处,一只巨型蜥蜴类恐龙正在穿越狭窄的巷道,它的长尾巴拖过石板路,街道两旁的房屋被它的龙尾扫倒,墙体上裂出了深深的痕迹。路人惊恐地望着这一切。纪实照片风格。

步骤3:输入【ChatGPT】指令【Prompt2】,将修改后的图片描述翻译为英文。

ChatGPT指令:

翻译:【步骤2中修改后的图像描述】

ChatGPT输出:

Wide-angle panoramic view: At the corner of a hutong in Beijing, a giant lizard-like dinosaur is crossing the narrow alley. Its long tail drags on the stone pavement, making a deafening sound. The houses on both sides of the street are knocked down by its dragon tail, leaving deep marks on the walls. The style of the photograph is documentary.

说明:实际上,部分AI应用可以支持中文输入,如ChatGPT;部分不支持,如Midjourney;或者支持得不好,如BlueWillow。所以,对于Midjourney和BlueWillow而言,把中文指令翻译为英文指令,往往可以获得更好的输出结果。

步骤4:将翻译结果作为指令【Prompt3】输入【Midjourney】,并输出图像。

说明:个人认为,Midjourney的出图效果已经很好了。如果想调整描述,多次尝试,重复步骤2~3。

输出文本

步骤5:输入【ChatGPT】指令【Prompt4】和【Prompt5】,分别输出标题和文章的文本内容。

ChatGPT指令:

假如你是一个资深的新媒体创作者,请基于给定主题,和参考内容,概括主要内容,输出一段文章的开头。

要求:不少于300字;采用口语风格;语言风格轻松活泼。 

给定主题:如果胡同变成侏罗纪公园,会是什么样子?

参考内容:【步骤2中修改后的图像描述】

ChatGPT输出:

如果胡同变成侏罗纪公园,那么会是什么样子呢?想象一下,你走在胡同里,突然听到震耳欲聋的吼声,转过身却发现一只巨型的蜥蜴类恐龙正在你面前穿越狭窄的巷道。这是不是很惊险刺激?或者,你正要进入一家小店,门口却站着一个小男孩与一只小型的肉食龙对峙,男孩紧握着骨头棒,显得异常勇敢。这是不是很可爱有趣?这些场景都来自于想象力丰富的艺术家们的创作,如果胡同真的变成了侏罗纪公园,场景可能会更加生动,也许你会在胡同的屋顶上看到一只远古的飞龙正在展翅飞翔,或者在胡同的中央看到一只巨大的暴龙在巨大的石头上休息。这些景象让人眼前一亮……

ChatGPT指令:

我想让你充当书面作品的标题生成器。我将向你提供一篇文章涉及的主要内容,请输出5个吸引人的标题。请保持标题简洁,不超过20个字,并确保保持其含义。答复时要利用题目的语言类型。以下为主要内容:【步骤2中修改后的图像描述】

ChatGPT输出: 

1.  恐龙大闹北京胡同,居民四处逃窜!

2.  神秘远古恐龙现身北京胡同,惊艳全城!

3.  走进恐龙时代:北京胡同成了恐龙王国!

4.  北京胡同现神奇一幕:小男孩与肉食龙对峙!

5.  北京胡同探险记:与远古巨龙面对面!

ChatGPT指令:

请帮我优化这段文本/这个标题,给出5个结果:【人工修改后的文本/标题】

总结

至此,用于构建一篇图文内容的所有文本和图像素材,都已经准备就绪。经过编辑和发布,就成为大家最终看到的公众号文章。

有朋友问说,内容创作的过程是不是真的,既省时又省力?

我个人的感受是:

首先,通过Midjourney生成图片的过程是比较瓶颈的部分,这取决于Midjourney本身的出图速度;并且,可能由于输出的图像效果不符合预期,需要反复多次的情况。

其次,通过ChatGPT输出图像说明,不能完全取代人类的创意过程。因为虽然我在指令中尽可能多地包含要求,但依然很难穷尽所有可能相关的因素,不得不人为地进行干预和调整。

最后,由衷地再一次感叹:得益于科技发展,才有此机会,将头脑中超现实的幻想加以呈现——这真是一个美妙的体验。

相关文章:#AIGC实践

其他推荐:

实施:GitHub + MarkDown 文档系统的工作环境部署及工作流程说明 | 技术传播

f32c0b6d05c32d5a7a5849fae2ac6f30.jpeg

技术传播是一片蓝海 | 技术传播

访谈:TC无处不在,只是我们没有发觉 | 技术传播

这次他们说好要“讲真的” | 传播

在座都别吵了,你们还有我 | 技术传播

一本培养强迫症患者的说明书 | 技术传播

就像用心做好日本料理 | 技术传播

顽固的老头子与无聊的说明书 | 技术传播

转战新媒体 | 技术传播

评测:王者荣耀的用户帮助系统 | 技术传播

让爸爸妈妈也能享受到科技发展带来的便利 | 技术传播

企业级信息管理系统初创方案构思 | 技术传播

 96adb57c2614887993b7aa387622e6ca.png

睿齐

技术传播从业者

品牌内容策划

自由摄影师

自由撰稿人

汪力迪

公众号:techcomm / htstory

微信号:bgrichi

邮箱:hash_0813@163.com

762ece97065cef209d219af92f25bcd9.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/526881.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Monaco Editor编辑器教程(三一):在编辑器中实现模拟调试的交互

前言 最近有小伙伴咨询如何在编辑中实现 像vscode调试代码那样,可以打断点,可以高亮当前运行的一行。这样的需求并不多见,如果要做,那肯定是对编辑器做一个深层次的定制。一般很少很少会实现这种在浏览器中调试。 目前我还没见过,如果有遇到过的朋友可以指点一下。我去学…

Cesium AI GPT 文档 源码 ChatGPT问答

我用Cesium104.0的 源码 | 文档 | 3DTiles标准 作为上下文语料定制了一个智能Cesium专家问答助手 语料: 3D Tiles Specificationhttps://cesium.com/downloads/cesiumjs/releases/1.104/Build/CesiumUnminified/Cesium.jshttps://github1s.com/CesiumGS/cesium/blob/HEAD/Doc…

redis中的管道

Redis 管道 文章目录 1. 前言2. Redis 管道3. 小总结 1. 前言 通过一个问题引出 我们接下来要学习的 Redis 管道 : 提问 : 如何优化频繁命令往返造成的性能瓶颈 ? 另外 : 关于上面这个问题的由来 也可以简单的说一说 上面所说的思路 其实就是管道的概念 &#xff0…

读俞敏洪的书

没有认真写过一篇关于书籍的读后感文章,但在读完俞敏洪老师这本书后,想推荐给大家,也想分享下我的想法。 几周前,我在微信读书首页看到了俞敏洪老师的读书推荐 《在绝望中寻找希望》——俞敏洪写给迷茫不安的年轻人 有好几个晚上&…

电池只能充电500次?别太荒谬!收下这份真正的充电秘籍

我们的生活已经离不开电子设备了,而电子设备嘛,又离不开给它们提供能源的电池。在网上有许许多多的“延长电池寿命小技巧”,比如“新买的电子设备,第一次充电之前要把电都放完”“笔记本电脑一直插着电源可以保护电池”“长期不用…

区分COCO数据集的coco minival和coco test-dev、conda常用命令和python -m 的作用

1、COCO数据集的测试集coco minival和coco test-dev: 两个数据集在官方网站对应的内容如下所示: COCO数据集官网:https://cocodataset.org/#download 两个数据集的区分参考网址:https://zhuanlan.zhihu.com/p/533676547 2、conda常用命令…

linux中epoll+socket实战

目录 参考前言案例 一、epoll的基本使用首先是epoll_create函数:然后是epoll_ctl函数:最后是epoll_wait函数:关于ET(边沿触发)、LT(水平触发)两种工作模式可以得出这样的结论: 二、使用代码简易…

基于html+css的图展示71

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

某音X-Bogus算法研究 2023-05-15

本文以教学为基准,研究JavaScript算法及反爬策略、本文提供的可操作性不得用于任何商业用途和违法违规场景。 如有侵权,请联系我进行删除。 今天我们分析一下douyin个人主页数据获取。 大多数小伙伴应该都知道想要拿到douyin的数据也不是那么容易的&a…

近世代数 笔记与题型连载 第十三章(环与域)

文章目录 基本概念1.环1.1.环的定义1.2.环的性质1.3.几种特殊的环1.4.子环 2.域2.1.域的定义2.2.环与域的同态 相关题型1.验证一个代数系统是否是一个环2.判断一个代数系统是否是整环3.判断一个代数系统是否是另一个代数系统的子环4.判断一个代数系统是否是域 基本概念 1.环 …

sed编辑器命令

sed编辑器 sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。 sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中。 sed 的工作流程主要包括读取…

Nat. Commun | 中国海洋大学张伟鹏组揭示海洋生物被膜群落硫氧化主要菌群及其作用机制...

海洋生物被膜玫瑰杆菌的厌氧硫氧化机制 Anaerobic thiosulfate oxidation by the Roseobacter group is prevalent in marine biofilms Article,2022-04-11,Nature Communications,[IF 17.7] DOI:10.1038/s41467-023-37759-4 原文…

Apache Hive函数高阶应用、性能调优

Hive的函数高阶应用 explode函数 explode属于UDTF函数,表生成函数,输入一行数据输出多行数据。 功能: explode() takes in an array (or a map) as an input and outputs the elements of the array (map) as separate rows.--explode接收…

「 操作系统 」CPU缓存一致性协议MESI详解

「 操作系统 」CPU缓存一致性协议MESI详解 参考&鸣谢 缓存一致性协议MESI 小天 CPU缓存一致性协议MESI 枫飘雪落 CPU缓存一致性协议(MESI) 广秀 2.4 CPU 缓存一致性 xiaoLinCoding 文章目录 「 操作系统 」CPU缓存一致性协议MESI详解一、计算机的缓存一致性二、CPU高速缓存…

100种思维模型之长远思考思维模型-63

古语有云:“人无远虑,必有近忧!” 任正非说:不谋长远者,不足以谋一时! 长远思考思维,一个提醒我们要运用长远眼光,树立宏大目标,关注长期利益的思维模型 01何谓长远思考…

深度学习架构的对比分析

深度学习的概念源于人工神经网络的研究,含有多个隐藏层的多层感知器是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示,以表征数据的类别或特征。它能够发现数据的分布式特征表示。深度学习是机器学习的一种,而机器学习是…

浅谈数据资产测绘系统的作用和挑战

随着数据被定义为第五大生产要素,数据已经成为数字经济发展的核心驱动力。数据资源的充分利用和开放共享给政企单位带来便利的同时,也带来了相应的数据安全风险。因此,摸清并动态掌握数据资产情况,持续进行数据资产测绘就成为企业…

Golang每日一练(leetDay0066) 有效电话号码、转置文件

目录 193. 有效电话号码 Valid Phone Numbers 🌟 194. 转置文件 Transpose File 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 193. 有效电话号…

IDEA常用配置和插件总结

文章目录 1\. 配置1.1 设置编译版本1.2 设置编码1.3 自动导包1.4 自动编译1.5 设置主题1.6 设置字体字号1.7 滚轮修改字体大小1.8 控制台字体1.9 行号与方法分隔符1.10 忽略大小写字母1.11 多行显示1.12 设置 Maven1.13 GitHub 账户1.14 配置 Git1.15 配置文件隐藏1.16 配置相同…

java中List与AbstractList

一、List 接口 List 接口继承了 Collection 接口,在 Collection 接口的基础上增加了一些方法。相对于 Collection 接口,我们可以很明显的看到,List 中增加了非常多根据下标操作集合的方法,我们可以简单粗暴的分辨一个方法的抽象方…