面对 AI,有人害怕,有人期盼。
“AI 和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了 AI 的能力进化过临界点,我们普通人根本就跟不上,或快或慢被淘汰。看起来,AI 正在给人类制造新的困境。
怕 AI 可以理解,那盼 AI 的人,到底在期盼什么呢?
前不久我在 WAIC 2024 上,发现了一个由孤独症儿童的父母、志愿者所组成的普通开发者团体,用 AI 给“来自星星的孩子”做绘本,这将“星宝”照护者们拉出了困境。
如何平衡 AI 的利弊,引导其健康发展,是我们这个时代亟需面对的重要课题。那些长期被我们忽略、存量问题待解的“小场景”,或许更需要先一步感受到 AI。
“孤独症儿童的照护没有结果(可能无法治愈),能做的就是维持一定的生活质量,仅此而已。”
“每天要绞尽脑汁地给孩子编故事。一旦编不出来了,孩子就不睡觉了,大人孩子都很崩溃。”
“为了照护每天都不能出门、不能睡觉,我有时真的想死。”
孤独症儿童也被称为“来自星星的孩子(星宝)”,在社交、沟通、行为方面有特殊需求,照护难度很大。精力不足,无法充足的睡眠,是“星宝”照护者们普遍的困境。
除了照顾“星宝”们的日常生活,照护者往往还希望提升孩子的生活质量,让他们也能感受到快乐和愉悦。“读绘本”就是一个能给星宝们带来幸福感的事情。
但定制绘本的缺失,让照护者们承受着情感上的痛苦。
孤独症 AI 绘本项目的发起人之一,就是“星宝”图图的爸爸。他提到:“我家图图特别爱听故事,特别是睡前故事,几乎每天晚上都要听故事入睡。但是由于孤独症孩子他们是有明显的兴趣狭隘和刻板这些特性的,他只喜欢听他感兴趣的几个话题,例如说安全常识,去郊外探险,孙悟空等,或者说这几个元素要融在一起才行,但市面上很难找到这样的绘本故事。”
既然市面上没有满足“星宝”个性化阅读需求的绘本,能不能自己做一个呢?
以公益产品“追星星的 AI”为例,就通过大模型的三种能力,让这件事成为可能。
1.生成能力。“追星星的 AI”通过家长或教师输入的一句话故事梗概(提示词),自动生成定制化的、图文并茂的绘本,包括常识认知、社交礼仪、心智解读、趣味故事等。
2.多模态能力。“追星星的 AI” 调用了通义大模型的文生图、语音合成等 AI 多模态能力,可以让一句话变成能被朗读的有声绘本,丰富阅读体验。
3.交互能力。大语言模型的核心技术特点之一,就是能够与人类进行更为自然、流畅的对话。“追星星的 AI”APP 中,上海美术电影制片厂授权的孙悟空、大耳朵图图等动画形象,可以作为主角给孩子们讲故事,增强交互感。
20 世纪 50 年代初,AI 概念初现曙光之际,人们对技术的愿景是,它能倾听并理解人类的需求,为那些最为亟需的人群伸出援手。
当 AIGC 之光照进星宝们的世界,让星宝家庭和照护者感受到来自科技的温暖与关怀,才是我们所期待的,技术在现实中的回响。
长期以来,将 AI 用于社会公益项目的尝试,屡见不鲜。为什么“追星星的 AI”会引起我们的注意?
有一个特别的地方是:这个产品的开发,全部是由星宝照护者和志愿者来完成的。
非技术背景的普通人也可以掌握 AI 吗?跟“追星星的 AI”工作人员聊了聊,或许可以给大家提供一些投身 AI 开发的思路。
首先,垂类应用要深入理解需求。
用 AIGC 生成绘本,这件事看起来非常简单易操作,几乎所有国产大模型平台都有全栈工具来支持从数据到精调、优化的所有步骤。但难点在于,每个应用所要求的细节都有很大差异。
比如星宝们可能没有办法理解过于复杂的图片信息。
“我们最开始生成出来的那一版图画,画面风格就有些复杂,出来好多星星点点的叶子、小花,被大家提出了意见,现在生成的就是这种比较干净的画面,一张图就是一个主体。”
“有的星宝对某些食物、动物会怕,是不能看见的,我们就设置了一个屏蔽功能,不会生成带有那些内容的图片。”
该项目的参与者既有星宝家庭成员,也有孤独症儿童干预机构,以及多年从事孤独症研究的高校学者。最终,结合星宝的认知水平层级,确定了最简洁的画面形式,突出人物,对话平实直接,确保 AIGC 生成方便星宝理解的画面。
其次,线上分布式协作方式。
一群家长和志愿者,到底要用多长时间才能做出一个 AIGC 应用?“追星星的 AI”的开发时间是两个月。
坦率来说,这比很多“零门槛 AI 开发平台”、大模型社区所宣传的时间更长。目前,借助 APP Inventor、APPMakr 等简化开发工具,一个专业开发者创建一个功能丰富、交互复杂的应用,大概只需要两周甚至更短的时间。为什么“追星星的 AI”落地时间要数月呢?
这是一个完全由大量在职志愿者完成的项目。其中有星宝的父母,有特教老师,大多数人以前都没有接触过 AI。而且,他们分布在世界各地,平时还有全职工作,利用晚上或周末的时间来沟通和写代码,采用线上分布式协作的方式推动项目。
移动互联网时代有个著名的段子,有创业者说,“创意有了,钱也融到了,就差个程序员了”。AI 开发,可能是有史以来第一次“去中心化”,普通人也可以通过线上分布式协作来参与到技术世界当中。
此外,多机构的支持也必不可少。
一方面,绘本涉及动画形象,需要大量图片作为训练素材。其中上海美术电影制片厂授权并提供了悟空、图图等经典动画形象图库。另外,这些经典动画形象深入人心,要求模型的生成结果不能出现误差,尤其是“身体像面条一样”的悟空形象,一开始训练出来的效果并不理想。工作人员提到,后来上海美术电影制片厂的老师们并没有介意,后续又提供了更多的图库素材来帮助训练。
不难发现,“追星星的 AI”是在很多非技术背景的人与机构的帮助下,才一点点搭建起来的。
近期以来,“担心被 AI 抢走工作”的焦虑已经出现了人传人现象。
尽管很多技术从业者、科普作家会反复强调,技术进步会让一些岗位消失,也会创造一些新的岗位,应该尽快主动地探索与规划未来职业。但客观来说,被 AI 淘汰的人,未必能快速适配新创造的岗位的技能要求。
难道人类社会就要毫不反思、毫不抵抗地加速迈入高度自动化、无人化阶段吗?我想起一句话:不要温和地走进那个良夜。
一方面,等待 AI 带来改变的场景很多,类似孤独症儿童照护这样的需求大量存在,以前并没有被很好地解决,智能技术的互动性、个性化等带来了前所未有的解题思路,这是技术应该最先到达的地方。
另一方面,每个人都能用好 AI 来解决实际问题,但他们需要得到实际的支持。除了科技企业搭建的平台和社区之外,支持有不同需求的国民继续学习、终身学习,已经成为很多国家的共识。
“哈佛幸福课”的讲师泰勒·本·沙哈尔说过:“一旦我们意识到自己的选项是什么,就很容易在短时间内作出决定。其中的关键点在于,意识到自己有选择,要比选择本身难得多。”
从这个角度说,“追星星的 AI”让我看到了一群人关于 AI 的选择,或许也是你我更好的选择。
AI 与人为敌,还是与人为友,选择权始终都掌握在人的手里。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓