深度解析:AI Prompt 提示词工程的兴起、争议与未来发展

news2024/11/29 12:44:13

PART1: 提示词工程的兴起

在人工智能领域中,一个新的领域——提示词工程(prompt engineering)——开始显露头角。

这个领域的核心在于精心设计输入,以引导AI模型产生特定的、期望的输出。

随着AI技术的飞速发展,特别是在大型语言模型(LLM)的推动下,提示词工程成为了一个备受瞩目的焦点。

权威机构分析,全球AI市场预计将在2030年达到1.6万亿美元的规模。在这样的大背景下,像OpenAI这样的公司提供的薪酬高达90万美元,反映了AI领域专业人才的高需求。

图片

而在这个领域中,提示词工程因其在提高AI模型性能方面的潜力而变得尤为重要。

2022年,随着GPT-3的公开可用性,普通用户开始意识到提示词的重要性。

“垃圾进垃圾出”(GIGO)的原则在这里得到了体现:如果输入的提示词草率且缺乏细节,AI模型将产生不理想的输出。

用户很快意识到,精心设计的提示词可以显著提升模型的性能。

随着对LLM能力的深入探索,人们开始尝试更复杂的工作流程和更长的提示词,这进一步凸显了巧妙编织文字的价值。

定制指令扩展了可能性,加速了提示词工程师这一职业的崛起。

提示词工程师是一群能够利用逻辑、推理和对LLM行为的知识来随心所欲地产生期望输出的专业人士。

尽管提示词工程在自然语言处理(NLP)领域取得了显著进步,但它的未来也引发了争议。

图片

一方面,有观点认为提示词工程是AI创新的催化剂,预示着一个人类与AI无缝交互的未来。

另一方面,也有声音质疑提示词工程的长期可行性,担心它可能只是一种短暂的技术潮流。

在媒体的炒作和夸张中,提示词工程被描绘成一种要么神奇无比、要么一文不值的技术。

然而,当剥离这些炒作,我们会发现一个更加微妙的现实。提示词工程面临着技术和伦理上的挑战,包括在不同应用中的可扩展性、可复制性和标准化问题。

与此同时,与传统的、成熟的AI职业相比,提示词工程的光彩开始显得有些黯淡。

PART2: 提示词工程的争议与挑战

提示词工程(prompt engineering)作为一门新兴的领域,虽然展现出了巨大的潜力,但也不可避免地遭遇了争议和挑战。

这些争议不仅涉及技术层面,还触及了职业发展的可持续性。

技术迭代的双刃剑

技术的快速迭代是推动AI发展的强大动力,但对于提示词工程师而言,这却是一把双刃剑。

随着AI模型如GPT-3.5到GPT-4,GPT-4O 的不断进化,曾经有效的提示词可能在新版本中失效。

这种快速的技术更新要求提示词工程师必须持续学习,不断适应新的模型特性。

甚至某种程度上我们还会发现某种“无提示词工程”的趋势(non-prompt engineer)。

具体指的是,对用户输入上下文的深度理解,以无感、简易、自然交互的输入形式完成高质量内容输出。

AI理解的局限性

批评者指出,尽管提示词工程能够引导AI产生令人印象深刻的输出,但这并不等同于AI具有真正的理解能力。

他们认为,提示词工程只是一种巧妙的输入编排,它掩盖了AI在深层次理解上的不足。

图片

职业发展的不确定性

在硅谷等科技创新的前沿地带,提示词工程师的需求或许存在,但在整个行业中,这一职业的知名度和认可度相对较低。

这引发了人们对于提示词工程职业发展前景的质疑,一些人担心它可能只是一种短暂的风潮,类似于“ESG(低碳管理) 工程师”。

媒体炒作与现实的差距

媒体对提示词工程的报道往往在赞扬其创新性和潜力的同时,也放大了其成功案例,而对其局限性则关注不足。

这种报道方式导致了公众对提示词工程的期望与实际能力之间的巨大落差,进而可能引发失望和怀疑。

自动化提示的崛起

随着自动化工具的发展,提示词工程面临了另一种挑战。

如 NeuroPrompt等工具,已经实现了在文生图领域超越人类提示词能力的输出效果。

这些工具能够通过迭代过程自动找到最优的提示词,这不仅提高了效率,而且在很多情况下,它们的表现甚至超过了人类工程师的成果。

图片

提示词工程的可扩展性与标准化

其次,提示词工程在可扩展性和标准化方面面临挑战。

在不同应用中扩展提示词工程的可行性和确保其输出的可复制性和标准化方面,挑战依然很大。

比如,你在医疗场景下定义了一套用于撰写病历的提示词,在第一次、第二次,甚至第十次使用时都达到了较好的输出内容质量和匹配度。

但是,你依然无法保证第 11 次是否可以输出和前十次一样高质量的内容。甚至在你使用了 RAG 技术,去限定 embadding 的语料的情况下,依然无法保证。

你无法保证每次每次输出的可复制性,更无法保证标准化。这取决于大模型的黑盒机制,用户无法直接干预模型输出的多样性。

当然,我们可以把“浓度”调低,甚至接近为 0。但是,生成式 ai 的意义又在哪?

对控制的需求与自动化的矛盾

尽管人类渴望控制,但随着AI模型变得更加先进,它们将越来越多地能够在没有我们提示的情况下做事。

这种矛盾表明,提示词工程可能需要重新定义其在自动化世界中的角色。

没有办法,总得面对

尽管面临诸多挑战,但提示词工程的未来并非一片黯淡。

随着AI技术的不断进步,对能够高效编写和优化提示词的需求可能会增加。

提示词工程可能不会作为一个独立的职业存在,但其核心技能——理解并引导AI行为的能力——将继续是AI领域中的宝贵资产。

PART3 提示词工程的展望与转型

在人工智能(AI)的不断演进中,提示词工程正迎来其发展的新阶段。

在这个过程中,自动化的兴起、教育的重要性、伦理的考量、跨学科的合作以及技术迭代的适应性,都将成为塑造这一领域未来的关键因素。

自动化与人类创造力的结合

自动化提示生成工具的出现,如Rick Batlle和Teja Gollapudi在VMware的研究所示,“自动调谐(auto tune) 提示工具,已经体现了超越提示词工程师的能力”。

这些工具能够自动迭代并优化提示词,有时甚至超越了人类工程师的能力。

图片

然而,正如Batlle所指出的,“算法吐出来的最佳提示是如此的奇怪,没有一个人类可能会想出它们”。

这意味着未来的提示词工程可能更多地涉及与自动化系统的协作,而不是单方面的任务执行。

伦理考量与社会责任

随着AI在社会中的作用不断增强,提示词工程的伦理问题也日益凸显。

从可扩展性到关于可复制性和标准化的担忧,这要求未来的提示词工程师不仅要是技术专家,还必须是负责任的决策者。

他们需要确保AI系统的输出不仅准确高效,而且公正、透明,并尊重用户隐私。

跨学科的融合与创新

未来的提示词工程将更加强调跨学科的合作。

与认知科学、心理学、社会学等其他学科的紧密合作,将有助于我们更全面地理解AI的影响,并创造出更符合人类需求的智能系统。

认知科学可以帮助我们理解人类思维和学习的过程,这对于设计能够更好地与人类交互的AI系统至关重要。

心理学则可以提供关于人类情感、动机和行为的深刻见解,这些见解可以指导我们设计更富有同理心和适应性的AI。

社会学则关注社会结构、行为和社会变迁,这对于理解AI技术如何影响社会以及如何设计能够促进社会福祉的AI系统具有重要意义。

通过跨学科合作,我们可以从不同角度审视和解决问题,这有助于我们更全面地理解AI的影响,并创造出更符合人类需求的智能系统。

例如,提示词工程师可以与心理学家合作,设计出能够更好地理解用户情感状态并给予适当反馈的AI系统;或者与社会学家合作,确保AI系统的输出不会加剧社会不平等或偏见。

技术迭代的快速适应**

技术的快速迭代要求提示词工程能够迅速适应新的AI模型和工具。

AI模型正在持续迭代,提示词工程师必须保持对新技术的敏感性,并能够快速调整他们的策略和方法。

职业角色的多样化

随着技术的发展,“提示词工程师”这一职业可能会演变成为更加多样化和专业化的角色。

他们可能成为AI系统的策略规划者、伦理监督者,或是在跨学科团队中发挥关键作用的沟通者。

即使在自动化工具的帮助下,对AI行为的理解和控制仍然至关重要。

提示词工程师的工作将更加注重策略和创新,而不仅仅是技术操作

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1804436.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

值类型和引用类型在使用和存储上的区别

使用上的区别 //值类型 int a 10; //引用类型 int[] arr new int[] { 1, 2, 3, 4, 5 };//声明了一个b让其等于之前的a int b a; //声明了一个arr2让其等于之前的arr int[] arr2 arr; Console.WriteLine("a{0},b{1}", a, b); Console.WriteLine("arr[0]{0},…

【JavaEE】Spring Boot 配置文件详解

一.配置文件的相关概念. 配置文件主要用于配置应用程序的行为和属性. Spring Boot的配置文件提供了一种灵活且强大的方式,用于管理应用程序的配置信息。很多项目或框架的配置信息也放在配置文件中: 项目的启动端口.数据库的连接信息(用户名/密码/驱动等的信息).第三…

AI图书推荐:这就是ChatGPT

这本书《这就是ChatGPT》(What Is ChatGPT Doing ... and Why Does It Work )由Stephen Wolfram撰写 全书内容概要如下: **引言与预备知识** - 作者首先表达了对ChatGPT技术突破的兴奋之情,指出这不仅是技术的故事,也是…

Hadoop3:MapReduce源码解读之Map阶段的Job任务提交流程(1)

3、Job工作机制源码解读 用之前wordcount案例进行源码阅读,debug断点打在Job任务提交时 提交任务前,建立客户单连接 如下图,可以看出,只有两个客户端提供者,一个是YarnClient,一个是LocalClient。 显然&a…

ChatTTS 文字生成语言本地模型部署

ChatTTS部署 官方信息 [ChatTTS首页](https://chattts.com/)搭建步骤 1、下载源码 git clone https://github.com/2noise/ChatTTS.git 2、按照环境 pip install torch ChatTTS pip install -r requirements.txt 3、下载模型 git clone https://www.modelscope.cn/pzc163/ch…

ssm610学生社团管理系统+vue【已测试】

前言:👩‍💻 计算机行业的同仁们,大家好!作为专注于Java领域多年的开发者,我非常理解实践案例的重要性。以下是一些我认为有助于提升你们技能的资源: 👩‍💻 SpringBoot…

Hadoop3:MapReduce源码解读之Map阶段的数据输入过程整体概览(0)

一、MapReduce中数据流向 二、MapTask并行度 1、原理概览 数据块:Block是HDFS物理上把数据分成一块一块。数据块是HDFS存储数据单位。 数据切片:数据切片只是在逻辑上对输入进行分片,并不会在磁盘上将其切分成片进行存储。数据切片是MapRed…

ctfshow解题,知识点学习

1.easy_zip(misc) 1)打开环境后是一个压缩包,解压里面有个flag.txt文件需要密码, 2)直接用工具爆破,即可找到密码 2.easy_eval 1)进入题目环境,先进行代码审计 首先说是…

「小明赠书活动」第五期“网安三剑客”套系图书《内网渗透技术》《渗透测试技术》《Web应用安全》

大模型风潮已掀起,各大巨头争相入局,从ChatGPT到Sora,全球的AI应用“卷出了花”。然而,网络安全人员在享受AI技术带来的便捷之余,也不得不面对一系列新兴的安全挑战,无法忽视。 ⭐️ 赠书 - 图书简介 人…

RabbitMQ python第三方库pika应用入门实践

1. RabbitMQ简介 RabbitMQ是一个可靠、高效的开源消息代理服务器,基于AMQP协议。它具备以下特点: 可以支持多种消息协议,如AMQP、STOMP和MQTT等。提供了持久化、可靠性和灵活的路由等功能。支持消息的发布和订阅模式。具备高可用性和可扩展…

From self-attention 2 flash-attention 数学原理与 cuda 实现优化

self attension 是transformer 编码器和解码器中共同的一个计算环节,在整个transformer 网络体系中耗费的算力比例占主导。所以节省self attention 的正向和反向的计算时间,就可以加速 transormer 的训练和推理过程。 1,self attention 的数…

学习笔记——路由网络基础——环回接口(loopback)

6、环回接口(loopback) (1)定义 环回接口(loopback) :是一种虚拟的接口,是一种纯软件性质的虚拟接口,模拟一个单独的网段。 Loopback等于在设备中模拟另外不同的网络,实现不需要物理接口连接设备,依然可以模拟的功能…

MobileNetV4实战:使用 MobileNetV4实现图像分类任务(二)

文章目录 训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度,DP多卡,EMA定义训练和验证函数训练函数验证函数调用训练和验证方法 运行以及结果查看测试完整的代码 在上…

了解Synchronized对象头?

1、对象头的结构 Java对象存储在内存中结构为: 对象头(Header):实例数据(Instance Data):定义类中的成员属性对齐填充字节(Padding):由于HotSpot虚拟机的自…

高通SDX12:Voice Over USB 功能调试

一、功能概述及使用环境 Linux PC 作为上位机,内置 SLIC基于高通 SDX12 平台的设备作为从设备,通过USB连接到 Linux PC 上,在 PC 上枚举 UAC 设备从设备进行 MO/MT Call 时,上位机使用 arecord 进行录音,音频数据通过 USB 传至上位机,上位机停止录音后再使用 aplay 进行播…

经典文献阅读之--Online Monocular Lane Mapping(使用Catmull-Rom样条曲线完成在线单目车道建图)

0. 简介 对于单目摄像头完成SLAM建图这类操作,对于自动驾驶行业非常重要,《Online Monocular Lane Mapping Using Catmull-Rom Spline》介绍了一种仅依靠单个摄像头和里程计生成基于样条的在线单目车道建图方法。我们提出的技术将车道关联过程建模为一个…

【STM32】ucOS-III多任务程序

【STM32】uc/OS-III多任务程序 文章目录 【STM32】uc/OS-III多任务程序STM32F103C8T6移植uC/OS-III基于HAL库超完整详细过程与相关实验实验任务实验过程一、 uC/OS-III源码下载二、 建立STM32CubeMX工程三、 复制uC/OS-III文件到工程文件夹四、 添加工程组件和头文件路径五、修…

【中颖】SH79F9202 串口通信

头文件 uart.h #ifndef UART_H #define UART_H#include "SH79F9202.h" #include "LCD.h" #include "timer2.h" #include "timer5.h" #include "cpu.h" #include "key.h" #include "io.h" #include &qu…

【C++】深入理解decltype和decltype(auto)

深入理解decltype和decltype(auto) 一、decltype语法介绍二、decltype的推导规则1. expr不加括号2. expr加上括号 三、关于decltype的CV属性推导四、 decltype(auto) 的使用 一、decltype语法介绍 decltype关键字是C11新标准引入的关键字,它…

向量数据库是什么?

向量数据库是什么? 随着人工智能和机器学习技术的迅猛发展,向量数据库作为一种新型数据库引起了广泛关注。向量数据库专门用于存储和查询高维向量数据,是在大规模数据检索和相似性搜索领域的重要工具。 向量数据库的定义 向量数据库是一种…