听,LLM在“说话“:智慧农场开启农业知识传播新范式

news2024/9/27 9:19:16

( 于景鑫 国家农业信息化工程技术研究中心)设施农业是现代农业的旗舰,集成了环境调控、水肥管理、植保防疫等多项先进技术。据统计,目前全国现代设施种植面积达到4000万亩,效率高、产出高、效益高的特点明显。北方地区每亩蔬菜日光温室年均纯收入3.6万元左右。设施蔬菜每年仅生产环节需用工2000万人,产前产后服务环节还能带动大量就业。然而,在设施农业快速发展的背后,是农业科技推广的困境。受地域、人员等限制,先进生产技术难以高效传播,农户迫切需要便捷获取专业知识的新途径。人工智能的发展为破解这一难题带来了转机。以大语言模型(LLM)为代表的自然语言处理技术,正以其强大的知识理解、获取和表达能力,为知识传播开辟新的可能。本文将从LLM的技术原理出发,探寻其在设施农业知识服务中的创新应用,展望人工智能重塑农业知识图景的未来图景。
acdd9501bbb664b298dbc282dab7cf2e.jpeg

图片来源:CSDN

一、LLM:知识表征新范式
大语言模型是近年来NLP领域的重磅炸弹。有别于传统的词袋模型和浅层神经网络,LLM采用Transformer架构,通过自注意力机制建模海量文本数据,学习词语、句法和语义的深层关联。Transformer的核心是多头自注意力机制,通过Query、Key、Value三个矩阵,计算词语间的相关性。多个注意力头并行计算,捕捉不同纬度的语义依赖。残差连接将输入与输出直接相加,保证了梯度的有效传播。前馈神经网络进一步提取高阶特征。编码器和解码器的堆叠,最终建立起输入文本到输出文本的端到端映射。
从ELMO、BERT到GPT-3、PaLM,LLM的规模不断扩大。当前最大的LLM已包含上千亿参数,在万亿 Token 量级的语料上训练而成。海量语料赋予了LLM百科全书式的知识储备,强大的语言建模能力使其具备了知识获取、推理、生成等多维技能。这意味着,我们可以与LLM进行自然流畅的对话,从词句中提取结构化知识,回答开放域问题,生成切题的文章和摘要。LLM正成为通向通用人工智能的桥梁,为知识密集型产业注入新动能。
8cbd8f537b3ef866c5b51a1d23e1e05e.jpeg

图片来源:GitCode

二、LLM赋能设施农业知识图景再构筑
设施农业是知识与技术的结晶。然而,当前的知识传播方式难以跟上设施农业的发展步伐。传统的现场培训、电视广播等,受众面窄、更新慢,难以触达广大农户。而搜索引擎虽然便捷,但检索结果泛化严重,难以解决农户的具体问题。
LLM为设施农业知识传播提供了新的思路。首先,LLM可作为知识库问答的新引擎。不同于传统的基于关键词匹配的方式,LLM可对用户问题进行语义理解,结合背景知识进行多步推理,生成简明扼要的答案。以番茄种植为例,农户询问"番茄叶片发黄卷曲是什么原因"时,LLM不仅能检索出相关病症,还能根据温室环境、植株症状,判断是否由于钙镁元素缺乏导致的生理性卷叶,给出"适当补充钙镁肥,可有效改善"的专业建议。
其次,LLM让农业技术文档自动生成成为可能。农业生产中,各类标准规程、操作手册浩如烟海。传统的文档撰写费时费力,更新滞后。LLM可根据设施农业知识库,学习技术文档的语言风格和写作逻辑,实现从结构化知识到非结构化文本的自动转换。技术人员只需输入文档提纲,LLM即可智能续写每个章节,大幅提升文档编撰效率。
LLM的对话生成能力,也为设施农业知识传播开辟了新局面。传统的对话系统依赖预定义的对话流程和模板,只能进行有限的结构化交互。而LLM通过端到端学习,建立起自然语言到对话行为的直接映射。农户可与智能助理开展轻松愉悦的多轮对话,知无不言。系统还可根据农户的提问,主动追问缺失的语境信息,甄别核心意图,做到因人而异、因时而变的个性化知识推送,真正打通专家与农户的鸿沟。
bf2ab97c8093f6b06a8151bb8a03b5ed.jpeg

图片来源:LLM Farmkey平台

三、垂直领域LLM的技术创新
尽管LLM展现了惊人的能力,但要真正应用于设施农业知识服务,仍需经过垂直领域适配。这主要包括两大方面:知识源构建和模型微调。
知识源构建是领域LLM的根基。通用LLM虽然涵盖了海量网络文本,但对于农业这样的专业领域,覆盖的知识仍显粗浅。为此,我们需要汇聚权威机构的科研成果、实践案例,构建全面精准的农业知识库。知识库通常采用本体和知识图谱的形式,以概念、实例、关系三元组刻画领域知识。利用本体构建工具,我们可将农业专家的显性知识形式化,如使用protege构建"番茄-病虫害-防治"本体。近年来,知识图谱自动构建技术不断进步。以ERNIE 3.0为代表的知识增强型预训练模型,可从文本中自主学习概念、实例,识别上下文蕴含的语义关系,实现农业知识的自动抽取、链接、推理。持续学习机制让 LLM 可终身吸纳新知,与农业知识库协同演化。
在海量农业语料和知识库的支撑下,LLM需要经过模型微调,以适应垂直领域任务。一方面,我们可采用BERT等模型在农业语料上进行再预训练,学习农业领域的词汇、语法和语义。再通过掩码语言建模、下一句预测等任务,增强LLM对农业知识的记忆和理解。另一方面,针对农业问答、对话、文档生成等下游任务,需要在少量标注数据上对LLM进行微调。GPT-3的InstructGPT、T5的多任务前缀训练等,为如何将特定任务知识嵌入预训练模型提供了新思路。我们可以设计一系列农业指令,如"根据病虫害症状,判断可能的原因"、"就温室大棚温度调控,生成一段操作说明",引导模型学会将通用知识运用到具体农业场景中。结合人类反馈信号,LLM可不断自我迭代,向更加智能化的个性化知识助手迈进。
19819884cdc9f14fa8121e85744dd303.jpeg

图片来源:文心一言

四、面向LLM的智慧农场知识服务架构
LLM赋能的农业知识服务,离不开一个全栈式的软件架构。借鉴智慧城市、智慧医疗的实践,我们提出一个面向LLM的智慧农场知识服务架构。该架构可分为四层:数据层、算法层、服务层和应用层。
数据层是LLM的fuel。它通过物联网、数据库、爬虫引擎等,持续采集和更新海量数据。对于结构化数据如传感器监测值,要经过清洗、集成,转化为统一的表征形式。对于非结构化数据如科研论文、病虫害诊断记录,则交由算法层进行知识抽取。数据治理组件负责元数据管理、数据血缘追踪、访问权限控制等,确保数据自由流动又不失安全。
算法层是LLM的brain。它以预训练模型为基石,通过持续学习农业本体和文本数据,建立起问题、对话、文档的端到端生成能力。针对知识库问答,知识库问答组件将用户自然语言问题,变换为三元组检索语句,高效匹配知识库。针对对话交互,多轮对话组件跟踪对话历史,在已有对话基础上生成下一句自然回复。针对技术文档生成,文档生成组件引入提示工程、思维链等人工智能创作技术,在文档大纲与LLM协同下撰写技术文稿。同时,算法层以向量索引、知识蒸馏等优化技术,保障LLM在海量知识下的高效响应。
服务层是LLM的hub。它通过知识服务总线,将LLM的能力封装为标准化的API和微服务。知识库问答、对话交互、文档生成等LLM应用均以容器化方式部署,可灵活调度和弹性伸缩。服务编排流程定义了服务间的调用关系,数据流转规则,异常处理机制。服务管理平台提供了可视化的服务监控、日志分析、性能诊断等工具,助力LLM应用的持续集成、持续交付。
应用层是LLM的face。它借助小程序、H5、APP等轻量化的交互方式,将LLM的服务能力开放给广大农户和农技人员。除了传统的图文界面,我们还可利用AR/VR等沉浸式技术,打造身临其境的知识传播体验。用户在虚拟农场中漫游时,可口头提问,与智慧助理"面对面"对话,调取病虫害3D模型观察。知识变得直观可感,唾手可得。应用层的数字人组件,还可为LLM赋予拟真的虚拟形象,提升交互的趣味性和信任感。应用运营平台聚焦用户全域运营,持续捕捉用户行为数据,优化知识推送策略。
5cd6fd27a03373059c9b5ef9a413014a.jpeg五、畅想智慧农业的未来知识图景
LLM为农业知识服务开启了一扇新窗。但单点智能提升,并不足以匹配智慧农业的宏伟蓝图。农业生产体系错综复杂,涉及环境感知、生长监测、品质管控等诸多要素。唯有多技术协同,多场景融合,才能真正做到农事操作、农时决策与农业知识的无缝链接。

92d6e5ffcceb76b1401a6fb63ea22a3e.jpeg 未来,LLM、物联网、区块链、元宇宙等新兴技术将交织一张农业数字化的大网。LLM搭建起农户与机器间的语言桥梁。物联网将农田装备、环境设施数字化,源源不断地为LLM供给真实世界的感知数据。区块链构筑农产品溯源体系,让每一粒种子、每一个作物的生长轨迹都上链存证,成为可信的知识来源。元宇宙平台再现一个"数字孪生"的虚拟农场。农户化身虚拟农场主,在栩栩如生的三维场景中感知作物长势,操控农机设备,体验前沿种植技术。LLM则作为各技术间的粘合剂,通过对产业数据和农户行为的理解,将生产实践转化为可学习、可优化的知识要素。这个数字孪生的农场,本身就是一个持续进化的知识引擎。每一寸土地、每一株作物都在书写生长奥秘,传递优质高产的信号。而这些信号又反哺LLM,助其掌握更加本真、更加复杂的农业知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1981121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

十大免费录屏软件推荐:轻松录制高清视频教程

现在视频教程已经成为知识分享、教学演示以及内容创作的重要形式,无论是在线教育、游戏直播还是软件操作指导,高清、流畅的录屏软件都是我们不可获取的工具之一。 但目前市面上有很多录屏软件,哪款才是适合我们的呢?今天就给大家…

前端(vue3)和后端(django)的交互

vue3中&#xff1a; <template><div><h2>注册页面</h2><form submit.prevent"submitForm"><label for"username">用户名&#xff1a;</label><input type"text" id"username" v-model…

C++威力强大的助手 --- const

Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏&#xff1a; C之旅 const是个奇妙且非比寻常的东西&#xff0c;博主从《Effective C》一书中认识到关于const更深层次的理解&#xff0c;写此博客进行巩固。 &#x…

无人机之运输的优势

无人机在进行运输任务时使用的是电力驱动&#xff0c;从而可以减少对环境的污染和碳排放&#xff0c;对于改善大气质量和减少碳足迹具有积极的意义。 无人机运输可以避免人为错误和事故的发生&#xff0c;通过预先设定的飞行路线&#xff0c;进行精确点投放。此外&#xff0c;还…

零基础小白备考PMP需要多长时间?

PMP考试在中国大陆&#xff0c;平均每三个月安排一次考试。报名缴费一般在考试前两个月&#xff0c;报完名后开始进入备考&#xff0c;所以基本上是2-3个月的时间。 PMP考试备考不是越久越好&#xff0c;把备考战线拉得太长 &#xff0c;我们的精力都是有限的&#xff0c;后期…

学习HTTP2中的HPACK算法

文章目录 HPACK动态表中的数据插入点两种基本数据类型 Integer String HPACK 专业术语&#xff1a; Header Field&#xff08;头部字段&#xff09;&#xff1a;指的是一个由name - value组成的键值对。名称和值都被视为不透明的字节序列。Dynamic Table&#xff08;动态表&a…

哪个软件可以识别字幕并生成文本?5款最佳工具分享

你是否曾在深夜&#xff0c;抱着手机或电脑&#xff0c;对着那些充满异国情调却无从下手的外语视频感到束手无策&#xff1f; 那些或激昂、或深情、或幽默的对话&#xff0c;因为语言的隔阂而变得遥不可及&#xff0c;让你的观看体验大打折扣。 别急&#xff0c;今天我来告诉你…

AI绘画进阶 ComfyUI 实战教程:轻松给图片添加文字,附工作流教程使用

大家好&#xff0c;我是设计师阿威 在AI绘画中书写文字一直是个老大难的问题&#xff0c;直到SDXL的出现&#xff0c;文字生成才迎来转机&#xff0c;可以在提示词中指定一些英文字符&#xff0c;不过也是经常出错&#xff0c;生成中文就更加不可求了。 本文介绍一种在图片中…

2018-Comment-网鼎杯复现,二次注入

进入靶场 发现只有一个发帖功能&#xff0c;尝试发帖 提交后要去登录&#xff0c;但这里提示了账号密码&#xff0c;但密码后三位不知&#xff0c;可以尝试暴力破解 bp抓包 假设后三位是数字&#xff0c;设置payload 爆破成功&#xff0c;后三位为666 登录成功 但除了发帖没有…

安泰电压放大器放大的是什么信号

电压放大器是一种广泛应用于电子设备中的放大器&#xff0c;它主要用于放大电压信号。电压信号是指以电压形式传输的信号&#xff0c;可以是来自于传感器、音频设备、无线通信设备等各种电子设备中的信号。 电压放大器的基本原理 电压放大器是一种电子设备&#xff0c;它可以将…

使用idea对spring全家桶的各种项目进行创建

目录 1. 简介2. spring2.1 简介2.2 创建 3. springmvc3.1 介绍3.2 创建 4. springboot4.1 简介4.2 创建&#xff08;仅仅就其中一种&#xff09; 5. 其他&#xff1a;maven6. 参考链接 1. 简介 因为总是分不清spring全家桶&#xff0c;所以就在这里进行一个总结。 2. spring …

Java毕业设计-基于SSM框架的大型商场会员管理系统项目实战(附源码+论文)

大家好&#xff01;我是程序猿老A&#xff0c;感谢您阅读本文&#xff0c;欢迎一键三连哦。 &#x1f49e;当前专栏&#xff1a;Java毕业设计 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; &#x1f380; Python毕业设计 &…

在手机中安装Fiddler CA证书后,完美解决Fiddler无法进行手机HTTPS请求抓包的难题!

Fiddler抓包的通用配置 关与fidder抓取手机包的配置方法就不多说了&#xff0c;网上有很多方式&#xff0c;配置方式如下图&#xff1a; 但是即使成功配置&#xff0c;在抓取手机中https包时也会出错&#xff0c;这个时候&#xff0c;我们就需要在手机中安装Fiddler的 CA证书!…

80.SAP ME - SAP ERP向SAP ME传输物料主数据的方法

目录 SAP ERP与ME传输物料的几种方式 1.自动传输物料到SAP ME 2.手动发送 2.1 BD10 发送物料 2.2 DRFOUT 执行数据复制 2.3 POIM 发送主数据 SAP ERP与ME传输物料的几种方式 1.自动传输物料到SAP ME 这是标准方法&#xff0c;需要全面的配置&#xff0c;当在ERP里修改物…

Powerdesigner连接mysql数据库,逆向工程生成ER图 (保姆级教程:下载->连接->配置)看这一篇就够了

一、下载powerdesigner 下载的教程请看如下链接&#xff0c;我太懒了&#xff0c;直接借鉴&#xff01; 把别大佬的博客搬过来了嘿嘿~我真聪明&#xff01;ㄟ( ▔, ▔ )ㄏ 操作到完成汉化就好&#xff01;&#xff01;第5步不看了&#xff0c;别按那个走&#xff0c;因为新手…

数据获取- 抓住股市脉搏,用Python轻松获取比亚迪股票数据!

Hey小伙伴们&#xff0c;今天给大家带来一个超级实用的项目教程——如何用Python和tushare库来获取比亚迪的股票数据&#xff01;&#x1f31f; &#x1f50d; 项目背景 股市是个充满机遇与挑战的地方&#xff0c;而获取实时准确的股票数据则是每个投资者的基础技能。今天&am…

2024华数杯全国大学生数学建模竞赛B题-VLSI电路单元的自动布局

超大规模集成电路(VLSI&#xff0c;VeryLarge Scale Integration)将大量电路单元集成于单一芯片。随着设计复杂度增加&#xff0c;如今开展VLSI设计已离不开电子设计自动化(EDA&#xff0c;Electronic DesignAutomation)工具的支持。EDA作为算法密集型产业&#xff0c;需要对数…

Python 爬虫入门(七):requests 库的使用「详细介绍」

Python 爬虫入门&#xff08;七&#xff09;&#xff1a;requests 库的使用「详细介绍」 前言1. 初识 requests1.1 安装 requests 库1.2 发送 GET 请求1.3 发送 POST 请求 2. HTTP 请求详解2.1 请求方法2.2 请求头2.3 请求参数 3. 处理响应3.1 响应内容3.2 响应状态码3.3 响应头…

控件的拖拽移动及定时器及画家

定时器时时都在调用 virtual void timerEvent(QTimerEvent *event);//定时器更新函数 timer new QTimer(this);timer->start(1000);connect(timer,&QTimer::timeout,[this](){static int num 0;ui->led1->display(num);if(num10){timer->stop();}}); 画图事…

【杂谈】计算机世界的原理——二进制数和位运算以及各种进制数的表示方法

【杂谈】计算机世界的原理——二进制数和位运算以及各种进制数的表示方法 1.常见位运算符和常用操作2.各种进制数的表示方法 1.常见位运算符和常用操作 大家都知道&#xff0c;计算机中是使用二进制数储存数据的。在这一篇文章&#xff0c;我将会带领大家初步探索二进制数。在后…