百度世界2024精选公开课:基于地图智能体的导航出行AI应用创新实践

news2025/1/15 13:52:32

11月12日,“百度世界2024”在上海世博中心举行。百度创始人、董事长兼首席执行官李彦宏发表了主题为《应用来了》的演讲。

百度地图也为大家带来了干货满满、精彩纷呈的智能体公开课,由百度地图开放平台技术架构师江畅分享《地图智能体:导航出行领域的AI应用实践指南》。

read-normal-img


地图智能体在技术上是怎么实现的?

01 技术实现路径

百度地图智能体的发布得益于长期技术投资所带来的技术积累红利,依托国内领先的大模型文心一言,拥有学习海量出行信息,洞悉用户交通偏好,并且与业界美团、携程等主流应用广泛合作,内容供给极致丰富。

具体而言,百度地图智能体在理解和规划上,实现了高度口语化用户输入的意图识别,具备多轮理解及反思修复能力,支持模型的长期和短期记忆,包括用户画像和会话信息,以更好地理解用户需求。同时,百度地图不断构建基于海量数据的知识库和工具集合,以支持需求理解和执行动作。

read-normal-img

02 技术架构两大关键环节

一、意图理解

首先是模型选择。永恒的话题是模型尺寸和推理性能的权衡,大尺寸模型,效果好,但推理速度慢,成本也贵,更小尺寸的模型,可以扛住更大的流量,但效果可能没那么好。实际工程架构上,采用混合模型,简单的输入,尽量让小尺寸的模型承接,非常复杂的输入,才会走到更大的模型,来平衡成本和效果。

其次是原子化技能。把百度地图的能力,尽可能地拆解成一个个原子化的API,在意图理解的阶段通过LLM进行拆解和映射,类似大家常说的,把大象装进冰箱分成三步走,把复杂的用户需求分步骤的拆解,让不同技能来承接,最终呈现给用户一个好的结果。

最后是多轮能力。多轮推理的模块,基于对环境的感知和长短期的记忆内容,来实现诸如“帮我找一个附近游玩的地方”,找到故宫后,直接说“那就导航去这儿吧”这样的交互对话能力。

二、知识问答

百度地图把各种数据都做了面向智能体友好的规格处理,这些知识现在可以被大模型所理解,并归纳总结给出合理的答案。

具体来说,当用户问一个问询类的问题后,首先通过问题的相关性检索,从地图知识库里召回关键要素,通常是用户问题相关的多个不同主题的信息,比如营业时间、地点特色等。当抽取出这些多主题信息后,结合原始的问题,利用大模型的强大归纳总结能力,进行最后的归纳、总结,并给出准确的答案。


地图智能体有哪些核心能力?

01 出行指令一张图,听得懂, 可执行

支持基础60+类语音指令,导航行中可见即可说,所有功能皆可语音支持;支持10+种路线定制能力,多途经点路线、定制化路线(描述路名/道路特征的路线)、多意图路线随意组合......只要能描述的路线,都可以规划展示。

02 出行信息一张图, 路上你关心的全都有

支持服务区/拥堵等12类信息问询,也可以做到问山问水等偏兴趣探索的问询需求。

03 旅途好伴侣, 多模态交互, 让出行更有趣

只要给出你想去的地方+游玩时间,即可一键生成出游攻略行程规划;加载文心大模型,所有知识皆可问询,满足泛出行场景的知识诉求。

read-normal-img


地图智能体有哪些使用场景?

01 行前——复杂泛搜以及制定出游攻略

具备针对指定POI的多轮问询能力,例如查找周边充电站后,可继续追问是否支持快充,以及是否24小时营业等信息;根据不同类型多个筛选条件,对周边或指定区域进行检索并推荐结果;通过口语化问询,如查询行程时间、距离、拥堵情况,并根据路线偏好进行推荐。

同时也新上线了行程规划的能力,比如“做一个北京三日游的攻略”,只要给出想去的地方+游玩时间,即可一键生成出游攻略,包括出游地点、路线、时间等相关信息,还附带海量笔记、消费入口供用户参考和调整规划行程。

02 行中——语音指令、路线定制和行中搜点

在基础功能指令上,智能体行中可以对车道级导航开关、播报模式、限行、服务区等语言指令做出响应。

在特色功能上,智能体支持对路线的定制化调整,包括多途径点/走&不走某条路的路线/大路多的路线/红绿灯少的路线/曾经走过的路线/转弯数少路线等。行中搜点——沿途搜、周边搜、以点搜点能力同样也是具备的。

03 行中——信息问询、知识问询

支持导航过程中的一系列诉求,比如服务区/拥堵&动态事件/出入口&收费站/限速/道路/起终点&途经点&ETA/城市位置&天气/电子眼/红绿灯/停车场/诱导方位指引/交规通行性等地图信息随意问询,天级别迭代;还能接受途中问旁边山、水、建筑信息问询,景点的历史典故、游览词等。也包括对POI点的营业时间、位置、历史信息的一系列query。

04 泛地图场景

百度地图通过不断完善地图知识库,基于文心大模型,对地图知识做细化分类,支持开发者、用户对各类千奇百怪、突破想象力的问题,都能给出合理的答案。


开发者如何接入地图智能体?

01 APl接入方案

通过云端交互方式,基于大模型语义理解的API,返回检索、基础算路、未来时问规划等结果。能够帮助企业快速灵活的搭建【出行AI Agent】。

02 SDK接入方案

端上集成大模型语义理解技术的SDK,为企业提供一站式解决方案。接入成本低、开发门槛低,功能升级涉及APP发版。

03 两个技术方案对比

相对而言,SDK接入方案对开发者更友好,开发门槛低,但需要发版,同时地图智能体SDK的能力也在不断扩展中;而API接入方案不需要发版,但开发门槛更高一些,需要自行实现端上的产品形态。建议开发者按需选择。


正如百度创始人、董事长兼首席执行官李彦宏在百度世界2024大会上提出的,“智能体是AI应用的最主流形态,即将迎来它的爆发点。智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大的应用。”

百度地图期待与更多开发者朋友携手,充分释放地图智能体的能力,探索AI应用的无限新可能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2244081.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

sourceInsight常用设置和功能汇总(不断更新)(RGB、高亮、全路径、鼠标、宏、TODO高亮)

文章目录 必开配置设置背景颜色护眼的RGB值?sourceInsight4.0中如何设置选中某个单词以后自动高亮的功能?sourceinsight中输入设置显示全路径? 常用sourceInsight4.0中文乱码怎么解决,注意事项是什么?如何绑定鼠标中键…

[JavaWeb] 尚硅谷JavaWeb课程笔记

1 Tomcat服务器 Tomcat目录结构 bin:该目录下存放的是二进制可执行文件,如果是安装版,那么这个目录下会有两个exe文件:tomcat10.exe、tomcat10w.exe,前者是在控制台下启动Tomcat,后者是弹出GUI窗口启动To…

uniapp开发微信小程序笔记2-开发静态页面(新建页面、内置组件、设置编译模式、样式、SCSS的使用)

前言:本文从新建页面、认识内置组件、设置编译模式、样式、SCSS的使用来逐步形成对微信小程序开发结构的认识 一、新建页面 pages就是放页面代码的文件夹,点击新建页面就可以自动新增页面,并且可以看到pages.json里面也会自动添加该页面的路…

Linux插件zsh(oh-my-zsh)

一、oh-my-zsh基本介绍 oh-my-zsh: https://github.com/ohmyzsh/ohmyzshhttps://github.com/ohmyzsh/ohmyzsh 注意:需要先安装zsh命令,才能安装oh-my-zsh,先测试是否安装了zsh rootserver:/opt # zsh --version zsh 5.8 (x86_6…

第7章硬件测试-7.4 专业实验

7.4 专业实验 7.4.1 EMC测试EMS的测试项目如下。1.静电放电抗扰度(ESD)2.辐射电磁场(80 MHz~1000 MHz)抗扰度(RS)3.电快速瞬变/脉冲群抗扰度4.浪涌(雷击)抗扰度5.注入电流&#xff0…

H.265流媒体播放器EasyPlayer.js H.264/H.265播放器chrome无法访问更私有的地址是什么原因

EasyPlayer.js H5播放器,是一款能够同时支持HTTP、HTTP-FLV、HLS(m3u8)、WS、WEBRTC、FMP4视频直播与视频点播等多种协议,支持H.264、H.265、AAC、G711A、MP3等多种音视频编码格式,支持MSE、WASM、WebCodec等多种解码方…

5G CPE与4G CPE的主要区别有哪些

什么是CPE? CPE是Customer Premise Equipment(客户前置设备)的缩写,也可称为Customer-side Equipment、End-user Equipment或On-premises Equipment。CPE通常指的是位于用户或客户处的网络设备或终端设备,用于连接用户…

Vue 专属状态管理库Pinia的使用与实践

目录 前言1. 什么是 Pinia?2. Pinia 的安装与基本配置2.1 安装 Pinia2.2 在 Vue 应用中配置 Pinia 3. 使用 Pinia 创建和管理状态3.1 定义一个简单的 Store3.2 在组件中使用 Store 4. Pinia 的高级功能4.1 使用 Getter 简化数据处理4.2 支持异步操作4.3 在服务端渲染…

如何基于Netty手写简单的Tomcat?

如何基于Netty手写简单的Tomcat? 我们最常用的服务器是tomcat ,我们使用tomcat 也主要作为http服务器 。 http协议是基于TCP 协议,换句话说使用socket 或者 NIO编程,只要能正确的解析http报文,然后将结果按照 http 报…

RabbitMQ教程:发布/订阅模式(Publish/Subscribe)(三)

文章目录 RabbitMQ教程:发布/订阅模式(Publish/Subscribe)(三)一、引言二、简介三、准备工作3.1 说明3.2 生成项目 四、实战4.1 交换机(Exchanges)4.2 临时队列(Temporary Queues&am…

金山云Q3调整后EBITDA率提升至9.8% 经营效率和盈利能力强劲增长

11月19日,金山云公布了2024年第三季度业绩。 季度内,公司在收入规模、盈利能力、经营现金流方面都取得了扎实的进展。财报显示,金山云Q3营收18.9亿元,同比回归两位数快速增长,达16.0%;公有云实现收入11.8亿…

Python轴承故障诊断 (19)基于Transformer-BiLSTM的创新诊断模型

往期精彩内容: Python-凯斯西储大学(CWRU)轴承数据解读与分类处理 Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客 Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客 Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客 三十多个开源…

Linux 安装 jdk8

将原有的 JDK 卸载干净(可选) # 查找并显示出系统所有已安装的与 JDK 相关的 rpm 软件包名称 rpm -qa | grep jdk # 删除 jdk rpm -e --nodeps 要卸载的JDK 安装 一、方法一:yum 包管理器安装 1)检索可用包 yum search java |…

ESLint的简单使用(js,ts,vue)

一、ESLint介绍 1.为什么要用ESLint 统一团队编码规范(命名,格式等) 统一语法 减少git不必要的提交 减少低级错误 在编译时检查语法,而不是等js引擎运行时才检查 2.eslint用法 可以手动下载配置 可以通过vue脚手架创建项…

11.19机器学习_逻辑回归

十二 逻辑回归 1.概念 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 逻辑回归一般用于…

数据结构-树状数组专题(2)

一、前言 接上回树状数组专题&#xff08;1&#xff09;&#xff0c;这次主要介绍差分跟树状数组联动实现区间更新 二、我的模板 重新放了一遍&#xff0c;还是提一嘴&#xff0c;注意下标从0开始&#xff0c;区间左闭右开 template <typename T> struct Fenwick {in…

SAM-Med2D 训练完成后boxes_prompt没有生成mask的问题

之前对着这这篇文章去微调SAM_Med2D(windows环境),发现boxes_prompt空空如也。查找了好长时间问题SAM-Med2D 大模型学习笔记&#xff08;续&#xff09;&#xff1a;训练自己数据集_sam训练自己数据集-CSDN博客 今天在看label2image_test.json文件的时候发现了一些端倪: 官方…

从源头保障电力安全:输电线路动态增容与温度监测技术详解

在电力系统中&#xff0c;输电线路是电能传输的关键环节。然而&#xff0c;当导线温度过高时&#xff0c;会加速导线老化&#xff0c;降低绝缘性能&#xff0c;甚至引发短路、火灾等严重事故&#xff0c;对电网安全运行构成巨大威胁。近日&#xff0c;某地区因持续高温和用电负…

第02章 CentOS基本操作

2.文件基本操作【文件操作&#xff08;一&#xff09;】 目标 理解Linux下路径的表示方法能够使用命令(mkdir和touch)在指定位置创建目录和文件能够使用命令(rm)删除指定的目录和文件能够使用命令(ls)列出目录里的文件能够使用命令(cat,head,tail,less,more)查看文件内容理解标…

leetcode400第N位数字

代码 class Solution {public int findNthDigit(int n) {int base 1;//位数int weight 9;//权重while(n>(long)base*weight){//300n-base*weight;base;weight*10;}//n111 base3 weight900;n--;int res (int)Math.pow(10,base-1)n/base;int index n%base;return String…