LBS 开发微课堂|AI向导接口服务:重塑用户的出行体验

news2025/1/27 19:36:29

为了让广大开发者

更深入地了解

百度地图开放平台的

技术能力

轻松掌握满满的

技术干货

更加简单地接入

位置服务

我们特别推出了

“位置服务(LBS)开发微课堂”

系列技术案例

第六期的主题是

《AI向导接口服务的能力与接入方案》

随着地图应用场景的多样化和复杂化,用户对地图服务的需求已经不再局限于简单的路线规划和地点查询,更希望获得一体化、智能化、动态响应的服务支持。

然而传统的地图应用在面对多轮交互、模糊查询和复杂场景等需求时,通常会有操作步骤繁琐、交互体验分散的问题。

因此,百度地图推出了AI向导接口服务,通过深度融合大模型能力和多轮交互技术,重构全场景地图服务。

那么,AI向导接口服务能够带来怎样的用户体验,又是如何实现这些能力的,您的业务适合哪种接入方案呢?

带着这些问题,我们一起来了解一下吧。

1. 能力设计

AI向导接口服务以文心大模型为核心,能力丰富,可以全面满足用户的各类需求。

1.1 用户体验优化

1.1.1 泛化需求,高效满足

目前,很多用户的需求逐渐从单一任务(如导航、查询)向多维度泛化转变。例如,用户可能需要同时解决“找到最近的营业中餐馆”和“规划最快到达路线”这两个问题,这就要求系统具备模糊识别、多任务整合的能力。

AI向导接口服务通过文心大模型驱动,结合高效的Prompt工程和SFT技术,支持多任务的自然语言理解和处理,能够高效满足泛化场景下的用户需求。

1.1.2 一步操作,极致提效

在传统交互设计中,用户需要多步操作才能完成较为复杂的任务(如搜索地点、规划路线、估算时间等)。

而AI向导接口服务通过语义分析和逻辑推理,将多步骤任务整合为一步执行,大幅提升操作效率。例如,用户仅需一句语音命令即可完成路径规划与时间估算。

1.1.3 多轮交互,搜推一体

在很多情况下,用户的真实需求往往是在多轮对话中逐步明确的。传统地图服务无法有效应对这种动态变化的需求,而AI向导接口服务通过多轮语义交互和实时搜索推荐功能,实现了动态需求的精准满足。

例如,当用户询问“附近 30分钟内还开着的烧烤店”,系统可以通过实时筛选与推荐,将搜索与推荐功能无缝结合。

1.1.4 用户友好型交互设计

在设计上重点关注自然语言的可理解性和响应速度,通过语音或文本输入即可完成复杂操作,同时保持界面简洁明了,符合用户习惯。



1.2 技术能力升级

1.2.1 全局优化,模型能力增强

百度地图的AI智能体通过不断改造,优化了3000+个API接口,确保大模型能够准确理解并高效处理用户需求。这种结构化的接口改造不仅提升了语义解析的精度,还增强了模型对复杂需求的响应能力。

1.2.2 支持全场景服务的技术生态

结合向量库和大模型能力,AI向导接口服务能够支持从基础导航到高级搜索的全场景服务。例如,在文心大模型的支持下,系统能够精准识别用户模糊查询的意图,并结合向量化的历史数据匹配,提供最佳解决方案。



2.技术架构

2.1 地图智能体与大模型的结合



2.1.1 通用的LLM优势

通用的LLM优势主要体现在以下三个方面:

  • RAG方案(检索增强生成):让模型从大量数据中找答案。通过接入百度地图的海量数据,比如地点信息(POI)、道路信息、实时路况等,再经过“定制训练”,让模型更懂得用户关于地图的问题,比如“从这里怎么到最近的商场?”这种自然语言提问。

  • Tool方案(工具化接入):把地图的功能做成工具,模型遇到相关问题时,就调用这些工具。将地图API整理成易用的工具,比如回答“从A到B怎么走”这种问题时,直接用地图提供的路线规划工具,而不是让模型“猜”答案,避免出错。

  • 智能体数据飞轮:类似于一种“自我改进的循环系统”。通过记录用户问题和模型的回答,分析回答质量。遇到用户反馈不理想的情况,快速优化模型,让它下次回答更聪明。比如,用户问“哪条路最快”时,系统发现模型答错了,就会调整优化。

2.1.2 多维度接入方案

多维度接入方案是从数据,到Tool,再到Agent的过程。

  1. 通过RAG接入数据,让模型随时查资料。用RAG技术连接百度地图的数据库,遇到用户提问时,模型会先查地图的最新数据,再回答问题。比如,回答“附近有什么好吃的?”会实时查找附近餐馆信息。

  2. 通过Tool扩展能力,用工具让模型变专业。给模型配备工具,比如路线规划、导航等功能,当用户问“开车去公司要多久?”时,模型就可以调用这些工具计算并给出专业答案。

  3. 通过扩展Agent实现接入,用“智能体”协调数据和工具。构建一个智能体(Agent),作为“管家”,负责调度数据(RAG)和工具(Tool),综合起来为用户提供高效的回答或服务。

2.2 智能记忆与指令推理的融合创新

通过SFT & MOE、原子化COT和混合态多轮推理这三种技术相互支持,让地图智能体更加高效、更加智能。

  1. SFT & MOE解决了性能与资源的优化问题,确保不同任务的高效处理。

  2. 原子化COT提供了复杂问题的精细化解决方案,提升了模型的推理能力。

  3. 混合态多轮推理则优化了多轮交互场景下的用户体验,使得系统更具动态适应的能力。

通过上述技术,地图智能体能够满足复杂多变的用户需求,实现从路径规划到个性化推荐的全场景覆盖。

下面,让我们来具体了解一下这三种技术。

2.2.1 SFT & MOE:权衡效果与性能

SFT(指令微调)和MOE(专家模型路由)用于优化模型的性能和资源使用,通过不同规模的模型动态分配任务。

小尺寸模型适用于高效率低成本的场景,而大尺寸模型则处理复杂度更高的任务。中尺寸模型则在性能与效果之间实现平衡。

  • 技术背景:MOE通过智能化路由机制,将任务分配给特定专家模型,避免了统一大模型对所有任务处理时的资源浪费;SFT通过微调适配特定任务场景,使模型更专注于目标问题。

  • 优势

    • 灵活性高:根据任务需求动态调用不同大小的模型,提升资源利用率。

    • 性能优化:小尺寸模型高效处理简单任务,大尺寸模型聚焦复杂推理,实现性能最大化利用。

  • 应用场景

    • 导航路径规划:小模型处理短路径规划,大模型处理跨城市的复杂交通规则匹配。

    • 实时交互:通过快速切换模型,在高效性与高精度之间实现平衡。



2.2.2 原子化COT:理解并编排原子指令

COT(链式推理)通过将复杂任务分解为多个原子化指令,以任务链的形式逐步解决问题。

原子化设计使得模型可以清晰理解任务的每一步,确保结果的准确性和逻辑性。

  • 技术背景:原子化COT的核心是任务分解和逻辑编排,通过细粒度的任务定义,逐步实现复杂场景的语义推理。

  • 优势

    • 可解释性强:每个原子指令清晰明了,便于调试和错误定位。

    • 复杂任务支持:尤其适合跨模块或多条件限制的场景,如导航规则和动态交通状况结合。

  • 应用场景

    • 跨模式导航:处理如“先乘公交到地铁站,再驾车到目的地”的多模式出行规划。

    • 复杂问题回答:如查询“附近不限行的加油站,并导航到最短路径的加油站”。



2.2.3 混合态多轮推理:理解并选择对应的记忆

混合态多轮推理整合了短期记忆、长期记忆和环境感知,能够动态适应多轮交互中变化的用户需求。

通过综合考虑上下文和用户环境,实现精准的推理和结果输出。

  • 技术背景:短期记忆记录当前对话状态,长期记忆保存用户历史偏好,环境感知实时分析用户位置、时间等信息,三者结合形成动态推理能力。

  • 优势

    • 适应性强:能根据用户动态变化的需求调整推理路径。

    • 用户定制化:结合用户的长期行为数据,实现高度个性化的服务。

  • 应用场景

    • 智能助手:处理多轮对话的复杂问题,如“明天上午10点要到机场,现在该几点出发?”

    • 个性化推荐:基于用户长期喜好,推荐符合其习惯的餐馆、路线等。

3. 接入方案

目前,AI向导接口服务提供SDK和云端API两种接入形式,开发者可以根据具体的业务需求进行选择。

3.1 SDK接入

该方案通过接入百度地图SDK实现与地图服务的集成。

语音输入由大模型控制模块解析后,调用百度地图SDK能力进行地图业务适配。本地系统通过SDK直接调起百度地图功能,例如路径规划、导航启动等,实现结果的实时展示。

3.1.1 方案优势

  1. 功能无缝集成:通过百度地图SDK,能够实现快速发起导航、实时路径规划等核心功能,交互流畅。

  2. 实时性强:地图操作(如导航)通过SDK本地化处理,无需依赖网络,确保了功能的快速响应。

  3. 成熟生态支持:依托百度地图的强大功能和丰富API接口,本地开发与功能扩展更为简单。

  4. 用户体验佳:导航图形界面和操作体验高度优化,适合对实时交互有高需求的场景。



3.1.2 适用场景

  1. 适用于具备实时导航的车辆或智能座舱系统。

  2. 对百度地图的现有功能高度依赖的生态系统。



3.1.3 注意事项

  1. 平台依赖性强:只能接入百度地图,无法与其他地图服务无缝对接,限制了系统的灵活性。

  2. 扩展性不足:在未来场景中,若需接入其他地图服务或上下游系统,可能需较大改造。

  3. 地图功能固定:依赖SDK的功能接口,定制化能力有限。

3.2 云端API接入

该方案通过云端API方式接入百度地图大模型服务。

语音输入经过本地解析后,通过厂商座舱服务与云端交互调用百度地图大模型能力生成结果。结果通过本地模块解析并展示,同时地图功能的实时图形化交互由本地HMI完成。

3.2.1 方案优势

  1. 灵活性强:通过云端API,可以接入百度地图或其他地图服务,支持未来扩展。

  2. 跨平台支持:不局限于百度地图,未来能够无缝对接上下游其他地图服务,适合多品牌或多系统兼容需求。

  3. 定制能力强:通过云端大模型解析,支持复杂语义和多轮交互需求,适合需要高度定制的场景。

3.2.2 适用场景

  1. 适用于具备支持多地图服务的智能系统。

  2. 对实时导航需求较低,但复杂语义处理能力要求较高的场景。

  3. 需要与其他业务系统上下游对接的开放型平台。

3.2.3 注意事项

  1. 缺乏实时导航功能:由于本地不支持SDK,实时导航的图形交互体验较弱,用户需依赖其他显示方式。

  2. 网络依赖性高:云端API的调用需要稳定的网络连接,网络环境不佳可能影响交互体验。

  3. 响应速度较慢:与SDK直接调用相比,云端交互的响应速度可能略低。

3.3 接入方案对比

4.效果展示

介绍了这么多,相信大家已经对AI向导接口服务有了一定的了解,那么实际应用的效果是怎么样的呢?让我们一起来看看吧!

效果展示均来自百度地图最新版测试效果。

4.1 泛搜能力

泛搜能力可以满足用户模糊查询与多样化搜索的需求,通过整合多维信息源,提供高度相关的个性化答案,并结合智能引导,营造探索乐趣,让搜索体验更高效。

4.2 检索问询能力

检索问询能力可以全方位覆盖出行场景,包括「行前」、「行中」、「抵达」,所见即可问、所问即可答。

4.3 自由路线规划能力

自由路线规划能力可以实现包含多途经点的路线规划、定制化路线规划(描述路名/道路特征的路线)、多意图路线随意组合等效果。

4.4 私人行程规划能力

私人行程规划能力可以提供基于权威笔记与真实用户行程的出行攻略,满足用户精准行程规划的需求。



目前,AI向导接口服务已经在一些B端厂商的大模型中应用落地。



·END·

你还想了解哪些技术内容?

快来评论区留言告诉我们吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2283135.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql 学习3 SQL语句--整体概述。SQL通用语法;DDL创建数据库,查看当前数据库是那个,删除数据库,使用数据库;查看当前数据库有哪些表

SQL通用语法 SQL语句分类 DDL data definition language : 用来创建数据库,创建表,创建表中的字段,创建索引。因此成为 数据定义语言 DML data manipulation language 有了数据库和表以及字段后,那么我们就需要给这个表中 添加数…

【Bug 记录】el-sub-menu 第一次进入默认不高亮

项目场景: 项目场景:el-sub-menu 第一次进入默认不高亮 问题描述 例如:sub-menu 的 index 后端默认传过来是 number,我们需要手动转为 string,否则会有警告,而且第一次进入 sub-menu 默认不高亮。 解决方…

深入探讨ncnn::Mat类——ncnn中的核心数据结构

最近在学习 ncnn 推理框架,下面整理了 ncnn::Mat 的使用方法。 ncnn作为一个高性能的神经网络推理框架,其核心数据结构ncnn::Mat在数据存储与处理上扮演了至关重要的角色。本文将从基础到高级,详细介绍ncnn::Mat类的各个方面,帮助…

npm:升级自身时报错:EBADENGINE

具体报错信息如下: 1.原因分析 npm和当前的node版本不兼容。 // 当前实际版本: Actual: {"npm":"10.2.4","node":"v20.11.0"}可以通过官网文档查看与自己 node 版本 兼容的是哪一版本的npm,相对应进行更新即可…

ipad和macbook同步zotero文献附件失败的解决办法

背景:我所有的文献及其附件pdf都是在台式机(windows系统),想要把这些文献同步到云上,然后再从云上同步到平板和其他笔记本电脑比如macbook。文献同步虽已成功,但文献附件都无法打开。 平板报错如下&#xf…

【嵌入式】总结——Linux驱动开发(三)

鸽了半年,几乎全忘了,幸亏前面还有两篇总结。出于快速体验嵌入式linux的目的,本篇与前两篇一样,重点在于使用、快速体验,uboot、linux、根文件系统不作深入理解,能用就行。 重新梳理一下脉络,本…

15_业务系统基类

创建脚本 SystemRoot.cs 因为 业务系统基类的子类 会涉及资源加载服务层ResSvc.cs 和 音乐播放服务层AudioSvc.cs 所以在业务系统基类 提取引用资源加载服务层ResSvc.cs 和 音乐播放服务层AudioSvc.cs 并调用单例初始化 using UnityEngine; // 功能 : 业务系统基类 public c…

C语言-构造数据类型

1、构造数据类型 结构体、共用体、枚举。 2、结构体 1、结构体的定义 结构体是一个自定义的复合数据类型,它允许将不同类型的数据组合在一起。 struct 结构体名 {数据类型1 成员变量1;数据类型2 成员变量2;数据类型3 成员变量3;数据类型4 成员变量4; } 2、结构体变…

文档解析:PDF里的复杂表格、少线表格如何还原?

PDF中的复杂表格或少线表格还原通常需要借助专业的工具或在线服务,以下是一些可行的方法: 方法一:使用在线PDF转换工具 方法二:使用桌面PDF编辑软件 方法三:通过OCR技术提取表格 方法四:手动重建表格 …

【统计的思想】假设检验(二)

假设检验是根据人为设定的显著水平,对被测对象的总体质量特性进行统计推断的方法。 如果我们通过假设检验否定了零假设,只是说明在设定的显著水平下,零假设成立的概率比较小,并不是说零假设就肯定不成立。如果零假设事实上是成立…

汽车定速巡航

配备定速巡航功能的车型,一般在方向盘附近设有4~6个按键(可能共用键位)。 要设置定速巡航,不仅需要方向盘上的按键,还要油门配合。 设置的一般流程: 开关:类似步枪上的“保险”,按…

MacOS安装Docker battery-historian

文章目录 需求安装battery-historian实测配置国内源相关文章 需求 分析Android电池耗电情况、唤醒、doze状态等都要用battery-historian, 在 MacOS 上安装 battery-historian,可以使用 Docker 进行安装runcare/battery-historian:latest。装完不需要做任…

总线、UART、IIC、SPI

一图流 总线 概念 连接多个部件的信息传输线,是各部件共享的传输介质 类型 片内总线:连接处理器内核和外设的总线,在芯片内部 片外总线:连接芯片和其他芯片或者模块的总线 总线的通信 总线通信的方式 串行通信 数据按位顺序传…

大型齿轮箱健康监测与智能维护系列套件:测试台+故障诊断算法工具箱+齿轮箱智能维护系统平台+案例分析

大型齿轮箱健康监测与智能维护系列套件:测试台故障诊断算法工具箱齿轮箱智能维护系统平台案例分析 大型齿轮箱健康监测与智能维护系列套件:测试台定制、数据测试服务、算法工具箱与算法模型的定制研制服务,以及各类设备故障诊断与健康预诊系…

Yearning开源MySQL SQL审核平台

一款MYSQL SQL语句/查询审计工具,为DBA与开发人员使用. 本地部署,注重隐私,简单高效的MYSQL审计平台。 它可以通过流程审批,实现真实线上环境sql的审核和执行,还可以回滚执行,能够确保线上SQL更新的可靠性…

【MySQL — 数据库增删改查操作】深入解析MySQL的create insert 操作

数据库CRUD操作 1 CRUD简介 CURD是对数据库中的记录进行基本的增删改查操作: 2. Create 新增 语法 INSERT [INTO] table_name[(column [,column] ...)] VALUES(value_list)[,(value_list)] ... # value 后面的列的个数和类型,要和表结构匹配…

推箱子游戏

java小游戏2 一游戏介绍 二图像准备 墙、箱子、人、箱子目的地,人左边、人右边、人上边、人下边 三结构准备 地图是什么,我们把地图想象成一个网格,每个格子就是工人每次移动的步长,也是箱子移动的距离,设置一个二维数…

【Uniapp-Vue3】动态设置页面导航条的样式

1. 动态修改导航条标题 uni.setNavigationBarTitle({ title:"标题名称" }) 点击修改以后顶部导航栏的标题会从“主页”变为“动态标题” 2. 动态修改导航条颜色 uni.setNavigationBarColor({ backgroundColor:"颜色" }) 3. 动态添加导航加载动画 // 添加加…

pytest执行报错:found no collectors

今天在尝试使用pytest运行用例的时候出现报错:found no collectors;从两个方向进行排查,一是看文件名和函数名是不是符合规范,命名要是"test_*"格式;二是是否存在修改文件名的情况,如果修改过文件…

QT6 + CMAKE编译OPENCV3.9

参考文档 [1] https://blog.csdn.net/rjkf_css/article/details/135676077 前提条件 配置好相关运行环境:QT6、OPENCV3.9的sources文件 OPENCV下载网页:https://opencv.org/releases/ QT6下载教程:https://blog.csdn.net/caoshangpa/article…