使用 BigQuery Omni,发现跨云地理空间分析的优势

news2024/9/29 19:17:30

本文由 Cloud Ace 整理发布。Cloud Ace 是谷歌云全球战略合作伙伴,拥有 300 多名工程师,也是谷歌最高级别合作伙伴,多次获得 Google Cloud 合作伙伴奖。作为谷歌托管服务商,我们提供谷歌云谷歌地图谷歌办公套件谷歌云认证培训服务。】

随着我们越来越依赖技术来做出决策,地理空间数据变得比以往任何时候都更重要。它是一种强大的资源,可用于解决各种问题,如跟踪物流、识别感兴趣的区域和潜在的灾难区域。

地理空间数据将数据与地理成分结合,例如纬度和经度坐标、地址、邮编或地名,并且可以从各种来源获取,包括卫星、传感器和调查,这使其成为一种非常强大的工具广泛的应用。

Google Cloud 的无服务器企业数据仓库 BigQuery 的主要功能之一是其分析地理空间数据的能力。然而,地理空间数据通常位于各种公共云中,而不仅是谷歌云。为了有效地访问,您需要一个多云分析解决方案,让您能够利用每个云平台的独特功能,同时从跨多个云平台的数据中提取见解和价值。

BigQuery Omni 是一种多云分析解决方案,可以分析跨公共云环境(包括 Google Cloud、Amazon Web Services (AWS) 和 Microsoft Azure)存储的数据,而无需传输数据。

借助 BigQuery Omni,用户可以使用用于分析 Google Cloud 中的数据的相同 SQL 查询和工具来分析其他云中的数据,从而更轻松地从所有数据中获取见解,无论存储位置如何。对于使用多个云的企业来说,BigQuery Omni 是统一分析和优化数据价值的出色工具。

 BigQuery Omni 架构

借助 BigQuery Omni,组织可以分析基于位置的信息或地理组成部分,例如纬度和经度坐标、地址、邮政编码或地名,甚至无需将数据复制到 Google Cloud。例如,您可以使用 BigQuery Omni 分析来自送货车队的数据,以跟踪其位置并识别潜在问题。

BigQuery Omni 和地理空间数据分析

如果您正在处理地理空间数据,BigQuery Omni 是一款功能强大的工具,可以帮助您从数据中获取见解。它具有可扩展性、可靠且安全,使其成为统一分析和充分利用数据的绝佳选择。 

以下是组织使用 BigQuery Omni 处理地理空间数据的一些示例:

  • 零售公司可以使用 BigQuery Omni 分析来自其销售点系统的数据,以跟踪客户行为并识别趋势。

  • 运输公司可以使用 BigQuery Omni 分析车辆中 GPS 传感器的数据,以跟踪车队的移动情况并识别潜在问题。

  • 政府机构可以使用 BigQuery Omni 分析来自天气传感器的数据,以跟踪风暴的移动并识别有洪水风险的区域。

BigQuery Omni 和地理空间数据可以结合使用,以深入了解各种业务问题。

具体来说,使用 BigQuery Omni 和地理空间数据的一些优势包括:

  • 访问高质量的地理空间数据:BigQuery 支持加载以换行符分隔的 GeoJSON 文件,并为加载和查询地理空间数据提供内置支持。来自公共数据源(例如 BigQuery 公共数据集、Earth Engine 目录和美国地质调查局 (USGS))的数据可以轻松集成到您的 BigQuery 环境中。

    Earth Engine 有一个集成的数据目录,其中包含全面的分析就绪数据集,包括卫星图像和气候数据。该数据可以与 SAP、Oracle、Esri ArcGIS Server、Carto 和 QGIS 等专有数据源相结合。

  • 地理空间数据的加载和预处理:BigQuery 内置支持加载和查询地理空间数据类型,您可以使用 FME Spatial ETL 等合作伙伴解决方案来加载数据。

  • 使用不同的地理空间数据类型和格式:BigQuery 支持多种文件类型和格式,包括 WKT、WKB、CSV 和 GeoJSON。

  • 坐标参考系统:BigQuery 的地理数据类型是全球一致的。这意味着您的数据已注册到 WGS84 参考系统,并且您的分析可以跨越一个城市街区或多个大陆。

总体而言,BigQuery Omni 的地理空间分析提供了广泛的技术功能来处理和分析地理空间数据,使其成为需要处理基于位置的数据的企业的强大工具。

使用 BigQuery Omni 分析地理空间数据

想象一下,一家零售商拥有一家大型连锁百货商店,其门店遍布全国。他们正在寻求扩大业务并希望确定具有高销售潜力的领域。他们希望有一种方法可以更好地了解特定地理范围内的销售量。为了实现这一目标,零售商求助于 BigQuery 中内置的 GIS(地理信息系统)功能。以下是零售商分析该数据集所采取的步骤:

步骤 1:AWS S3 上的初始订单数据集包含554 万行,并在 AWS S3 上具有单独的位置(300 行)和邮政编码(33144 行)元数据文件。

订购镶木地板文件:

 位置和邮政编码文件:

 步骤 2:零售商使用 BigQuery Omni 在 AWS 中存储的数据和 BigQuery 之间建立连接,使他们能够从外部访问 S3 数据集。

AWS 的外部连接

 订单外部表

 位置外部表

 邮政编码外部表

 第 3 步:他们使用 BigQuery Omni 合并订单和位置数据集,并在 AWS 上远程聚合数据。将此数据集与地理空间数据集连接有助于他们导出地理空间坐标。

最终聚合数据集减少至 23 行。随后,他们带回仅包含 23 行的结果数据集。这有助于他们将地理空间分析中提取的数百万行减少到仅 23 行。

Select sales.store_city store_city,

sales.number_of_sales_last_10_mins number_of_sales_last_10_mins,

sales.store_zip store_zip,

 ST_GeogPoint(zip_lat_lng.longitude ,

   zip_lat_lng.latitude  ) geo

FROM (

 SELECT

   FORMAT_DATETIME("%X",

     CURRENT_DATETIME("America/Los_Angeles")) current_time,

   MAX(DATETIME(time_of_sale,

       "America/Los_Angeles")) time_of_last_sale,

   COUNT(1) number_of_sales_last_10_mins,

   locations.city store_city,

   locations.zip store_zip

 FROM

   `bqomni-blog.aws_locations.orders_small`  sales

 JOIN

   `bqomni-blog.aws_locations.locations` locations

 ON

   sales.store_id = locations.id

 GROUP BY

   locations.city,

   locations.zip ) sales

JOIN

   `bqomni-blog.aws_locations.zipcode` zip_lat_lng

ON

 cast(sales.store_zip as INT) = cast(zip_lat_lng.zipcode as INT)

 WHERE ST_WITHIN( ST_GeogPoint(zip_lat_lng.longitude , zip_lat_lng.latitude  ) ,ST_GeogFromText(zip_lat_lng.zipcode_geom ) )

 AND zip_lat_lng.state_name  = "New York"

 ORDER BY number_of_sales_last_10_mins

按地区汇总销售数据

 为了构建更丰富的销量数据视图,该零售商使用 BigQuery GeoViz 集成,这是一个功能强大的工具,可以在地图上可视化地理数据。

BigQuery Geo Viz 是一个 Web 工具,用于使用 Google Maps API 在 BigQuery 中可视化地理空间数据。您可以运行 SQL 查询并在交互式地图上显示结果:

 

用于销售数据分析的 BigQuery Geo 视图

有了地理标记数据,零售商现在可以查看区域销量、销售密度、按时间划分的部门分布以及部门内的分布,所有这些都通过 BigQuery 提供支持。

 卫星视图

 使用 BigQuery Omni 的好处

除了地理空间分析,BigQuery Omni 还提供许多优势,包括:

降低成本:BigQuery Omni 消除云之间数据传输的能力可以帮助组织降低成本并简化数据管理,使其成为多云分析的宝贵工具。此外,跨多个云访问和分析数据的能力可以减少数据复制和同步的需求,从而可以进一步简化 ETL 流程并提高数据一致性。

统一治理:BigQuery Omni 使用与 BigQuery 相同的安全控制,其中包括加密、访问控制和审核日志等功能,以帮助保护数据免遭未经授权的访问。

单一分析窗格:BigQuery Omni 提供用于跨所有三个云查询数据的单一界面,这可以简化数据分析过程并减少组织使用多个分析工具的需要。

灵活性:分析存储在任何受支持的云存储服务中的数据,使组织能够灵活地处理他们拥有的数据,无论数据位于何处。

总而言之,BigQuery Omni 是地理空间分析的一个有价值的工具,因为它允许您分析多个来源的数据,而无需移动数据。这可以节省您的时间和金钱,还可以帮助您从数据中获得更准确的见解。

如果您正在寻找一种提高业务准确性、效率和决策的方法,请使用 BigQuery Omni 进行分析地理空间数据可以成为一个强大的工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/670733.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第十章详解synchronized锁升级

文章目录 升级的流程为什么要引入锁升级这套流程多线程访问情况具体流程 轻量级锁如何使用CAS实现轻量级锁CAS加锁成功CAS加锁失败CAS进行解锁 总结何时变为重量级锁 锁膨胀自旋优化 偏向锁主要作用偏向状态测试撤销偏向锁 撤销 - 调用对象 hashCode撤销 - 其它线程使用对象撤销…

js:codemirror实现在线代码编辑器代码高亮显示

CodeMirror is a versatile text editor implemented in JavaScript for the browser. It is specialized for editing code, and comes with a number of language modes and addons that implement more advanced editing functionality. 译文:CodeMirror是一个多…

第二章:软件工程师必备的网络基础

目录 一、网线的制作 二、集线器、交换机介绍 三、路由器的配置 一、网线的制作 1.1、水晶头 ​​​ 1.2、网线钳 1.3、网线的标准 T568A标准(交叉线): 适用链接场合:电脑-电脑、交换机-交换机、集线器-集线器 接线顺序&…

【正点原子STM32连载】第三十九章 触摸屏实验 摘自【正点原子】STM32F103 战舰开发指南V1.2

1)实验平台:正点原子stm32f103战舰开发板V4 2)平台购买地址:https://detail.tmall.com/item.htm?id609294757420 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html# 第三…

有源电力滤波器及配电能效平台在污水处理厂中的应用

【摘要】为减少污水处理设备产生的各次谐波,通过确定主要谐波源,检测和计算谐波分量,采用有源电力滤波器进行谐波治理,大幅降低了电力系统中的三相电流畸变率,提高了电能质量;抑制了谐波分量,减…

doris docker部署和本地化部署 1.2.4.1版本

写在前面 以下操作语句按顺序执行即可,注意切换目录的命令一定记得执行,如果需要改动的地方会有${}注释,其余不需要任何改动,默认安装版本为1.12.4(稳定版) 本地化部署 下载 # 创建目录 mkdir /data/sof…

软件测试日常工作和前景是怎么样的?

笔者从测试的工作情况,职业发展,还有测试的工作日常等等来给大家讲解一下软件测试到底是什么样的工作? 通俗来说软件测试工程师就相当于一个质检员,专门处理软件测试质量的工作,不管是功能测试也好,性能测…

BK7231N开发平台原厂烧录工具使用说明

BK7231N开发平台原厂烧录工具使用说明 烧录流程介绍 1.打开原厂烧录工具 以管理员身份打开名为 bk_writer_gui_V1.6.3.exe 的可执行文件。 2. 烧录对象 烧录对象选择 BK7231n 3.烧录地址 当我们烧录UA文件的时候,需要把起始地址设置为: 0X00011000。…

Windows提示“找不到rgss202j.dll”怎么办?

Rgss202j.dll文件是Windows操作系统最重要的系统文件之一,它包含了一组程序和驱动函数。如果此文件丢失或损坏,驱动程序将无法正常工作,并且相应的应用程序也将无法正常启动且运行。通常情况下,造成Rgss202j.dll文件无法找到的原因…

爬虫 - ProtoBuf 协议

一、抓取请求 以下是请求的大致内容: 是乱码,需要解析。 二、解析 通过分析 request 和 response 的 Content-Type: application/x-protobuf 得知:使用了谷歌的 protobuf 协议来传输数据,需要破解。 大致破解过程&#xff…

随时随地保持连接:数字游民适用的远程桌面

随着世界迅速适应数字革命,一种全新的职业——数字游民应运而生。数字游民指利用技术远程办公的专业人群,这是一种允许人们在旅行中办公、不受地点限制的工作生活方式。游牧式工作生活趋势并非一时的风尚,而是我们工作观念的彻底转变&#xf…

MUR8060PT-ASEMI快恢复二极管MUR8060PT

编辑-Z MUR8060PT在TO-247封装里采用的2个芯片,其尺寸都是140MIL,是一款高耐压大电流快恢复二极管。MUR8060PT的浪涌电流Ifsm为600A,漏电流(Ir)为10uA,其工作时耐温度范围为-55~150摄氏度。MUR8060PT采用抗冲击硅芯片材质&#x…

实在智能率先拥抱大模型技术,旗下“AI+RPA”系列产品迎来全面智能升级

实在智能RPA ​ AI时代,所有产品都将迎来用大模型进行全面智能升级。 随着以ChatGPT等为代表的生成式AI持续火热,大型语言模型(Large Language Model, LLM)领域的研发和布局在国内外有目共睹,微软、谷歌、百度系等生…

回收小程序是什么?有什么特点?

回收小程序旨在为用户提供便捷、环保的废品回收服务。以下是关于上门回收小程序的介绍:回收小程序旨在解决废品回收的难题,为用户提供一种方便、可持续的回收方式。通过小程序,可以轻松预约回收服务,将废品交由专业回收人员处理&a…

基于QFT的量子加法器的原理与实现-mindspore quantum

1 量子Fourier变换 离散Fourier变换以一一个复向量 x 0 , . . . , x N − 1 {x_0},...,{x_{N - 1}} x0​,...,xN−1​为输入,输出的数据是如下复向量 y 0 , . . . , y N − 1 {y_0},...,{y_{N - 1}} y0​,...,yN−1​: y k ≡ 1 N ∑ j 0 N − 1 x j …

【初识C语言】变量和常量

文章目录 1. 局部变量和全局变量2. 变量的作用域和生命周期3. 常量 生活中的有些值是不变的(比如:圆周率,性别,身份证号码,血型等等)有些值是可变的(比如:年龄,体重&…

18款奔驰S450 4MATIC升级发光出风口,提升车内氛围感

完美匹配,全部都是原装位,安装很快,瞬间发光。随着氛围灯颜色的变化而变化。美丽靓丽与质感同存,大大提升了车的颜值档次。让您车生活更加的富有乐趣与满足!

决策树笔记

决策树模型学习过程 1.根节点选择什么特征 2.只关注决策树的左侧分支 3.再关注右侧分支 纯度 熵就是样本的混乱程度,熵越大,越混乱,纯度就越低 减小熵信息增益 选择拆分信息增益 选择信息增益大的,以增加纯度 p1left 定义为…

2023年功能测试会被淘汰?自动化测试到测试开发?我的测试之路...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 现在2023年&#…

数据技术在金融行业有哪些应用_光点科技

随着信息技术的迅猛发展,大数据技术逐渐成为金融行业的重要工具。大数据技术的应用,不仅可以提高金融机构的运营效率,还能够提供更准确的风险评估和预测,从而为投资者和决策者提供更好的决策依据。 那么,大数据技术在…