数字化时代,如何做好用户体验与应用性能管理​

news2025/4/18 14:58:25

引言

随着数字化时代的到来,各个行业的应用系统从传统私有化部署逐渐转向公有云、行业云、微服务,这种变迁给运维部门和应用部门均带来了较大的挑战。基于当前企业 IT 运维均为多部门负责,且使用多种运维工具,因此,当业务出现问题时很难快速定位故障根源。而随着业务上云,云平台运维和应用运维的责任归属不同,业务方(租户)只负责云平台之上运维,若是要对业务体验全链路负责,就会导致有责任没手段。同时,容器微服务架构应用后的业务之间的访问关系更加复杂,也会产生应用出现故障后分析困难等问题。基于以上的背景,企业数字化时代应用的健康诊断变得至关重要。

问题及挑战

如下图,当代码量的增长达到 100 倍,故障被企业 IT 部门察觉前已由用户申报达到 80% 时,作为企业会非常被动。用户对服务超时非常敏感,当 5 秒打不开应用时便会直接选择放弃。同时,用户对故障解决时效要求也比较高,75% 的用户希望在 5 分钟内解决业务故障,而业务系统需要超过 24 小时才能解决的故障占比在 25% 左右。

应用是一个端到端的多技术栈复杂整合环境,用户端包括移动端、浏览器、小程序,网络层包括路由器、防火墙和负载均衡等,后台支撑应用包括中间件、数据库、主机、MQ 等。所以如何去高效精细化的实现整个应用端到端的全链路性能问题洞察和诊断、快速找到故障的边界、以及特别是 VIP 用户出现性能问题如何快速追踪。这些应用的复杂度是企业运维部门和业务部门都需要考虑的问题。

传统的监控工具早已无法满足当前企业面临的问题。因为一个应用会涉及到数据库、第三方的 API 调用、应用服务器、中间件、Web、网络层等多个链路,因此,当系统慢是无法快速定位就是是拿个环节、组件以及指标导致。日常企业去判断上述问题时,会需要网络团队、开发团队、数据库团队、基础设施团队等多方协助排查,且排查效率较低。

解决方案与功能场景介绍

基于以上问题与挑战,云智慧提供了全新一代架构的应用性能管理解决方案。以提升数字化用户体验,帮助企业实现数字化转型赋能为目标,提供了 web 用户、移动用户、主动拨测、压力测试前端侧性能监控,同时贯穿网络层到后端各个组件的全栈一体化性能监控方案,包含 Web 服务器支持 IIS、Nginx 等。此外,应用后端支持市面上主流的开发语言以及微服务容器架构,基于 Smart Agent 的探针技术,部署在容器宿主机上就可以自动发现容器内部应用拓扑关联关系,实现整体的业务关联快速分析和根因快速诊断。

产品技术架构

下图为产品整体的技术架构,主要是分三层:

  • 数据采集层:APM 产品支持市面上比较主流的开发语言,如 Java、PHP、Python 等。APP 端支持 android 和 iOS 等各种版本。依赖主动拨测,基于全球 IDC 实现 Monitor 数据监测。
  • 数据存储层:采集到的数据统一放到产品的数据存储层进行数据存储。云智慧产品基于列式存储的技术,在各行业项目上经过大量数据实践,可以实现秒级查询和展示。
  • 数据分析与展示层:该层主要提供了具体产品的相关功能。包括拓扑展示,请求分析、用户追踪,代码堆栈详情分析,网页性能分析,页面响应时间分析、可用率分析等相关功能。

整个平台提供告警通知功能及标准 API 接口,方便用户其他业务系统调用数据进行应用。接下来,我们主要围绕 APM 和拨测两款产品的应用场景进行整体阐述。

监控宝:7*24 小时主动 IT 性能监控

云智慧拨测产品监控宝提供 7*24 小时主动 IT 性能监控;产品在全球范围内大概有 300 家的 IDC 节点,提供 800 家的服务器,IDC 数量决定了数据反馈的全面性,可以有效保障业务在全球的用户体验;国内节点覆盖 30 多个省份和 100 多个城市和地区,更能精准的定位问题所在区域。此外,也较为全面的覆盖了多个运营商,包括移动、联通、电信、教育四大运营商。以上三个维度,可以看出云智慧监控宝产品可以为各行业企业提供业务保驾护航的能力。

监控宝平台支持的协议包括 http/https、ping、DNS、ftp、traceroute 等,支持协议类型种类丰富,满足企业多方面使用需求。功能包括网页性能诊断、CDN 评估效果、网络质量探测、网站访问速度、接口服务可用率等。同时,整个产品支持多页面脚本录制,方便企业在大型网站上提供多页面监控能力,以及能够快速发现深层次的页面性能问题。

透视宝:端到端全链路应用性能诊断

云智慧 APM 透视宝产品提供端到端全链路的应用性能诊断。用户体验端包括 APP、浏览器、小程序的全栈性能分析和性能探测。后端支持应用拓扑的发现和代码质量的追踪,真正做到端到端一体化,实时掌握前端、透视后端,实现全业务链环节问题监控与分析。

下图为透视宝产品的技术实现原理, APP 端通过嵌入 SDK 实现用户行为和 APP 崩溃卡顿数据的抓取;浏览器通过页面嵌入 JS 方式实现页面详情的分析;主机操作系统通过部署 agent 实现 cpu、内存、网络、io 等指标监测;应用后端根据不同开发语言部署不同的探针,在中间件启动脚本里注入参数,重启应用后就可以实现数据的采集,小程序通过 mini agent 抓取相关数据。

应用场景介绍

  • 业务服务持续监测与告警

业务服务的持续监测和告警在一些互联网企业当中经常会遇见。比如北京区域网站访问是健康的,但其他区域网站访问异常时,也会收到的其他区域用户投诉。针对上述问题,由于目前各行业网站页面加载时序元素复杂,外加整个页面会有一些动画图片效果的呈现,所以需要能够实时探测网站在中国区域到地市级别和区级别的监控的主动拨测产品。监控宝可监测不同运营商链路访问网站速度、404 相关错误,以及可通过 IDC 节点主动收集数据,帮助企业及时分析并主动探测业务问题。该场景主要应用于互联网企业,电商企业,还有企业官网、在线教育等行业。

  • 内外网及网络专线质量监测与告警

企业内外网业务服务于全国。运营商网络不稳定的用户投诉,分公司专线或 VPN 经常出现的各种问题,均会导致业务运营受到较大影响。 外网网络质量监测依托于云智慧在全球 IDC 节点提供主动的 ping、MTR、traceroute 网络探测,60 秒的探测频率可以让问题被及时发现。针对内网专线的监测,云智慧提供魔盒产品。类似机顶盒的小盒子,使用寿命长、无风扇设计、节能环保,直接部署在分公司数据中心机房中即可使用。该场景主要应用于医疗行业、电商、金融、政府军工等集团企业。

  • 网页用户体验分析与持续优化

随着网站内容更加复杂化,大量元素加载耗时变长,首屏响应时间变得更加重要。如:当用户点击二级页面时会出现 404 错误或响应慢等现象,企业虽然做了 CDN 加速,在此情况下也很难确定加速的质量的好坏。然而在互联网时代下,用户对网页的加载速度提出更高要求,出现网页响应过慢或无法访问则会导致用户失去耐心而流失,以此便会给企业业务收入以及品牌均会带来损失。基于上述问题,监控宝产品提供了多页面脚本录制功能,可以模拟人点击操作所有页面各个环节的性能诊断,及时发现元素性能问题。此外,基于企业同时使用多家 CDN 厂商导致具体加速质量难以判断的现象,监控宝也提供了 CDN 整体性能评估功能,方便用户做 CDN 厂商性能体验对比。该场景主要应用在网站有丰富的大型 logo / 图片 / 轮播要展示的企业,如汽车类、广告展示类以及大量使用 CDN 服务商的企业。

  • 业务流程监测与优化

业务流程监测与优化主要解决业务调用第三方 API 接口性能问题。由于业务流程现状复杂性,完整的互联网或内部业务访问需要经历多重用户认证,以及多个内部环节处理才能最终完成。任何一个环节出现问题都可能导致业务不能正常进行,以及用户体验不佳、满意度下降,甚至出现用户流失。所以需要监控宝帮助企业从业务视角准确感知整体业务的性能和质量状况。该场景主要应用在使用第三方 API 服务的互联网企业、关注用户业务访问过程及体验的企业。

  • 应用拓扑自动发现与监控

全自动发现应用所有技术栈及其关联关系可以帮助企业从宏观视角把握一个应用及其关联应用的整体状态以及请求数、响应时间、错误等变化趋势,以此快速定位各层级问题。

随着企业应用上云和容器微服务化,应用之间调用关系愈来愈复杂。全局拓扑自动发现与监控是通过将复杂的请求调用关系拓扑图化来帮助运维人员和业务开发人员快速定位性能问题。产品可以直观的通过颜色变化分辨出是缓慢问题还是错误问题。同时拓扑上能发现各个组件的调用情况以及自身应用访问的组件,数据库、MQ、Nosql 和 API 接口情况。此外,通过拓扑可以直观的判断是自身应用问题还是其他应用性能导致的间接问题。此外,产品提供类似时光机的回溯功能,选择一定时间范围可以统计请求次数,缓慢次数、非常缓慢次数和错误次数。

  • 应用性能问题及故障快速诊断

随着云计算、大数据、容器、微服务等技术在企业的广泛采用,企业业务系统数量不断增加,运行环境也愈加复杂,需要不断根据市场环境和客户需求的变化进行快速响应和迭代,不断推出新的业务,减少业务故障风险,推动业务营收的增加;

第二个场景是应用性能问题及故障快速诊断,使用人员通过拓扑发现问题后需要第一时间定位问题,产品提供简单直观的操作界面,在拓扑图上点击应用实例就可以快速跳转到详细问题分析界面,比如上面截图的内容,可以看到后台代码堆栈追踪,慢 SQL 语句、外部接口详情、自身耗时、请求参数等详细分析问题的指标,性能问题一目了解,问题定位运筹帷幄。

  • 端到端全链路性能问题追踪

目前企业业务都是通过 APP、小程序或浏览器访问,因此在使用 APM 产品排查分析前端各种崩溃、卡顿、网络等问题后还是不能解决业务慢的问题。然而此时更多的是支撑业务后端的应用产生了性能故障,企业该如何去快速判断,精准的定位呢?云智慧产品提供了前端页面一键跳转后端的串联功能。如下方图片所示,当业务在登陆时已经能看到体验非常差,此时,在点击请求性能分析界面的查看按钮,便可以直接跳转到后端代码分析详情页面。该操作的前提条件是监测应用已经注入探针,不然是无法实现的。该场景可以有效的把前端和后端打通,串联追踪。

案例分享

某银行部署了 APM 整套产品,实现了应用后端整体性能监控,探针数量 115 个、接入应用数量 225 个、日均业务请求量 1500tps、日均应用请求的落盘数据量 150G 左右。截止到现在平台稳定 7*24 小时运行、探针对业务系统资源占用率控制在 3% 以内。在大量请求并发的情况下,云智慧基于列式存储的技术架构,也能实现页面妙级查询和妙级响应。

写在最后

近年来,在 AIOps 领域快速发展的背景下,IT 工具、平台能力、解决方案、AI 场景及可用数据集的迫切需求在各行业迸发。基于此,云智慧在 2021 年 8 月发布了 AIOps 社区, 旨在树起一面开源旗帜,为各行业客户、用户、研究者和开发者们构建活跃的用户及开发者社区,共同贡献及解决行业难题、促进该领域技术发展。

社区先后 开源 了数据可视化编排平台 - FlyFish、运维管理平台 OMP 、云服务管理平台 - 摩尔平台、 Hours 算法等产品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/765965.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【27】SCI易中期刊推荐——计算机科学机器人学(中科院2区)

💖💖>>>加勒比海带,QQ2479200884<<<💖💖 🍀🍀>>>【YOLO魔法搭配&论文投稿咨询】<<<🍀🍀 ✨✨>>>学习交流 | 温澜潮生 | 合作共赢 | 共同进步<<<✨✨ 📚📚>>>人工智能 | 计算机视觉…

arcgis建筑密度容积率覆盖率

大多数研究会把覆盖率当作建筑密度。 用覆盖率更恰当一些。 建筑覆盖率&#xff1a; 建筑物占据面积/街区面积 [Sum_area]/ ([area]*1000000) 排序检查数据&#xff0c;最大值0.75&#xff0c;最小值0. 建筑覆盖率&#xff0c;建筑密度的范围都应该在0-1之内&#xff0c;不是…

linux之Ubuntu系列(三)远程管理指令☞SSH 高级应用 RSA非对称加密 以及免密登录,配置别名

对称加密 、非对称加密 1、对称加密中加密和解密使用的秘钥是同一个&#xff1b;非对称加密中采用两个密钥&#xff0c;一般使用公钥进行加密&#xff0c;私钥进行解密。 2、对称加密解密的速度比较快&#xff0c;非对称加密和解密花费的时间长、速度相对较慢。 3、对称加密的…

【文末送书】AIGC时代的数据分析与可视化

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab&#xff0c;机器人运动控制、多机器人协作&#xff0c;智能优化算法&#xff0c;滤波估计、多传感器信息融合&#xff0c;机器学习&#xff0c;人工智能等相关领域的知识和技术。搜…

C语言实现:offsetof(OFFSETOF)宏的实现

C语言实现&#xff1a;offsetof宏的实现 offsetof:求结构体成员的偏移量 offsetof:求结构体成员的偏移量 直接上代码&#xff1a; #define OFFSETOF(type,member) ((size_t)(&(((type*)0)->member))) 图解&#xff1a; 图中测试原码&#xff1a; #include<stdi…

Centos Stream9安装vim代码提示coc的详细过程

Centos Stream9安装vim代码提示coc的安装步骤&#xff1a; 1、安装字体 https://github.com/ryanoasis/nerd-fonts/releaseshttps://github.com/ryanoasis/nerd-fonts/releases wget https://github.com/ryanoasis/nerd-fonts/releases/download/v3.0.2/Hack.tar.xz 下载后&a…

短视频seo抖音矩阵源码开发搭建技术解析

一、 短视频seo抖音矩阵源码开发需要考虑以下几个方面&#xff1a; 技术选型&#xff1a;选择合适的开发语言、框架和数据库&#xff0c;常用的开发语言有Java、PHP等&#xff0c;常用的框架有Spring、Django等&#xff0c;常用的数据库有MySQL、MongoDB等。 服务器的选择&…

若依框架系列教程(RuoYi-Vue前后端分离版本)

视频教程见评论 相关文档&#xff1a; https://www.cnblogs.com/52mqq/p/16068330.html 若依 Ruo-Yi&#xff08;分离版&#xff09;学习笔记 若依框架RuoYi项目运行启动教程【傻瓜式教程】_若依前端怎么启动_紫陌~的博客-CSDN博客 一定要看上面那个傻瓜式教程&#xff0c;…

MediaType的常用类型-GPT问答

MediaType的常用类型-GPT问答 MediaType是一个枚举类&#xff0c;包含了常见的媒体类型。下面是一些常用的MediaType类型&#xff1a; APPLICATION_JSON&#xff1a;JSON格式的数据APPLICATION_XML&#xff1a;XML格式的数据APPLICATION_FORM_URLENCODED&#xff1a;表单格式的…

Docker 常用命令速览

Shawn的学习笔记Descriptionhttps://study.chenkequan.cn/#/Spring%E7%B3%BB%E5%88%97/Docker/Docker完整笔记查看我个人网站。 机缘巧合&#xff0c;我想把实验室的网重新配一遍&#xff0c;配置成自动登录校园网&#xff0c;之前配过了&#xff0c;我得到当时打了一个Docker…

盘点国内热门AI大模型

Chat-GPT问世以来&#xff0c;使得大模型一时间内火爆非凡。国内外各大科技公司也纷纷加入到大模型的研发行列中来&#xff0c;“百模之战”愈演愈烈&#xff0c;国内百度、阿里、华为等科技大厂陆续推出旗下大模型产品&#xff0c;新锐科技公司也不甘落后&#xff0c;目前不少…

【基于 GitLab 的 CI/CD 实践】01、GitLab CI/CD 基础概念

目录 一、为什么要做 CI/CD &#xff1f; 1.1 背景-传统的应用开发发布模式 问题 1.2 持续集成与持续交付 持续集成&#xff08;CI&#xff09; 持续交付&#xff08;CD&#xff09; 持续部署&#xff08;CD&#xff09; 1.3 CI/CD 的价值体现 1.4 推荐常用的 CI/CD 工…

人工智能系统将家用机器人的解决问题技能提高了80%

麻省理工学院的研究人员开发了PIGINet&#xff0c;这是一个新系统&#xff0c;旨在有效地提高家用机器人解决问题的能力&#xff0c;将规划时间缩短50-80%。 在正常情况下&#xff0c;家用机器人遵循预定义的执行任务的配方&#xff0c;这并不总是适合多样化或不断变化的环境。…

指针面试题详解

目录 前言&#xff08;数组名的总结&#xff09;&#xff1a; 一、int 型数组和 sizeof 的组合 sizeof计算原理 二、char类型和strlen&#xff08;&#xff09;组合 三、char*类型和sizeof&#xff08;&#xff09;组合&#xff08;有 \0 版本&#xff09; 四、char*类型和…

【干货】Mysql解决中文乱码

登录数据库后&#xff0c;选择数据库然后执行 MariaDB [test]> status; -------------- mysql Ver 15.1 Distrib 5.5.68-MariaDB, for Linux (x86_64) using readline 5.1Connection id: 6 Current database: test Current user: rootlocalhost SSL: …

开源人力资源管理系统OrangeHRM

什么是 OrangeHRM &#xff1f; OrangeHRM 是一个全面的人力资源管理(HRM) 系统&#xff0c;它包含任何企业所需的所有基本功能。该软件旨在支持任何规模的团队&#xff0c;包括初创企业、中小企业以及大型跨国组织。 你也可以去官方的演示站点进行体验 网址&#xff1a;https…

【Java】一文学透四种内部类|保姆级详解,一看就会

文章目录 一、什么是内部类&#xff1f;二、内部类的分类2.1&#xff1a;成员内部类&#xff08;实例内部类&#xff09;2.1.1&#xff1a;定义&#xff1a;2.1.2&#xff1a;特性2.1.3&#xff1a;实现原理&#xff1a;2.1.4&#xff1a;应用场景&#xff1a; 2.2&#xff1a;…

字节跳动-抖音支付大量招聘实习生

字节跳动-抖音支付大量招聘实习生 字节跳动-抖音支付大量招聘实习生 要求&#xff1a;2024年6月毕业且有时间来实习&#xff08;大于3个月&#xff09;的在校学生&#xff08;本三&#xff0c;研二&#xff09;&#xff0c;日常和暑期都有转正机会&#xff5e; 职位描述&…

WPF 自定义控件完成库容表盘显示效果

先看一下显示效果&#xff1a; 需要注意的地方有以下几点&#xff1a; 表盘的刻度分部&#xff0c;长刻度和短刻度显示。在数值80W时&#xff0c;需要更改刻度盘的颜色渐变。在数值80W时&#xff0c;更改库容总数背景的显示&#xff0c;也是颜色渐变。刻度盘控件属性定义&…

印刷企业如何利用MES管理系统实现智能计划排产

在数字化时代&#xff0c;印刷企业面临着日益激烈的市场竞争和不断攀升的成本压力。为了提高生产效率和质量&#xff0c;印刷企业需要采用先进的生产管理系统。其中&#xff0c;MES生产管理系统已成为实现智能计划排产的重要工具。本文将探讨如何利用印刷MES管理系统实现印刷企…