退运险业务及系统架构演进史

news2024/11/19 3:37:11

作者:曾利⺠、杨代铭

⽂章简介:本⽂回顾退运险上线⼗年以来相关系统架构的演进。

背景   

退运险对于我司来说是⼀个举⾜轻重⼀款产品,初创时期贡献了99.9%的 保费收⼊,随着公司的发展各类产品的不断创新,退运险的⽐重在缩⼩,但 它的规模在不断扩⼤,当前年保单量已超百亿。为了满⾜业务的发展,相应 的系统经历不断的演进。

初代架构

核⼼系统于2013年11⽉开始设计,当时不知道业务到底能有多⼤,所以 起个名字叫⽆界⼭,由于对未来的不可知,初版微架都⽐较保守(初代⼤神 ⼤⻦⾔)。退运险作为其⽀持的最重要也是量最⼤的业务,很多设计都基于 它,当时⽇需处理的保单达380万,可能现在看这个数据不算什么,但是要知 道当时通常中⼩型保险公司核⼼系统的⽇均⽀持保单量在10万以内,较普遍 是1⾄3万左右;⼤中型公司则约在⼏⼗万量级,不超过百万。处理⽅式也特 别简单:ODPS预处理报⽂,再解析报⽂,扔出notify消息,核⼼收到后处 理,通过分库分表⽅式解决⼤数据存储问题。各个系统在hsf等中间件的帮助 下具备⽔平扩展能⼒。

初代架构存在的问题是性能实在是蜗⽜,资源调度极度上不去,消息压⼒ ⼤,⼀旦有异常,堆积导致notify奔溃,业务规模也不断在扩⼤,特别是双⼗ ⼀⼤促时尤为突出,⽇保单量已达亿级别,系统也渐渐显得⼒不从⼼,2015 年进⾏升级引⼊美洲豹(JStorm),将之前dispatcher和nightelf两个项⽬合 ⼆为⼀,架构上通过中间件解决⽔平扩容和单点问题,于当年年11⽉份正式 ⽣产运⾏。

⼆代架构  

初代架构迭代优化后基本能很好的⽀持退运险业务,但是公司在不断发 展,后续健康险、意外险、财产险等业务不断的开展,核⼼系统也需要⽀持 越来越多的实时业务,对系统的稳定性要求越来越⾼,然⽽退运险⼊库时间 ⽐较集中,系统负载持续在⾼位,导致系统稳定性下降。要同时⽀持退运险 业务和实时业务,虽然可以通过⽔平扩容的⽅式提⾼系统的吞吐量,但是⼀ 天就跑四五个⼩时跑报⽂,扩容会⼀定程度上造成资源浪费,⽽且在跑报⽂ 时间段内也不能避免不影响实时业务。在电商平台进⾏⼤促活动时尤为突 出,在双11期间为了追求更⾼的QPS,前期需要投⼊⼤量的⼈⼒和资源进⾏ 系统调优和压测,⽣产也需要准备⼤量的云资源进⾏⽀持。JStorm是分布式 实时计算引擎,⽽在退运险场景⾥只⽤其任务分发的功能,有点杀鸡⽤⽜ ⼑。⽽且JStorm⽇常维护成本太⾼,使⽤极其不便。   

在2018年进⾏⼀次完全的重构,针对退运险的业务基于⽆界⼭核⼼系统 衍⽣出⽆界⼭-电商⼦系统,底层使⽤⽆界⼭1.0的DB,⽀持电商场景包括退 运险、保证保质保险等创新业务。得益于公司Devops的建设,让这套系统测 试、发布和扩容更⾼效。服务间的调⽤使⽤dubbo,消息中间件使⽤kafaka, bill服务也通过消息进⾏异步处理。上线后当年双11单⽇⽀持8千万保单⼊库, 峰值TPS达到2.2万,期间未造成其它实时业务的超时等异常情况。   

完成基础架构调整后,于2019年进⾏业务层的深度优化。因为退运险作 为公司第⼀批险种,在核⼼已经运⾏了五六年。在这段时间⾥,核⼼已经新 上了数千个产品,对接了四五个事业部,为了兼容,原有的单独针对淘系报 ⽂的⼊库逻辑已经被改的⾯⽬全⾮。另外⼈员以及部⻔的变动,短时间内经 历多次交接,⼀些特殊逻辑在过程中没交待清晰。以上这些问题,都给维 护、测试和排错等⼯作带来诸多的不便。⽽随着众安与淘系的合作程度加 深,淘系退运险保单量正在进⼀步增加,预计2019年双⼗⼀会达到顶峰。完 成本次优化后,删减了冗余的代码逻辑,减少了DB查询次数,提升了系统的 整体性能。上线后2019年双11单⽇处理保单1.6亿,处理⽤时⽤了160分钟, 峰值TPS达2.7万,报⽂报⽂同⽐去年增加⼀倍处理时⻓缩短40%。

主要改进内容:

开发⽆界⼭-电商⼦系统,与其它险种系统进⾏隔离,减少相互影响,bill 通过kafaka异步⼊库,进⼀步削峰;

使⽤dubbo中间件替代⽼旧的HSF进⾏服务间调⽤,提⾼系统性能;

使⽤新的报⽂处理平台和kafaka消息中间件替代JStorm进⾏异步处理;

优化ODPS预处理逻辑,调整报⽂结构,降低ODPS处理资源消耗;

产品配置、⽤户信息进⾏本地化缓存,减少重复DB查询,提升系统性 能。

三代架构  

数字⽣活事业部⼀直在⾮阿退运险⽅向进⾏了不断地努⼒,期间接⼊过 蘑菇街、趣店等电商平台,但都量不⼤⽇保单在万单级别,近年来随着抖 ⾳、快⼿等新兴平台电商业务蓬勃发展,使得退运险在⾮阿渠道得以突破, 2020年6⽉份快⼿接⼊,2021年7⽉份抖⾳接⼊后,⾮阿退运险⽇保单量逐渐 超千万单。退运险不仅仅只有阿⾥单⼀渠道和场景,逐步向多元化的⽅向发 展。三代架构在这过程中也逐渐形成,公司⽆界⼭核⼼也升级为2.0不在和退 运险共⽤DB,其它险种和退运险相互再⽆影响。根据当前需求新开发报⽂管 理平台,使⽤OCeanBase分区表替代原来分库分表,使⽤Redis的Message queue进⾏报⽂⽂件的分发处理。以及开发gateway-data、anacientone系统 处理退运险实时业务。   

在降本增效的环境下,不再不计代价的追求⾼QPS,⽽是要求以更经济 的⽅式⽀持业务。为了达到这个⽬标,在优化系统的同时,也优化业务模 式,⽐如淘系报⽂之前T+1给前⼀天所有的报⽂,导致会出现⼀个报⽂有上亿 条数据,处理数据时间过于集中,处理过程只能串⾏进⾏,导致系统资源没 有充分利⽤。最终我们和渠道⼀起进⾏优化整改,以T+H的⽅式给报⽂增加 给报⽂频次,给了更⻓的时间窗⼝处理数据,也⼤⼤减少单个报⽂数据量, 从⽽进⼀步进⾏了削峰,⽇常只需400QPS就能保障业务正常运转,以往需要 达到4000QPS。⼤促期间以往需要⼏⼗台ECS⽀持,QPS需要达到2万,现 在只需原来的⼗分⼀就能满⾜要求,以更少的系统资源⽀持业务,达到降本 增效的⽬的。同时也提⾼保单的⼊库时效,提升了⽤户体验。

主要改进内容:

⽀持实时接⼊,其中快⼿以及⼀些⼩渠道通过实时⽅式接⼊;

⽀持配置个性化策略解析报⽂,可以配置不同频次解析报⽂;

⽀持异常检测、预警,以及⾃动修复;

剔除ODPS预处理报⽂,⼀来减少报⽂处理环节,⼤⼤降低⼤⽂件传输消 耗,⼆来直接减少了ODPS计算费⽤;

⽀持回传结果⽂件,解决对账问题;

其它险种DB隔离,不再相互影响。

总结

对⽐三代架构,其中的中间件可能⼤不相同,但是核⼼的思想基本是⼀ 致的,就是通过异步的⽅式进⾏削峰。⼤道⾄简⽀持年保单量百亿的系统也 不过如此。其实退运险虽然数据量庞⼤,但是它在电商的交易场景⾥⽤户感 知不强,所以它对实时性的要求⽐较低,结合它的这⼀特性才有这样的系统 设计。另外是因为站在巨⼈的肩膀上,依托公司的各项基础设施,才能这么 简单构建这类处理海量数据的分布式系统。   

我司成⽴⼗周年,退运险业务上线也正好⼗年,这⼗年业务规模不断地 扩⼤,形态也有变化,系统经历了⼏次变⾰。也经历公司各个时期,从⼈⾁ 运维,到Duang、boom、ship、最后到现在的DevCube。基于公司⾃研的 DevOps研发运维⼀体化解决⽅案,使我们的系统能敏捷迭代,全链路监控预 警,以及快速修复⽣产故障等。   

退运险是互联⽹的产物,所以得益于互联⽹相应的技术和思想,才构建 这套系统。正如布鲁克斯在《⼈⽉神话》中所说的没有银弹,没有⼀个系统 ⼀开始就能做到尽善尽美,会随着业务发展、技术进步不断的调整和优化。 回头看之前的技术选型会有问题,但在当时就是最合适的⽅案。   

本⽂未对业务场景以及⼀些技术细节进⾏展开,对相关⽅⾯有兴趣的同 学可以单独找我探讨。后续相关的负责⼈也会输出相关⽂章介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1141920.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端移动web高级详细解析一

01-平面转换 简介 作用:为元素添加动态效果,一般与过渡配合使用 概念:改变盒子在平面内的形态(位移、旋转、缩放、倾斜) 平面转换也叫 2D 转换,属性是 transform 平移 transform: translate(X轴移动距…

YOLOv5算法改进(21)— 添加CA注意力机制 + 更换Neck网络之BiFPN + 更换损失函数之EIoU

前言:Hello大家好,我是小哥谈。通过上节课的学习,相信同学们一定了解了组合改进的核心。本节课开始,就让我们结合论文来对YOLOv5进行组合改进(添加CA注意力机制+更换Neck网络之BiFPN+更换损失函数之EIoU),希望同学们学完本节课可以有所启迪,并且后期可以自行进行YOLOv5…

记一次任意文件下载到Getshell

任意文件下载(Arbitrary File Download)是一种常见的 Web 攻击技术,用于窃取服务器上任意文件的内容。攻击者利用应用程序中的漏洞,通过构造恶意请求,使应用程序将任意文件(如配置文件、敏感数据等&#xf…

IDE的组成

集成开发环境(IDE,Integrated Development Environment )是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务…

这场研讨会硬件工程师不要错过

在高速PCB设计中如何保障高频信号的传输和接收,以及保证信号完整性和稳定性? 如何解决EMI抑制、时钟分配和功率供应的问题? 如何使用开源EDA工具 KiCad? 如何使用DFM软件高质量提升pcb产品制造,优化制造成本&#x…

C++入门04—数组

1. 概述 所谓数组,就是一个集合,里面存放了相同类型的数据元素 特点1:数组中的每个数据元素都是相同的数据类型 特点2:数组是由连续的内存位置组成的 2. 一维数组 2.1 一维数组定义方式 一维数组定义的三种方式: …

Linux常用命令——chroot命令

在线Linux命令查询工具 chroot 把根目录换成指定的目的目录 补充说明 chroot命令用来在指定的根目录下运行指令。chroot,即 change root directory (更改 root 目录)。在 linux 系统中,系统默认的目录结构都是以/,…

喜报 | 星辰天合被认定为 2023 年度北京市知识产权示范单位

近日,北京市知识产权局官方网站发布通知,星辰天合等 150 家单位被认定为 2023 年度北京市知识产权示范单位。 为深化实施创新驱动战略和首都知识产权战略,促进企事业单位提升创新能力和知识产权创造、保护和运用能力,培育知识产权…

vscode连接服务器一直retry

解决方法 打开vscode控制面板,输入命令remote-ssh: kill vs code server on host 选择一直连接不上的服务器端口 重新连接

接口自动化测试实操

实现思路 使用excel管理用例用例信息,requests模块发送http请求,实现了记录日志,邮件发送测试报告的功能 目录结构如下: 下面直接上代码: 统筹脚本 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24…

.\missyou-0.0.1-SNAPSHOT.jar中没有主清单属性

引用&#xff1a;https://blog.csdn.net/marypiglwy/article/details/132016171 配置的时候 <skip>true</skip> skip设置为true&#xff0c;跳过了执行插件&#xff0c;&#xff0c; <plugin><groupId>org.springframework.boot</groupId><a…

软考高级系统架构师冲关预测

[ – 2023年10月27日 – ] 去年11月通过了软考高级系统架构师的考试&#xff0c;原本想立即分享下过关的总结回顾&#xff0c;但是随着软考新版大纲及教程的发布&#xff0c;也意味着题目及内容的复盘总结经验便不那么适用。在即将迎来今年的软考高架的时候&#xff0c;想着透…

控制输入流,从控制台打印到文件中,更改输出的位置

public static void main(String[] args) throws IOException {PrintStream printStream System.out;//在默认情况下&#xff0c;PrintStream 输出数据的位置 标准输出&#xff0c;即显示器printStream.print("Tom,hello");/*public void print(String s) {if (s n…

【Linux】rpm和yum的使用

不知道是不是有和我一样的宝子们&#xff0c;在rpm上卡了老久老久&#xff0c;但其实搞通了&#xff0c;理解了原理之后&#xff0c;不难的&#xff0c;所以不管你现在遇到的困难是什么&#xff0c;都不要放弃&#xff0c;一定要坚持&#xff0c;加油。 一、rpm 1.rpm rpm的…

mybatis学习笔记,使用mybatis的几种方式

随着springboot的出现&#xff0c;绝大多数开源框架和中间件都可以通过springboot来整合&#xff0c;并且使用起来非常简单&#xff0c;但是&#xff0c;今天要介绍的是mybatis原生的使用方法。并且分享一下在结合官网学习过程中遇到的问题。 目录 准备工作 数据库版本说明 …

代码随想录二刷 Day46

10背包&#xff1a; 二维内侧与外侧都是正序遍历&#xff0c;二维的内侧与外侧是背包还是物品无所谓&#xff1b; 10背包&#xff1a; 一维外侧是正序&#xff0c;内侧是倒序&#xff1b; 目的是为了一个物品只选取一次&#xff1b;一维内侧一定要是背包&#xff1b;原因我想了…

GoLong的学习之路(十五)语法之接口(重要)

文章目录 接口接口的定义实现接口的条件面向接口编程接口类型的变量值接收者和指针接收者接口值接收指针接收总结 类型和接口的关系&#xff08;多对多的关系&#xff09;一个类型实现多个接口多种类型实现同一接口 接口组合注意 空接口空接口的应用 接口值类型断言注意总结 接…

Cross-modal Variational Alignment of Latent Spaces

方法 潜空间LS 辅助信息 作者未公布代码

matlab simulink 直线一级倒立摆控制(自起摆和稳态控制)

1、内容简介 略 6-可以交流、咨询、答疑 2、内容说明 控制器设计 自起摆建模 规定正方向&#xff1a;顺时针为角度&#xff08;力矩&#xff09;正方向&#xff0c;向右为位移正方向。 在规定的正方向条件下&#xff0c;图 1 所示摆杆的角度φ为正值&#xff0c; 下车向右加…

会议高清直播录播系统

怎么两个会场同步直播&#xff1f;部署一套会议高清直播录播系统。 鉴于线上线下同步培训&#xff0c;培训课件内容及互动情况都需要实时同步给终端学员&#xff0c;并且两个会场同步直播这些实时的培训画面。在局域网中&#xff0c;直播录播系统可以通过以下方式实现&#xf…