云原生应用链路详解实践,你学会了吗?
发布时间:2022-08-04 14:43:13 所属栏目:云计算 来源:互联网
导读:一、云上应用现状与挑战G行为深化123+N数字化发展体系,建设自主可控的全栈云平台,全面支持云原生、微服务和分布式等技术。然而由于在全栈云环境中因容器漂移、自动扩缩容使得应用故障现场难以还原,同时微服务技术的应用也使得云上应用服务调用关系复杂,
一、云上应用现状与挑战G行为深化“123+N”数字化发展体系,建设自主可控的全栈云平台,全面支持云原生、微服务和分布式等技术。然而由于在全栈云环境中因容器漂移、自动扩缩容使得应用故障现场难以还原,同时微服务技术的应用也使得云上应用服务调用关系复杂,链路难以准确梳理,故障发生时难以快速定位根因,给云上应用系统运维及故障排查带来了挑战,为此如何有效实现云上应用的可管理性和可观测性是一个较为急迫的问题。 二、云原生应用性能全链路分析系统架构G行通过渠道应用性能分析系统(CAPAS)对接全栈云上互联网应用,通过APM全栈探针的能力和平台的数据分析能力,实现应用性能评分、调用链路追踪、代码级故障定位以及关联分析等能力,其主要技术架构如下图所示: 主要核心技术能力包括以下几点:应用评分 通过对应用的Apdex评价、响应速度及错误率等关键性能指标作为量化要素计算出应用性能体验指标的综合评分,直观展示当前应用系统的总体运行态势。 智能探针技术(Smart Agent) 全面兼容K8S同时支持Image等多种方式安装,通过守护进程对容器的调度情况进行监控,当发现运行环境中有需要被纳管的容器对象生成时,将自动根据该容器环境适配对应类型的探针,然后将匹配好的探针进行自动装载和同步配置调整,实现探针的自动发现、自动注入、统一调度,实现了容器漂移或重启时自适应管控的能力。 自动发现应用调用链技术 利用字节码注入,即当调用了多个应用组件时,在调用第一个组件时会在第一个调用头中加入TraceID,当继续调用其他组件时此TraceID会向下传递,通过传递的TraceID能够自动发现应用组件调用的逻辑关系,基于有向无环图(DAG)的原理,能够自动识别应用在执行的过程中涉及的软硬件架构和组件,并且可以描绘出应用交互链中交易通讯的各个组件的访问路径,最终形成应用调用链,以实现对各复杂业务调用拓扑自动发现,解析应用运行状态。 三、应用实践目前G行渠道应用性能分析系统已经对接多个互联网移动移动包括手机银行、企业手机银行,同时也对接企业网上银行、个人网上银行、微信银行等WEB类系统,在全栈云环境对接缴费客户端服务(见图4),从开发测试环境到生产运行全方位服务相关系统,实现相关业务系统的实时状态展示以及问题根因分析,提升业务系统非功能优化能力,助力完善电子渠道应用产品。 四、回顾与展望通过体系建设构建了应用系统前后端的性能监测与分析能力,全面兼容全栈云平台,实现对云原生应用的Trace、Metric和Log数据的收集分析,并通过前后端关联的方式,初步实现根因分析,掌握系统的运行状态。后续将在现有基础上,进一步实现以下目标: 基于现有应用指标数据,实现业务的商业洞察,了解用户的使用流程和轨迹,从性能和收入角度综合分析IT服务支撑效果和用户使用习惯,真正从运维入手,来促进和提升业务运营; 实现多维度数据的不断积累,为全面的自动化运维奠定良好的数据基础和实践基础,构建不同维度的AIOps落地场景,在奠定基础的同时提升运维及业务收益。 (编辑:开发网_开封站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |