今天分享的是:林亚:大型企业系统可不雅测性的最好推行
解释认为:33页
该文档主要接头大型企业系统可不雅测性的最好推行,包括企业IT系统环境、可不雅测性平台、案例商讨及具体推行要领等方面。
1. 大型企业IT系统环境
- 系统先容:大型企业IT系统环境种种,包括留传系统、云原生系统和硬件系统。留传系统启动于杜撰机,对业务迫切但监控坚苦;云原生系统基于云基础武艺,具可蔓延性;硬件系统有专有可不雅测性挑战。
- 可不雅测性挑战:面对系统复杂性、妙技差距、数据和组织孤岛、用具激增、穷乏尺度化等挑战,导致平均开导期间加多、系统可靠性镌汰、上市期间延长和运营本钱加多。
2. 可不雅测性平台
- 平台概括:可不雅测性平台涵盖数据生成、汇集保存和可视化价值索求。数据类型计算、日记和追踪。数据汇集保存面对延长、可靠性和安全性挑战,需弃取妥当契约、优化汇集建立、使用数据压缩,弃取妥当存储决策、引申保留战略和应用近似数据删除。有用价值索求可改革决策、加速事件反应、提高运营恶果、已毕翻新。
3. 案例商讨:某公司有多个腹地和云数据中心,选拔鸠合式DevOps/SRE团队,面对可不雅测性用具激增、穷乏尺度化和细目根柢原因坚苦等挑战,系统故障中断发生率高。
4. 可不雅测性最好推行
- 团队联结:将SRE纳入开发团队,分享总计权,主动惩办问题,改革联结,加强常识传授。
- 尺度制定:建立可不雅测性尺度,包括筹办界说、日记纪录商定和技俩模板,选拔OpenTelemetry框架,相易层鼓动从上至下的尺度化,提供培训并按期审查更新。
- 镌汰复杂性:镌汰系统复杂性可提高管制爱戴恶果、从简本钱、增强数据一致性,可从系统级复杂性方面评估,如检修期间、讲明期间、管制种种性和部署建立种种性等。
- 数据精简:减少筹办、日记和追踪,可镌汰本钱、加速分析、提高性能、增强专注力,识别并去除不消要的筹办、标签,合理采样,关闭坐蓐环境中的调试日记等。
- 应用分析:日记、筹办和追踪有局限性,需进行性能、内存、CPU和线程分析。
- 优化战略:谨守80/20原则,优先暖热关节系统和筹办,优化数据汇集,细目事件反应优先级。推行后,该公司严重事件、事故总和和平均MTTR显赫减少,可不雅测性掩饰率提高,后续将使用里面代码模板并集因素布式追踪。
以下为解释节选本体
- 2024-12-2512月24日基金净值:易方达增强陈诉债券A最新净值1.376,涨0.15%
- 2024-12-2512月24日基金净值:博时锦源利率债债券A最新净值1.0552,跌0.15%
- 2024-12-2512月24日基金净值:嘉实中证500ETF最新净值2.3532,涨1.32%
- 2024-12-2512月24日基金净值:中原中证500ETF最新净值3.2306,涨1.32%
- 2024-12-25国内棉花供应宽松 纺织需求有所转弱