数据分析师

手机号

验证码

30天自动登录

数据分析师

AIOps工具中需要寻找的四项功能

来源:CPDA数据分析师网 / 时间:2021-05-26

AIOps工具可提供跨不同孤岛(云,内部部署或混合环境)的可观察性
采用人工智能和机器学习(AI / ML)技术来主动检测异常,并通过事件关联来加快根本原因分析并减少平均解决时间,他们还从捕获的大量遥测和交易跟踪数据中获取见解和商业智能,但是这些工具的创建方式并非一律平等,下面是工具需要具备的一些关键功能,这些功能要超越IT运营团队期望执行的传统角色并帮助他们实现零停机企业的目标,就必须具备这些关键功能。

从事件解决过渡到预防性治疗
许多AIOps工具使用AI / ML技术来检测问题,但是补救是在通过IT服务管理集成利用自动化的精心安排的工作流之后进行的,因此他们在事后提供事件解决方案,并将重点放在MTTR上以衡量其有效性,但是借助新的预防性愈合系统,可以通过工作负载-行为相关性等获得专利的技术在问题发生之前进行预测,这实质上是考虑某个工作负载签名对底层系统资源的影响,并标记那些在可预见的将来可能引起问题的事务模式,一旦发现问题,就会采取适当的措施来避免它,其中可能包括动态优化或“调整”工作负载,以使底层系统行为不受影响,或者在云环境中动态预配置其他资源,以便系统可以处理工作负载激增的情况,通过在潜在问题发生之前就产生潜在的先兆信号,并采用适当的技术来避免这种情况–企业可以专注于“避免的停机次数”作为衡量效率的指标,并实现零停机时间。

为援助运营团队提供见解
大多数AIOps和应用程序性能管理工具都转向可观察性-的监视工具,可观察性的创新见解探讨了企业如何使用从各种来源捕获的遥测数据来使DevOps和站点可靠性工程团队减少应用程序停机时间,小化事件解决工作量并改善总体客户体验,如果使用得当,此数据可以帮助并加速根本原因分析。事件发生时由AIOps工具捕获的上下文数据应包含有关系统状态的足够诊断数据,以使IT运营分析人员可以建立因果关系链,准确查明故障的根源并采取措施加以解决。从历史上看,这需要日志,取证,从数据库查询级别的统计信息,代码级别的工具和漂移跟踪以获取此级别的数据。利用现代AIOps可以帮助团队大幅降低无法预先预测的问题(例如硬件故障,网络和存储中断或无法使用API和支付网关之类的第三方依赖项)。

通过集成保护现有工具投资
在当今日益复杂的混合数字环境中,需要不止一个AIOps工具来提供对不同孤岛的可见性,至关重要的是,任何新工具都可以与现有集成,以捕获所需的遥测数据以学习应用程序行为并生成见解,以及各种工具,从而可以实现票务工作流的自动化,并且可以使用可视化和通知工具来促进协作在故障排除团队中,这种集成使企业能够在其操作设置中合并更新,更强大的功能,同时保护现有工具的投资,并为团队节省使用新工具的痛苦,而却以维护现有工具为代价,将AIOps工具连接到IT外部的业务流程,包括人力资源,风险和治理,其他人则专注于提供等容器管理解决方案的集成,因此可以在整个企业中实现方法,以实现应用程序的连续部署,维护和管理。

智能扩展的预测能力
AIOps工具位于从各种来源捕获的大量历史数据之上。在生成见解和计划未来扩展方面,此数据湖具有无价之宝,但是仅检查系统资源的增长趋势不足以预测容量,还必须注意可能导致工作量激增的任何重大内部或外部因素。例如,金融机构收购银行,电子商务提供商的大笔交易或市场营销活动,这可能会导致网站流量突然增加,通过考虑工作负载增长趋势并结合分析系统热点,可以实现更智能的扩展建议,这项工作的目的是预测工作量的增长并确定能力的瓶颈,并通过假设分析计算与业务相关的容量预测,这有助于在云上识别配置不正确的资源,从而减少基础架构预算或根据需要扩展资源。

每个AIOps工具都会为表格带来独特的效果

基于这四个功能评估选项可以帮助确保您已设置为从破坏和修复模式过渡到预测和预防模型,业务需要评估当前AIOps产品在缓解停机时间,减少成本和减少问题解决方面的工作量以及与业务相关的增长计划以管理多云环境中的成本方面所遭受的差距,在这些动荡的时期,迈向预防性修复是的方法,以确保您的数据中心24×7正常运行,并且您的应用程序始终可用。



返回列表