资产发现及管理 1、 内置目录服务体系,支持由顶层管控中心,多级服务平台构成的集中多租户应用环境,为其提供个性化运维应用,通过自定义用户角色以控制用户的访问权限和应用功能。 2、 支持建立不同区域、不同层级、不同专业信息化系统的视图,并自动采集和存储相关资产信息以形成动态资产台帐和运行履历。 3、 基于统一的资产管理体系,结合多种扫描及探测服务,同时支持IT资产的自动搜索发现、动态注册及人工登记功能,实现资产信息的一致性管理。 4、 提供多种方式,包括但不限于多页仪表板、层级树和拓扑图、程式图形等,来呈现IT环境的可视化概览。 数据采集与深度监测 1、 能够适应复杂系统的数据采集、实时监测需求,支持从各类设备、系统、应用程序上采集数据,包括但不限于:网络设备、云服务、容器、虚拟机操作系统、日志文件、数据库、服务、物联网、HTTP/HTTPS等等,支持各种行业标准协议及从外部API端点采集数据。 2、 支持IPv6监测和评估,实现对网络、系统、云平台及应用的全栈IPv6支持度检测,可实时检测全网IPv6流量占比、应用支持度,支持对全网IPv6部署进展、程度的自动评估及生成评估报告。 3、 支持自定义数据采集方式,主要包括数据采集的推拉方式、高强度数据采集(最小轮询间隔为1秒)、数据采集的时间调度、覆盖特定时间段的轮询间隔及不同的数据类型。 4、 支持应急系统中的各类日志文件监控,实现采集和筛选日志文件条目、采集事件日志(eventlog)条目、检索匹配日志文件条目等功能。 5、 可通过部署代理(Agent)支持重点系统和应用的深度监控,并可配置不同的数据交付方式(推或拉)、灵活的调度间隔,支持使用插件或 外部脚本进行扩展及磁盘数据缓存。 6、 支持各种远程监控服务的协议,包括网络监控、可编写脚本的综合监控、SNMP(v1/2c/3)轮询和trapping、Java应用程序监控、IPMI、SSH/Telnet检查、ODBC监控、ICMP和TCP检查、Modbus和MQTT协议等。 7、 支持创建复杂场景,用来对WEB应用程序和API进行可靠监控,包括从端点获取任何性能数据、自定义Q/A测试以模拟真实业务,以及通过执行自定义数据采集方法来扩展监测功能。 8、 可根据应用需求,扩展数据采集方式和监测功能,包括用于推送任何数据的CLI实用程序、以任何脚本语言编写的外部脚本以及针对复杂WEB和HTTP场景的综合监控等。 9、 支持对任何类型的数据进行规范和转换,包括数据类型转换、去重、计算差值、数值计算、数字系统转换及自定义数据转换等。 问题发现和趋势分析 1、 面向不同系统监测运维要求,支持自定义灵活的问题阈值,根据传入的数据流自动检测问题状态,实现实时高性能问题检测、高度灵活的定义、独立的问题条件和解决条件、多个严重级别、根因分析、波动保护、异常检测等功能。 2、 基于大数据支持趋势预测,并可以使用标签对检测到的问题进行分类,以便更智能预警,并支持实时将检测到的问题事件导出到其它系统。 3、 平台提供灵活、智能的阈值定义选项。触发器的阈值可能简单到“大于x”,也可以使用支持的函数和运算符的所有功能对历史数据进行统计分析。 4、 支持对趋势预测作出积极反应,通过预测函数可实现预测早期告警的值、预测达到问题阈值前的剩余时间等功能。 5、 支持使用基线监控来检测异常,在周期性变化的动态环境中,自动计算参考点并根据该参考点计算问题阈值,基于对历史数据的实时分析检测异常、使用基线监控获得洞察。 预警和自动修复 1、 支持通过多种渠道实时发送预警信息,使用多个消息传递渠道将环境中发生的各种事件通知负责人员。包括电子邮件、USB modem、在线短信网关及微信等国内主流通信平台。并支持与应急体系内其它消息系统、工单系统集成。 2、 支持自定义告警消息,为不同的消息传递通道定义不同的消息。可以使用默认消息模板,也可以创建和自定义消息模板:如根据问题类型和收件人的角色自定义消息、用任意运行时信息和资产信息来丰富消息等,并支持发送定时PDF报表,以便对数据进行深入洞察和长期分析。 3、 支持根据所需的工作流自定义不同复杂程度的升级方案。从对不同用户的简单通知和升级,到延迟通知和自动问题修正,包括但不限于立即通知用户有新问题、主动执行远程脚本、在问题解决前持续重复通知、延迟通知和远程命令、确认问题的不同上报路径等。 4、 支持自动解决问题,即可以执行修正脚本或命令来尝试并解决问题,包括重启服务、管理云资源、自动伸缩资源、执行任何其他自定义逻辑等。 故障响应及流程管理 1、 将传统ITIL方法论融入自服务、敏捷化、协同化运维思想,可通过运维门户发布运维流程服务,提供自动排班、值班管理、自动巡检、故障处置、应急响应、工作日志、知识文档库等功能,并与告警和流程无缝集成,满足多级运维协同需求。 2、 提供标准化ITSM 服务流程管理,兼容DevOps/ITIL理念,通过采用按需灵活定义流程模型,提供可视化流程设计环境,并支持人工/自动节点混合流程编排。 3、 提供即时运维协同功能,支持基于职责和场景灵活建立群组、覆盖各类运维场景的人机交互;支持以命令行+自然语言来驱动任务执行;对运维协同和任务执行支持回溯审计。 4、 提供运行值班管理功能,支持自动均衡排班,提升排班效率;支持多种运行模式,灵活智能值班;通过值班日志交接,事项跟进无遗漏;提供相关服务接口,支持与各类值班场拟合。 5、 实现故障响应、流程管理与知识库体系的直接集成,在不同的运维场景、用户群组及工单流程中支持基于事件、故障类型、技术环节等上下文、多标签文档查阅及全文检索。 预案及知识库管理 1、 支持建立统一管理、多方共享的运维预案和知识库系统,以辅助运维部门及人员的日常管理和故障处理,并实现知识共享转化,避免经验知识流失,提高运维效率和质量。 2、 支持多类运维相关信息、资料纳入知识库体系,包括但不限于IT资产档案(包括自动发现的资产定义)、典型故障的处理预案、运维服务相关的制度流程、针对不同时间和问题的解决方案、运维过程中产生的变更申请、测试方案、技术方案等,以及技术参考资料,例如网络拓扑图等等。 3、 基于统一内容管理体系,实现对各类知识的分类组织,支持多种文档模板、分类标签存储、高性能全文检索及标准服务接口,系统化管理知识收集、整理、发布、应用过程,并支持灵活设定权限隔离保证敏感信息安全管理及进行跨部门、群组及用户的共享等。 4、 支持多场景的自动知识推荐和运用建议,用户提交工单时,根据用户选择的业务分类自动推荐相关知识;实现:用户提交工单时根据用户输入关键字自动推荐相关知识;工程师处理时推荐与故障相关的知识;支持关联历史处理工单,透过知识了解历史解决方案的技术原理和原因分析。 面向业务KPI及服务SLA监控 1、 支持通过根因分析改进问题跟踪,联现有问题和刚收到的问题,并执行根因分析,防止非根本问题轰炸而只显示根本原因;灵活的自定义问题关联逻辑;如根本原因未得到解决,则关闭任何相关的刚收到的问题;如果检测到根本原因问题,则关闭现有问题等。 2、 支持使用层级服务树自定义服务元素,以监控业务层面的影响,实现通过自定义服务并创建服务树以执行影响分析,包括定义和监控业务服务SLA级别、模拟停机以查看业务级别的影响、多种服务状态计算算法、为定制服务状态计算自定义服务权重、根据服务权重或不可用子服务的数量和百分比计算业务服务可用性等。 3、 支持通过灵活的权限模式为多租户环境提供全面支持,实现自定义对特定服务访问受限的角色、通过限制对服务树的读写权限以保护角色等功能。 4、 支持使用自定义SLA计算逻辑定义服务和服务组件,包括分析相关服务的状态,以执行SLA计算,当服务的单个或所有组件处于问题状态时,降低SLA;为单个服务的复杂SLA计算创建服务树,以及可访问服务SLA的每日/每周/每月/每年概览等。 数据可视化 1、 可以多种方式显示采集到的数据,支持自定义基于构件的仪表盘显示相关信息。可选择不同类型构件,支持在仪表盘上显示指标、问题、基础设施和地理环境拓扑图、显示当前的业务服务SLA信息、访问指标、问题、报告和拓扑图等。 2、 支持通过图形分析和关联指标,支持多种图形类型及在图形上显示问题、具备灵活的时间导航器、使用趋势数据进行长期数据概览及显示任何时间段的历史数据、显示聚合数据图等。 3、 通过与相关系统集成,实现在GIS上跟踪监控目标,支持仪表盘上显示环境的地理概况、访问任何监控目标、将监控目标分组并入集群及跟踪单个监控目标或整个集群状态等。 4、 支持在拓扑图上呈现基础设施的当前状态,展示元素状态及实时数据及基础设施和应用的概览,实现在拓扑图上实时显示任何数据、克隆和修改现有拓扑图、从拓扑图执行脚本、创建多级拓扑图、基于上下文的交互、创建拓扑图元素之间的链接等。 5、 支持灵活定制、生成定时报表,实现将报表直接发送到收件箱可定期每日、每周或每月发送报表等功能。 安全及加密 1、 具备完善的安全体系,加密平台内组件之间的通信且所有通信都支持TLS协议、支持证书和预共享密钥加密,所有敏感信息都经过加密,以提高安全性。 2、 提供灵活的用户权限模式,可以两级或多级分布式环境中有效管理用户权限。 3、 实现基于角色的用户权限管理,为分布式运维环境中的不同类型的用户创建自定义用户角色,并为其提供精细化的权限。基于用户角色可以控制用户对UI、功能及数据的访问,以满足不同应用模式下的用户管理和授权需求。 4、 支持多种认证方式和协议,并可利用现有基础设施对用户进行身份验证。支持包括HTTP身份验证、多因素身份验证、自定义密码复杂性要求、LDAP、SAML等联合认证协议。 5、 提供全程审计服务,自动跟踪配置更改。包括找出哪些用户对任何数据或实体进行了更改、跟踪用户登录的IP地址、筛选审计日志并跟踪特定用户对特定资源所做的更改,并可导出完整或筛选的审计日志,以供进一步分析。 |