光大科技

统一事件处理

新一代分布式事件处理引擎

资源申请

产品简介

  统一事件处理引擎基于内存数据库自主研发,采用合理的设计方案与巧妙的技术架构,打造功能全面的告警事件处理产品,且数据可持久化落盘。

产品特性

  • 分布式处理、集群的高可用

    分布式处理、集群的高可用

    提供分布式调用和负载均衡功能,处理能力可随时热扩展;处理节点在宕一定数量的情况下集群依然可用

  • 告警链路追踪

    告警链路追踪

    每一条告警处理的关键路径上都有追踪信息,可以查看和统计告警处理的性能指标

  • App热拔插

    App热拔插

    对于大型复杂的处理逻辑,可以在Idea、Eclipse等开发环境中用Scala或Java语言开发,打成Jar包热部署到报警处理引擎中,同时也可以随时将App卸载

  • App可编排、调度、协作

    App可编排、调度、协作

    流APP可链条化编排,批APP可调度运行在不同的节点上,各APP间可协做共同完成复杂的业务,如汇总处理、分布处理

  • 高并发,高性能

    高并发,高性能

    告警处理入库能力达到10000条/s;活动告警库支持1000万级存储;历史告警库亿级存储

  • 兼容性

    兼容性

    全兼容商业套件的处理规则;报警处理逻辑可平滑过渡

  • 灾备和多数据中心部署

    灾备和多数据中心部署

    数据定时自动备份,全备+增量备份的方式,保证数据无丢失;支持多数据中心主备模式部署,数据中心间自动数据同步

  • 扩展性

    扩展性

    持自定义App开发和部署;支持类SQL App转Java字节码运行,扩充SQL函数及语法

应用场景

  • 事件采集应用场景
  • 事件处理应用场景
  • 事件呈现和处置应用场景
  • 数据中心级统一事件处理
  • 数据来源复杂:各种格式的Syslog报文、各种采集工具的报文、Snmp报文等等;
    数据格式多样:各种报文格式互不一样;
    数据采集延时要求高:从事件发生到采集完毕需要在毫秒级完成。
  • 数据吞吐量大:企业存在大量的网络设备和系统应用,每秒产生的告警数据至少在1000以上;
    告警风暴:由于系统测试或网络原因,企业网络和应用会时不时产生告警风暴,每秒可能达到数万条;
    数据存量大:活动告警存量可达到100万级;
    数据相关性高:事件之间存在大量的相关性,需要对相关性告警进行精准与合理的处理;
    数据处理复杂:每一个事件都会经过一系列复杂的流处理,相关的一组告警会经过一系列的批处理;
    数据处理链条化:一个事件从发生到处理完毕是经过的一个复杂的逻辑链处理,不同类别的告警逻辑链不同;
    数据反复处理:并不是一个事件处理完了就意味着这个事件的生命周期就结束了,可能存在反复处理的情况;
    数据规模日益增大:事件规模会随着时间的推移越来越大;
    数据处理规则继承:对于已有的事件处理规则需要合理继承,而不是重新开发;
    数据处理延时要求高:从事件发生到处理完毕应该在秒级完成。 
  •   事件统一展现,集中处置,可根据规则自动生成事件工单。

  • 可对接各运维工具生成的事件,进行统一处理、关联分析、统一事件通知等。

产品功能

  • 告警事件集中处理

    将采集来自不同数据源(SNMP、Zabbix、Syslog等)的告警事件进行统一处理

    将采集来自不同数据源(SNMP、Zabbix、Syslog等)的告警事件进行统一处理

  • 告警压制

    当某个节点或应用产生告警风暴时,会合理压缩告警数据量,将同根因造成的告警压缩成一条告警信息

    当某个节点或应用产生告警风暴时,会合理压缩告警数据量,将同根因造成的告警压缩成一条告警信息

  • 告警升降级

    若告警产生时,可根据指标数据变化或人为干预自动完成告警的升降级

    若告警产生时,可根据指标数据变化或人为干预自动完成告警的升降级

  • 告警关联分析

    在告警风暴时,众多告警会根据告警产生的根因与关联关系进行分析,找出相关联的告警并汇总

    在告警风暴时,众多告警会根据告警产生的根因与关联关系进行分析,找出相关联的告警并汇总