[Product Description]
Around-View Monitoring Solution "HiveQueue Plus"
HiveQueue Plus是用一项解决方案将企业内运营系统中分散保管的各种Log与System资源使用情况进行收集、存储并通过提供分析数据来统一管理运营环境中所发生的各项障碍的网络型系统运营支援工具。
HiveQueue Plus中的Collector由属于服务器模块的HUB与客户Agent模块组成,HUB可以安装在支援Java环境的各种操作系统中,并且因其使用embedded DB而节省了需要另行管理DB的费用。而对于无法安装Collector的网络、防火墙、存储设备等可利用SNMP(Simple Network Management Protocol)实现对系统资源使用情况的监测。
1. Login
2. Dashboard
4. Report
5. Search
[Main Function]
1. Log Monitoring
- 可收集所有类型系统的所有记录并进行统一查询及追踪障碍原因
- 记录(Log)·关键词的查询及收集 查询统计信息
- 管理Log Life Cycle: 收集、保存、查询、分析、废弃等一连串过程的自动化
2. Transaction Monitoring
- 以月/日/时为单位对界面处理现状进行监测
- 针对包括关键词在内的界面进行查询
- 针对包括所有链接系统在内的界面的处理步骤与结果进行确认
- 监测事务(transaction)性能以及追踪障碍
- 发生障碍时邮件通知负责人
3. Syslog Monitoring
- 实时收集系统、网络设备等的活动记录
- 实时通知障碍信息
- 实时查询以Full Text为基础的Syslog
4. Resource Monitoring
- 对系统资源的监测:提供CPU, Memory, Network等的使用量(View)
- 对Network Traffic Log的监测:端口Index, 物理性地址, 状态, Status, In/Out速度与使用量
- 对Resource Usage的监测:CPU的使用量/ Idle, memory Total/ Swap / Free / Cache / Buffer / Usage, Disk Total / Usage / Free
5 Activity Monitoring
- 与过去同一星期·同一时间段的数据进行比较,掌握发生方式之间的差别
- 提供资源(CPU, Memory, Network Inbound 等)使用量,关键词的发生履历,Severity的趋势图
6. Notification
- 监视异常征兆、界面发生错误、关键词等并邮件通报负责人
- 发生障碍、活动时随时通知并提供详细画面
- 通过制定界面 / 系统 / 负责人关系来管理信息接近权限
7. Issue Tracking
- 实时追踪界面的事务(transaction)单位处理现状及障碍信息
- 查询原始记录数据
- 运用Web Tail进行管理支援并监视关键词
- 通过统一查询不同机种之间的记录履历,帮助分析障碍原因
- 通过监视Keyword, Severity计算出发生频率并对频繁发生的Keyword, Severity(Error Code等)问题进行原因分析以及测试障碍发生频率
[Standards and Components]
1. HiveQueue Plus运营支援事项
区分
|
HUB(Server)
|
Collector(Agent)
|
OS
|
Linux or Windows
|
Any OS
|
CPU
|
4-core 以上
|
Any CPU
|
Memory
|
16GB 以上
|
400MB 以上
|
HDD
|
App: 1.5GB 以上
Data: 100GB ~
|
200MB 以上
|
JVM
|
JDK 1.7
|
JDK 1.7, 1.8
|
Account
|
一般使用者分配账户
(windows需要管理者权限)
|
一般使用者分配账户
(但, 设置SNMP时需要一段时间的root权限)
|
负荷
|
|
CPU: 3%以内
|
2. HiveQueue Plus记录的收集方法及概念
HiveQueue+可通过支援Agent(HQ+ Collector)方式来收集一般服务器所发生的Log,同时也能够通过支援Agentless方式来收集无法安装Agent的网络、防火墙设备等的Log。
区分
|
Agent
|
Agentless
|
收集对象
|
• 资源使用现状(SNMP Query), SNMP Trap Log, Syslog,
• System / Application / Interface / WEB / WAS Log, DB Query 等
|
• 资源使用现状(SNMP Query), SNMP Trap Log, Syslog
|
收集周期
|
• 实时收集 –Application, Interface, WEB/WAS, Trap, Syslog 等
• 定期收集 –SNMP, DB Query
|
• 实时收集 –Trap, Syslog
• 定期收集 –SNMP Query
|
支援设备
|
• 可以安装Java App的所有系统(Windows, Linux, Unix 等)
|
• 网络设备,防火墙设备,存储,VPN 等
|
其他
|
• SNMP community 及 Trap, Syslog 传送 Target 的设定
• 需要 JDK 1.7
|
• SNMP community 及 Trap, Syslog 传送 Target 的设定
|
3. 对HiveQueue Plus进行界面监测时的注意事项
如想使用HiveQueue+的 Interface监测功能,则Interface Log中必须有以下项目。
如无此项或输出值为null时将无法进行Transaction的收集加工。
项目
|
说明
|
最大长度
|
Root
|
又叫Root Context ID,是可以使Interface单位内发生的个别Transaction捆绑在一起的包含共同Key值的Field。
|
Maximum size 50 byte
|
Interface ID
|
是意味着System之间进行信息链接以便逻辑性处理一项事务的Field。
|
Maximum size 200 byte
|
[To add]
1. 主要特征
■运营管理
§ 提供网络服务以便使用起来更加方便
§ Log分析不再需要直接接近运营系统,因而可以减轻管理账号带来的麻烦
§ 可按照不同的使用者制定监测对象系统、画面菜单的接近权限等从而提高安全性
§ 使用一个解决方案便可以同时管理Log与System资源,可节省额外的解决方案导入费用
■收集/存储
§ 实时收集各种形式的Log: OS, Database, WAS, WEB, 内部业务程序, 正在运营中的其他各项常用工具, SNMP Trap Log 等
§ 收集有关支援SNMP的所有设备的资源使用现状
§ 收集有关服务器中正在运行的所有Process的详细信息, 物理磁盘的I/O
§ Collector(Agent)负荷的最小化: CPU使用率3%以下
§ Log Life Cycle管理的自动化: 收集 存储 监测 查询 分析 备份 废弃等一连串过程的自动化管理
§ 为防止个人信息泄露而进行实时Log masking: 不仅可以收集Log,而且还可以对原始Log进行masking(需要原始Log使用权限)
■警告/监测
§ 重要活动通知(Notification): 画面Header Bar中时刻表示通知个数,邮件及SMS通知 (顾客的邮件、SMS传送System需要进行链接) - Hardware, Resource 相关通知: System障碍,使用过多资源,网络端口发生异常 - Application, Interface 相关通知: Interface发生错误,发生Keyword,Log危险度(Severity)
§ 提供不用通过接近运营系统便能实时确认所发生的Log的网络型Tail服务
§ 提供Database的session信息及Table space的监测
■分析
§ Interface Log的水平监测
§ Interface Performance: 通过分析Interface的处理速度监视并通知异常征兆
§ Activity Monitoring: 对同一星期、同一时间段的分析 –Interface, Keyword, Severity, Resource
- Interface 发生件数
- Keyword 发生件数
- Severity 发生件数
- Resource 使用量