it运行维护监控软件招标文件内容摘要:

供良好的支持,如无线网络技术、 QOS、 XDSL等。 可支持分布式体系结构,最少化地占用网络资源。 能够定义多个管理域,支持网络管理员在第 12 页 共 29 页 任何地点 都可以通过 Web浏览器安全地访问网管系统以控制不同的管理范围和执行不同的管理任务。 管理软件应支持内嵌的冗余切换功能,而不必依赖外部 Cluster/HA系统。 操作系统基本监控指标 系统监控采用基于代理的监控构架,能够深入获取被管理对象的信息。 系统监控代理支持主流 Unix( AIX HP Unix、 SUN Solaris V8/V9/V HPUX 11i、 OS400 )、主流 Linux( RHEL 、 SLES 8/9/ Red Flag )、主流Windows( Win 20 Win 20 Win XP)平台。 其监控的主要内容应包括: CPU利用率,显示系统、用户、空闲时间的百分比; 进程的运行情况,如进程、多个实例、子进程等 CPU/内存等系统资源的占用情况等等。 并对相关事件发出警告。 磁盘监控:监控系统上配置的物理磁盘的相关属性,监控内容包括 iNode、 Mount 点、以及磁盘空间使用率、数据传输率、平均等待时间及繁忙程度等。 当使用率超过特定阈值时向系统管理员报警; 文件监控:监控系统中文件和目录的相关属性,主要监控 内容包括名称、尺寸、拥有者、访问权限以及链接等。 监视重要的文件,如发现文件被修改或文件大小迅速增长时 向系统管理员报警和产生相应的动作; 用户属性:检测与用户有特定关联的属性,主要关注:用户名、用户 ID、 Idle时间、位置信息、登录时间、登录终端等。 监控网络端口的输入、输出、错包,以及端口是否被停用或者删除; 日志文件的变化情况,可跟踪操作系统、数据库及用户应用系统的日志文件,根据日志中出现的特定信息进行报警或自动执行用户预定义的动作; 提供通用型代理,可以通过脚本程序采集系统参数,从而满足更广泛的监控需 求。 UNIX系统还可以监控 Load Average:服务器平均处理量 Physical Disk:每秒钟读写的流量 Inter Process Communication:共享内存、消息队列、信号量 Windows系统还可以监控 Distributed File System (DFS) Link Mounts Quotas Directories Services Jobs Sessions Registry Unix系统监控列表: 磁盘监控 : 监控系统上配置的物理磁盘的相 关属性,主要监控内容包括 Inode、 Mount 点 、 以及磁盘空间使用率、数据传输率、平均等待时间及繁忙程度等。 基本信息监控:包括磁盘名监控: 监控当前文件系统 Mount的物理盘名称;系统名监控:监控当前系统的主机名等。 Inode监控:监控磁盘当前的 Inode总数、正在使用的 Inode的数量、剩余的 Inode数量、某个文件系统上分配的 Inode数量,以及 Inode使用率等内容,统计值包括平均、最大、最小及总计使用率等。 Mount点监控:监控当前文件系统 Mount点的路径名等。 第 13 页 共 29 页 文件系统监控:包括文件系统 尺寸监控,统计值包括平均、最大、最小及总计使用率等。 空间监控:包括当前可用的磁盘空间、可用的磁盘空间百分比、磁盘空间使用率等,统计值包括平均、最大、最小及总计使用率等。 磁盘性能监控:包括平均磁盘请求队列监控,平均磁盘访问等待时间监控,磁盘数据传输时间百分比,当物理磁盘使用时间百分率过高时,监控系统会产生 “磁盘时间百分率很高 ”的报警事件。 当磁盘每秒读取过多的数据时,监控系统会产生 “每秒读取字节数很高 ”的报警事件。 文件监控: 监控系统中文件和目录的相关属性,主要监控内容包括名称、尺寸、拥有者、访问权限以 及链接等。 基本监控信息:包括被监控文件的名称、文件大小、文件的类型、文件所在的路径名、文件和目录的访问权限、链接名、拥有者、所属组信息,以及文件最近被访问时间,上次修改时间等。 网卡 : 检测与在基于 Unix的操作系统上安装的所有网络接口卡有特定关联的瓶颈,监测内容主要有:接收和发送帧统计、网络接口名、接口 IP地址以及接口状态等。 监控所有网络接口的帧平均冲突率、平均接收率、平均发送率,平均接收错误率、平均发送错误率、采样周期包括 1分钟、 5分钟、 15分钟、 60分钟等。 网卡流量统计:包括在一个给定的采样周 期内收到帧的数量、发送帧的数量、帧冲突、接收错误。 监控所有网络接口的包接收率,包冲突率、接收错误率、发送率、发送错误率、采样周期包括 1分钟、 5分钟、 15分钟、 60分钟等。 最大传输单元监控( FMTU):监控网卡上传输包的最大尺寸,统计值包括平均、最大、最小及总计使用率等。 NFS统计 : 检测与 NFS有特定关联的瓶颈,主要关注:连接及错误等。 主要监控内容有: 监控一定时期内的 NFS客户端的连接请求数量,以及被服务器拒绝的数量以及百分比等。 通过分析各种 NFS服务器及客户端的各种调用类型如: System Statistics Calls、 Get Attribute Calls、 Link Calls 、 Make Directory Calls、 Null Calls、 Read Calls 、 Read Directory Calls、 Read Link Calls Remove Directory Calls 、 Remove File Calls、 Rename File Calls、 root Calls 、 Set Attribute Calls 、 Symbolic Link Calls、 Write Cache Calls等帮助管理员分析和判断 NFS流量,修正相关问题。 RPC统计 : 检测与 RPC有特定关联的瓶颈,主要关注:调用及错误信息等。 主要监控内容有: 监控一定时期内的 RPC客户端的连接请求数量,转发、等待超时、以及被服务器拒绝的数量以及百分比等; 监控 RPC传输包状态如:在一个监控周期内的不正确的 RPC包数量、如服务器包头信息不正确,服务器返回包太短等。 进程 : 检测与进程有特定关联的瓶颈,如:进程占用系统资源的情况监控,以及进程状态等,当某个进程占用 CPU时间过高时,监控系统会产生 “进程占用 CPU时间过高 ”的报警事件,并即时发送给故障管理控制台与业务管理控制台。 进程监控参数包括:进程组 ID、用户 ID、父进程 ID、进程会话 ID、以及占用系统 CPU时间、用户 CPU时间、占用内存的百分比、占用的虚拟内存地址、进程开始时间、进程运行时长、启动该进程的命令行等。 进程状态监控如:监控处于不存在、活动、正在运行、停止、睡眠、等待状态的进程等。 监控启动该进程的终端名、用户名、 Major Fault、 Minor Fault、进程的优先级等。 在处理其中当前运行的进程监控,处于运行队列中等待 CPU的进程监控,进 程 Idle时间监控,第 14 页 共 29 页 进程等待 CPU时间、处于等待锁状态的进程监控等。 CPU: 检测与中央处理器( CPU)相关的瓶颈,主要关注: CPU使用率很高,多个处理器问题。 在监控过程中可以识别的 CPU问题有: 当系统有多个处理器且最多使用和最少使用的处理器的使用百分率之差很高时,监控系统会产生 “使用率差值百分率很高 ”的报警事件。 当系统中安装的一个或多个设备占用过多处理器时间时,监控系统会产生 “硬件忙 ”的报警事件。 当某个进程使用处理器时间百分率过高时,监控系统会产生 “进程数很高 ”的报警事件。 检测在一定的时间范 围内,平均 CPU繁忙时间、平均用户 CPU时间、平均系统 CPU时间,采样周期包括 1分钟、 5分钟、 15分钟、 60分钟等。 当处理器使用率很高,但并不是由于特定进程或设备在运行时,监控系统会产生 “处理器忙 ”的报警事件。 监控处于等待 I/O的状态的 CPU时间,当系统调用达到监控策略中的规定值时,监控系统会就此问题产生报警事件。 在多处理器环境中监控 CPU状态包括 CPU ID 、 Online、 Offline状态等。 系统属性 : 检测与 Unix系统有特定关联的瓶颈,主要关注:虚拟内存, Swap区、负载平均,逻辑块读 写等。 在监控过程中可以识别的问题有: 监控有关内存的使用情况,可以识别系统中可用内存过低, SWAP可用空间过低,额外的或异常的系统页面调度,如 pagein或 pageout,当这些情况的发生频率达到监控策略中的规定值时,监控系统会就此问题产生报警事件,并即时发送到故障控制台和业务管理控制台。 在一定的采样周期内,当存在过度从磁盘物理块读取或向磁盘物理块写入等情况时,监控系统会产生相应的报警事件。 在一定的采样周期内,当存在过度从磁盘逻辑块读取或向磁盘逻辑块写入等情况时,监控系统会产生相应的报警事件。 监控 系统的平均负载,当系统内核运行队列中存在的进程超过监控策略中的规定值时,监控系统会就此问题产生报警事件。 监控系统调用,当系统调用达到监控策略中的规定值时,监控系统会就此问题产生报警事件。 用户属性 : 检测与用户有特定关联的属性,主要关注:用户名、用户 ID、 Idle时间、位置信息、登录时间、登录终端等。 Windows系统监控列表: 属性组 描述 Active Server Pages( ASP,动态网页技术) 监控 Active Server Page请求,会话信息和内存分配状况。 DHCP Server(动态主机配置协议服务器) 监控服务器 DHCP信息的发送和接受,服务器对每个信息包花费的平均处理时间,以及由于内部延迟导致的服务器丢失信息包数。 DNS Dynamic Update( DNS动态更新) 监控客户端发起的 DNS动态更新。 DNS Memory ( DNS 内存) 对于用户 UDP或 TCP通信,监控 DNS服务器与内存使用相关的活动。 DNS Query ( DNS 查 对于 UDP和 TCP通信,监控 DNS服务器所有的查询请求和第 15 页 共 29 页 询) 响应。 DNS WINS( WINS域名解析) 监控 WINS服务 器发起和接收的查询请求和响应。 DNS Zone Transfer( DNS区域传输) 对于主 DNS服务器和二级 DNS服务器发送和接收的区域传输请求和响应,监控其成功情况。 FTP Server Statistics( FTP服务器状态) 监控 FTP服务器状态,如当前连接,每秒接收的字节数,非匿名用户连接总数。 FTP Service( FTP服务) 监控 FTP服务器的通信流量和连接状况。 Gopher Service( Gopher服务) 监控 Gopher服务器的通信状况和连接活动。 如当前连接,每秒接收的 字节数,非匿名用户连接总数。 HTTP Content Index( HTTP内容检索) 监控对 HTTP服务器的请求。 如活动请求的数量,当前排队的请求,以及请求缓存的命中率。 HTTP Service ( HTTP服务) 监控 HTTP服务器的通信流量和连接活动。 如当前连接,每秒接收的字节数,非匿名用户连接总数。 ICMP Statistics( ICMP状态) 监控消息流量。 ICMP 消息用来传达网络操作的结果,例如 PING操作。 IIS Statistics( IIS状态) 监控内存使用率和连接数据。 Indexing Service(索引服务) 控索引的创建和合并。 Indexing Service Filter ( 索引 服务 过 滤器) 监控索引建立速度和绑定时间。 IP Statistics( IP状态) 监控使用 IP协议的数据流量和碎片统计信息。 Job Object(工作对象) 监控工作核心对象,一个工作消耗的系统资源,包含的进程数。 Job Object Details(工作对象详细信息) 监控各别工作核心对象的详细信息。 如一个工作消耗的系统资源,包含的进程数。 Network Interface(网络接口) 监控一个 TCP/IP连接上的字节和信息包的发送和接收速率。 Network Segment(网段) 监控一个网段上的数据利用率和传输状态。 此部分数据来自于 Microsoft(R) Network Monitor。 NT_Cache( NT缓存) 监控缓存活动,如缓存页的读取频率,缓存拷贝请求的成功率,以及缓存快速写入磁盘的页面数量。 NT_Device Dependencies( NT设备依存关系) 获取所有设备和在必须提前启动的负载定制组的状态和配置信息。 NT_Devices (。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。