用Python+GTK开发机群网络通信监控系统
曙光系列超级服务器是由国家智能计算机研究开发中心研制的基于分布式存储和消息传递的高端机群,是通用的可扩展的超级服务器系统。被广泛地应用于科学与商务计算,事务处理以及Internet信息服务等领域。
作为曙光3000超级服务器的后继,曙光Linux超级服务器由64个SMP节点组成,操作系统为Linux,机群内部各节点均通过高速的Myrinet网相连。Myrinet网卡通过自行开发研制的通信协议BCL(Basic Communicate Library)使用。文中所述的机群网络通信监控系统正是对该机群系统的通信情况进行监控,包括对节点网络设备状态信息的查询,网络通塞状态和负载情况的实时监控等。
监控系统必须解决以下的关键问题:
实时性:保证对机群网络通信情况的实时监控和监控结果的实时刷新。
资源占用率:尽可能少地占用系统资源,不能影响并行应用的正常运行或有损机群网络的通信带宽。
可视化:提供友好的用户界面和可视化操作,提高系统的易用性。
可移植性和可扩展性:具有良好的可移植性和可扩展性,便于在不同系统上的移植和系统规模和功能的扩展。
下载地址
用户评论