申请/专利权人:合肥先进计算中心运营管理有限公司 | 申请日:2024-01-19 |
发明/设计人:戴煜;刘翀;康浩鹏;张家杰;姚胜 | 公开(公告)日:2024-02-23 |
代理机构:安徽思尔六知识产权代理事务所(普通合伙) | 公开(公告)号:CN117596126A |
代理人:闫啸 | 主分类号:H04L41/0631 |
地址:230088 安徽省合肥市高新区望江西路900号中安创谷科技园西北角D9栋5层521室 | 分类号:H04L41/0631;H04L41/142;H04L41/16 |
专利状态码:在审-实质审查的生效 | 优先权: |
法律状态:2024.03.12#实质审查的生效 2024.02.23#公开 |
摘要:本发明涉及分布式计算技术领域,公开了一种针对高性能集群中高速网络异常的监控方法,包括:获取网络连接异常的集群节点的信息;获取第一集群节点所在的并行通信域的信息;根据第一集群节点所在的并行通信域的信息来生成域关系,如果在一个并行通信域内两个集群节点之间存在相互通信的关系,则为这两个集群节点生成域关系;为每个集群节点生成表征特征;将集群节点的表征特征输入异常识别模型中,输出表示第一集群节点的网络异常原因类型的结果;本发明通过训练模型学习集群节点的网络异常在各层通信域内的发生模式来识别集群节点的网络异常的原因,能够针对性的及时进行响应和调整,稳定了高性能计算集群的服务响应速度。 |
主权项:1.一种针对高性能集群中高速网络异常的监控方法,其特征在于,包括以下步骤:/n步骤101,获取网络连接异常的集群节点的信息,定义网络连接异常的集群节点为第一集群节点,第一集群节点之外的集群节点定义为第二集群节点;/n步骤102,获取第一集群节点所在的并行通信域的信息;/n步骤103,根据第一集群节点所在的并行通信域的信息来生成域关系,如果在一个并行通信域内两个集群节点之间存在相互通信的关系,则为这两个集群节点生成域关系;/n步骤104,为每个集群节点生成表征特征;/n步骤105,将集群节点的表征特征输入异常识别模型中,输出表示第一集群节点的网络异常原因类型的结果。/n |