新闻动态

服务器宕机_服务器“异常”的6个可能性预警

发布日期:2020-12-23 16:36 | 文章来源:YINGSOO

  【小编提示】本文部分内容摘自网络,仅供参考!如需了解服务器租用\托管相关问题,请咨询YINGSOO专业客服,享受1V1贴心服务!免费热线400-630-3752

  【本周热销】香港高防服务器香港云服务器租用美国云主机美国主机租用

  【选购帮助】租用国外服务器能干嘛?要注意什么?

服务器宕机

[美国高防御主机]

    YINGSOO小编知道用户都听说过服务器宕机这个问题,但是一说到服务器宕机检测,可能会让大家想到,服务器宕机了肯定能很快知道的,这个问题还有什么可做的呢?但是实际上,现在大部分的服务器宕机的时候,是不能被用户及时感知的。今天这篇文章YINGSOO小编就来就来简单介绍一下服务器“异常”的6个可能性预警。

    宕机,指操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。它属于电脑运作的一种正常现象,任何电脑都会出现这种情况。

    服务器宕机,ping或者ssh这是最简单的做法,但真正的工程实践,没这么简单。

    如果想要获知服务器宕机怎么办?用户可以通过服务器宕机实时检测:

    1)发现宕机。

    2)提前告警。

    3)告知宕机的详细原因,如硬件故障,内核bug,网络异常等等。

    4)自动报修生成工单。

    我们用户要知道,进行全网物理机宕机准确探测与实时发现,可以给宕机分析提供第一现场,获取第一现场的日志。也可以尽早将宕机数据推送给业务或运营感知并处理,如自动报修,业务迁移等,从而尽可能将业务影响降到最低。

    更重要的是,准确的服器宕机发现数据可以为宕机预测提供准确的标注数据,为后期宕机预测提供数据基础,并且这些数据提供给运营部门进行整体分析,提升处理效率。

    那么,用户怎样可以准确发现服务器宕机呢?减少误报呢?可以有以下操作,比如:

    1、异常排除

    排除非物理机器,将系统中暂时不关注的VM等产生的异常信息排除掉。

    排除非业务状态的机器,如装机状态中的[日本服务器租用],包括生产中,维修中,迁移中,重装中,销毁中,重启中,无管控状态,只监控正常状态的机器。

    排除非正在工作的机器,如非working状态机器。

    2、网络干扰排除

    宕机分析中,较多误报是由于网络问题干扰,无法准确判断出物理机是否宕机,有可能是网络问题。

    排除上网络设备异常导致的误报,包括机房断网演练,小面积网络故障,上联网络故障,如通过探测丢包情况,使用一些逻辑初步判断网络问题。

    服务器本身未丢包的误报,除了需要过滤出网络问题,还要通过丢包数据分析,过滤掉SA误报问题, SA异常会上报心跳异常,被误理解为宕机。

    icmp及tcp丢包分析,icmp采集频率为固定数秒,tcp采集频率固定数秒,包括多个不同大小包(16,32,64,128,256等)的丢包情况,根据分析时间窗内两项数据的丢包情况

    3、特殊情况干扰排除

    个别机房有时候会出现大面积风暴式的无故心跳异常,同时网络ping包异常,但上联网络设备ping包正常,这种误报,一般根据具体case具体进行针对性的分析。如根据监控每个机房的上报频率,排除干扰。

    4、进一步识别误报

    至此,大部分干扰已经过滤掉,但仍有一部分误报隐藏其中。比如心跳异常,ping异常,都合乎宕机判断的逻辑,会导致误判成宕机,如导致网卡被打爆,或者重试率高,这种是业务原因导致网络异常,但业务认为不是异常,需要排除掉。再例如服务器并没有挂掉,但是IO延时和资源占用率各项指标都不正常等场景。针对以上等情况,增加uptime判断以及带外日志分析排查。

    宕机时间点探测uptime确定是否发生重启。

    进一步通过分析日志是否连续,判断是否发生重启。

    日志重启特征值匹配,确认是否发生重启。

    如果还不能确定,使用uptime的时间窗技术进行重启。

    仍不能确定的待处理,进入长尾处理名单。

    5、长尾再次处理

    未确认的待处理的,会加入到长尾列表中,像这种分钟级的心跳异常,ping异常,但串口日志一直正常输出的情况,一般就是某种死机,死到连网络都不通的场景。会观察一段时间,一个固定时间窗内仍未恢复或重启的话,就暂时报宕机。后期会把这种死机单独找划分归类。

    6、心跳源检测异常

    顾名思义,通过心跳源,初步发现异常。通常心跳变化会有三类消息,update消息,delete消息和insert消息。心跳逻辑在于,正常情况下SA服务端与NC建立长连接,每数秒缓存一次心跳,每几分钟打包上报一次,但当NC异常时,长连接感知后,立即上报异常,并修改路由表。所以心跳异常做到秒级感知。

    update消息,在有心跳发生变化情况下都会有,心跳异常和心跳恢复正常时都会发起,是主要的心跳来源。

    delete消息,在心跳异常,并且SA判断ping不通,且ssh不通情况下发起,删除该条消息,避免延迟太长。

    insert消息,在新增加机器, 或者重装后重新上位的机器发起,该消息对宕机发现价值不大,配合uptime使用。

    心跳源检测任务逻辑,主要是监听并缓存uptime消息,同时避免时间窗内多次消息冲突,导致信息被覆盖。

    上面已经介绍这么多了,到底效果会怎么样呢?

    从准确率和覆盖率来看:

    准确率:目前发现的服务器宕机中有很高准确度,可以区分出真正宕机或者未宕机。而判断为宕机的数据中,也存在少量的,由于缺少相关信息导致误报,该部分将进一步优化,逐渐降低误报,在新的措施之后,该比例会接近0。

    覆盖率:当前统计的覆盖率已经能很好的支撑日常服务器宕机处理,该数据在有足够的特征后,会进一步提升。

    目前,服务器宕机感知是宕机分析的基础,通过服务器宕机实时检测,会把相应的宕机原因分布整理出来,明确具体的原因,达成服务器极致可靠性。

    看了以上YINGSOO小编为各位整理的关于服务器“异常”的6个可能性预警的介绍,希望用户在遇到服务器宕机的时候会第一时间知道,上面所介绍的服务器宕机的一系列问题,希望能帮助到想要了解服务器宕机方面信息的朋友们。

  香港企业级服务器租用拥有哪些优势呢

  针对企业和其本身网址而言,最重[香港主机哪个好]要的便是网址上的业务流程数据信息了,因而必须有着一个可以确保网络信息安全并能够承重高韧性负荷的香港服务器,而香港企业级服务器则是网站站长甄选的挑选。

  可是香港企业级服务器有着什么优点呢?香港企业级服务器又具有什么其他的网络服务器所无可比拟的作用呢?

  一、私有全部資源

  香港企业级服务器能够私有CPU、运行内存、固态盘等硬[服务器防御]件平台,出示的性能卓越不是VPS、虚拟主机等相比。香港企业级服务器有着单独的电脑操作系统,http、ftp、ssh、sendmail、mysql等全是私有。而虚拟主机是很多客户资源共享,不管安全系数、特性還是操纵可玩性,都没法与香港独立主机对比。代管或租赁香港服务器,你能自身选中你要用的任意php、mysql、apache、perl版本号,想升級就升級,想装其他的手机软件,自身就可以装。

  二、最大管理员权限,可安全性能极强

  香港企业级服务器的租赁客户有着最大管理员权限,除出示基本的WEB、FTP服务项目之外,客户可安裝任意电脑操作系统,配备任意所需自然环境,安裝任意手机软件,乃至可远程操作电源总开关机和重新启动,并独立保持全部的操纵、管理方法和维护保养工作中。香港服务器适用独立设定安全设置,不象虚拟主机是由服务提供商系统软件管理权限隔开的,只是在系统软件自然环境里,因此彻底是单独的。不象虚拟主机一样会受其他网址的危害。最重要的是,香港服务器能够适配虚拟主机没法适配的程序流程、自然环境。

  三、适用資源超名额应用

  香港企业级服务器适用資源的超名额应用,容许你占有資源的最高值超出系统软件要求的信用额度,进而你的设备服务项目一切正常运作。

  四、适用系统软件自动升级

  香港企业级服务器适用自动升级系统软件系统软件,而随着减少安全隐患。

  五、随意应用故障检测专用工具

  香港企业级服务器可随意安裝所需操作面板,可自助式管理方法和应用故障检测专用工具:重启动、修补、重新安装、备份文件、实时监测运作。而在其中的运行日志和資源运用统计分析作用协助管理人员发觉和故障检测。

  之上五点便是香港企业级服务器所具有的作用啦,拥有这种作用网络服务器应用和维护保养起來否更便捷,降低很多多余的工作中。

  YINGSOO热线:400 630 3752

  热门搜索:【云服务器价格】【美国云服务器吧】【流媒体服务器托管】【ip高防服务器】【香港VPS免备案优势有哪些】【影响香港服务器速度的主要因素】【主机托管百兆独享】【香港G630服务器好不好】【云服务器cvm是什么意思】【为什么国外虚拟空间一般不能抗攻击】【英国云主机好用吗】【搭建云服务器教程】【服务器空间租用时会走入哪些误区】【YINGSOO日本云服务器上线】【海外云主机的选用】【服务器如何选择】【专用备份服务器】【服务器是什么】【服务器租用的好坏】【美国秒解服务器与高防服务器

  YINGSOO日本虚拟主机3天免费试用,海外云主机品牌

  好网络,不怕晒!日本虚拟主机免费试用,独享控制面板,海外云服务品牌2019年日本虚拟主机销量再度破表,1200家企业共同选择,高达95%的续约率

  https://www.yingsoo.com/products/cloud-jp.html

  YINGSOO日本cn2gia主机3天免费试用,海外云主机品牌

  好网络,不怕晒!日本cn2gia主机免费试用,独享控制面板,海外云服务品牌2019年日本cn2gia主机销量再度破表,1200家企业共同选择,高达95%的续约率

  https://www.yingsoo.com/products/cloud-jp.html

版权声明:本站文章来源标注为YINGSOO的内容版权均为本站所有,欢迎引用、转载,请保持原文完整并注明来源及原文链接。禁止复制或仿造本网站,禁止在非www.yingsoo.com所属的服务器上建立镜像,否则将依法追究法律责任。本站部分内容来源于网友推荐、互联网收集整理而来,仅供学习参考,不代表本站立场,如有内容涉嫌侵权,请联系alex-e#qq.com处理。

相关文章

实时开通

自选配置、实时开通

免备案

全球线路精选!

全天候客户服务

7x24全年不间断在线

专属顾问服务

1对1客户咨询顾问

在线
客服

在线客服:7*24小时在线

客服
热线

400-630-3752
7*24小时客服服务热线

关注
微信

关注官方微信
顶部