7月13日晚间,中国著名的二次元聚集地B站(Bilibili,哔哩哔哩)突然宕机,主站、App 以及小程序都无法使用,主站 404,其他站 502。
在“B站崩了”之后,大量二次元涌入另一二次元据点A站(AcFan),结果导致A站崩溃。同时崩溃的还有豆瓣以及晋江,消息迅速刷屏,并接连冲上热搜。有网友调侃道:谁也别想好。
叔了解,B站此次宕机持续到深夜2点20分才恢复正常,并且在微博上发布了公告。
其实,配置再好的服务器也难免在使用过程中出现一些故障,造成宕机。
服务器一旦出现故障,影响到用户实时访问网站,造成用户流失,如果在企业的销售高峰期,则将直接影响到商业利润,而且不仅影响外部也影响内部,简言之,直接影响到员工的生产率,企业后续还需要承担恢复、修理和补偿等成本。因此,鸟叔帮大家总结一些有关服务器故障的原因以及解决的方案,以便进行排查和预防。
透过服务器的故障现象,解密背后的原因
01 服务器满负荷运载
当成千上万个用户请求突然涌入时,服务器承载有限,就会丢弃部分请求,如果继续增加请求,服务器就会满负荷运转,就会出现大面积无法访问的现象。
02 服务器运行环境
内部环境包括操作系统,数据库,应用程序,应用程序bug,网络数据等,外部像机房断电导致的服务器断电(欠压,过载,波动)、机房温度过高,散热不良、资源冲突等也会造成服务器故障。
03 服务器性能问题
服务器性能的好坏也是宕机的一个因素,比如服务器主板、CPU、内存、磁盘等也会导致宕机故障,在配置服务器时,尽量租用或选购稳定性好的服务器。
04 服务器遭受恶意攻击
在网站的程序安全系数不够高或者密码被泄露时,服务器容易遭到黑客的攻击,像挂黑链、病毒等。
此外,像人为错删除数据,磁盘坏道导致数据丢失,磁盘写满等原因也会导致服务器系统崩溃宕机。
防御盾助您及时、快速、精准应对
如今的互联网时代,服务器数据存储和传输显得越来越重要,而作为互联网基础设施的服务器,其安全性和稳定性不言而喻,从理论上看,没有绝对的安全、绝对可用的资源、绝对不出问题的服务器和应用程序,一旦服务器出现故障,就需要第一时间找出问题的原因及解决方案,减少故障的发生。
01 升级服务器
如果网站出现崩溃、无法访问,很大几率是因为服务器配置跟不上暴增的访问流量,此时,需要对服务器进行升级并提高服务器的安全防御系数。防御盾服务器搭载高速Sas3 SSD固态硬盘,裸金属服务器提供高性能安全隔离物理集群服务,用于规模化的高计算性能,高达99.999%的数据持久性,快速应对高要求场景,轻松支撑业务负载。
02 配备负载均衡
面对大规模数据流量的涌入,需要在现有网络的基础上对流量进行分发,配备防御盾负载均衡将多个请求及时分摊到不同的服务器,通过消除单点故障提升应用系统的可用性,实现更高水平的应用程序容错能力。同时,拓展设备和服务器的带宽,增加网站的吞吐量。
03 使用大带宽
在配置或升级服务器时,可以选用更大的带宽,使服务器遭遇网络使用高峰或攻击时依旧可以保持网站架构的整体稳定,让访问更流畅。
04 做好监控备份
计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,备份和监控就是服务器数据安全的防线,防御盾数据库和防御盾监控,帮助用户做好数据备份,监控整个云安全环节的资源情况,及时告警,降低故障处理时间。
虽然B站在较短时间内解决了故障,恢复了网站的正常访问,然而此次事故还是对B站造成了影响,不但影响了用户正常访问,还导致B站股价短线走低。因此,做好服务器宕机防范预案,对于用户维护网络安全,保障业务持续性、可访问性至关重要。
防御盾的云服务器、负载均衡、云数据库等,帮助用户构建稳定的网络环境,给予更优质的体验。当网站运营到一定阶段,鸟叔建议您对服务器的配置进行升级,让网站运作起来更顺畅,也便于展现产品和服务。