成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

陌陌技術保障部總監張明強:故障與高可用

原創
移動開發 移動應用 開發工具
在WOT2016移動互聯網技術峰會上,陌陌技術保障部總監張明強老師表示“業務體系越龐大,高可用保障越困難”。會上,張明強老師以整體視角,來完整的歸納一下之前在高可用保障工作上的方方面面,以及每一方面易踩的坑。

【51CTO.com原創稿件】在WOT2016移動互聯網技術峰會上,陌陌技術保障部總監張明強老師表示“業務體系越龐大,高可用保障越困難”。會上,張明強老師以整體視角,來完整的歸納一下之前在高可用保障工作上的方方面面,以及每一方面易踩的坑。

[[174139]]

 

張明強,2013年加入陌陌,經歷了流量爆發式增長給技術架構、團隊管理帶來的各種問題及其解決過程。現任技術保障部總監,主要負責基礎架構、運維、安全、信息化等工作,致力于提升服務穩定性與團隊開發效率。

歸類

最常見的故障誘因就是掛,掛的出現形式一般分為三種:徹底消失、假死和閃斷。而針對這些故障形式,也有相應的解決方法。在一個復雜的業務架構中,監控是最為核心的一部分,如果沒有監控,這個體系無論技術再強大,絕對不會是高可用。在做好監控之后還要準備“后備軍”,掛了之后切到另外一個去就行,用多實例來解決掛的問題,多實例可以解決所有管的問題,只要設計得當。拆分是整個架構設計中非常重要的一個思路,當體系復雜的時候掛就像生病一樣是無法避免的,這時運用拆分的理念不要讓病原體再擴散,這個思路幾乎可以解決所有的問題。

因為硬件的完善,掛所引起的故障不算太多。但是代碼邏輯寫的不好,設計稍有不慎,或者數據庫太大,就會引起各種各樣慢的問題,慢也有三種表現形式:自身慢、下游慢和上游慢。對于自身慢只要改善自身的問題,完善代碼或者結構就可以有所改善。下游慢是日常運維過程中比較容易出現的一種,多見于數據庫慢導致依賴的某個服務慢了,這時候就要分析問題是出自自身數據庫,還是第三方的問題,分析日志和監控數據變成了很重要的事。上游慢不是很常見,但也不能忽略,其實99%的故障都是非常簡單的,只要能在設計階段能設想到的就能解決掉,主要問題在設計階段能不能想全。解決思路非常簡單,***多實例,第二是緩存,第三是拆分。

還有一種故障誘因是出錯,這是能導致問題最多的一種,也是在設計中最容易忽略的一種,這種設計依賴于下游的模塊,出錯也有兩種表現形式:錯和空。純粹的故障性錯誤是完全可以避免的,但技術卻不是***的,技術解決不了的問題就需要通過管理或其他方式來解決,技術和管理這兩條線都不能放松。其中流程規范是解決錯誤的***解決辦法,團隊中的每個人都有可能犯錯,但是流程規范了這類問題就可以盡量避免。多做實例也是一個非常好的辦法,當一個實例錯了起碼還可以從別的地方恢復過來,多做類似的措施以防止整條線全塌。

張明強總結了五種針對這些故障的具體解決辦法。

分析

***就是監控,監控是基礎,是整個高可用體系的根本。針對監控有三種形式:一個是業務監控,平臺/框架監控,還有硬件監控,業務都會采用很多不同的框架,這三者結合起來才能打造一個完整的監控體系。在監控上容易踩的坑有四點:一,監控=數據+報警,所有數據都必須有報警才能稱之為監控,否則只能說是統計。二,報警是要看的,要保證報警是有效的。三,靠監控自動處理的設計,小心誤報,要依賴多因素驗證。四,監控拖垮服務。

第二是多實例,多實例的核心是有備無患,有三種表現形式:冷備、熱備和多活。冷備的核心是當服務發生故障之后,備份實例沒有辦法立即啟用,需要人工接入,人工接入是冷備的一個核心特點。熱備很簡單,比如通常用的LVS、Keepalived,很多內部設計都是熱備,熱備是出問題之后工程師不用親自管理,程序能自動切。第三部分是多活,多活是多實例里一個***目標,所有實例都在同時跑業務。在多實例上容易踩的坑有三點:一,首先要時刻記得多實例是用來解決什么級別的問題,把握住自己的需求,針對錯誤去解決。二、客戶端會不會切換失敗?要從整體出發,不是只有Server做了就行,客戶端的請求必須能切走。三,要明確知道備機容量夠不夠,這是多實例中最容易出現的問題。

第三個方法是拆分,當所有方法都無計可施了,拆分都可以起作用,把錯誤的、有問題的拆出來單獨部署,這是一個最保底的方案。拆分有兩個表現形式:一個形式是拆入口,通過一定的路由規則把請求路由到不同的服務器上,防止一掛全掛;另一部分是拆階段,把一個同步的請求拆成好多部分,比如常說的異步之類這些詞。

第四種方法是緩存,緩存天生就是用來解決性能問題的,將CPU不停加到L1/L3緩存,來提高速度這是***種辦法;第二種辦法是將單通道改成多核,把一個實例改成多個實例做設計,緩存形式只有一個就是對數據做緩存。緩存容易踩的坑有四點:一,無***率監控,極低而不自知。二,臟數據。三,系統對穿透率支持的太低。四,緩存太散,導致IO次數太多,耗時太長。對于監控來說緩存一定要有***率。緩存還要關心Hits、Miss、性能和容量。

***的方法是流程規范,就像前面講到的,技術并不是***的,所以要將技術和管理二者結合起來。流程規范有兩種形式:一個是強制規范,一個是倡導類的。流程規范容易踩的坑有三點:一,一大堆規范。二,太復雜,難以執行。三,無人遵守,管理上不跟進。對于流程規范來說,上線規范是最重要的,上線規范又是灰度發布最重要的一個環節,這兩個是整個高可用體系***的一道屏障,如果能隨意突破,前面做再多的工作也白搭。

 

【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】

責任編輯:陳琳 來源: 51CTO.com
相關推薦

2015-03-31 18:26:43

陌陌社交

2012-08-31 14:36:19

陌陌林志霖社交應用

2012-08-27 09:39:23

陌陌社交APP

2014-07-25 15:41:12

陌陌WOT2014GoRedis

2015-07-08 15:56:47

限挑戰表

2021-12-06 16:35:33

QQ微博社交軟件

2014-08-15 17:51:39

聽云

2015-05-12 14:34:09

陌陌

2016-08-04 09:21:39

2015-05-27 11:05:46

阿里云陌陌CDN

2012-08-21 15:52:48

2015-07-24 16:49:40

陌陌禮物

2012-08-23 16:41:10

陌陌投資

2012-11-14 09:45:57

陌陌

2015-07-23 11:53:39

我是歌手

2014-05-13 14:11:36

GoRedis

2015-10-21 16:39:43

陌陌魅藍

2017-01-09 13:34:36

互聯網

2015-06-09 12:05:23

華爾街分析師

2015-11-11 15:17:16

雙十一單身陌陌
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人99久久亚洲综合精品 | 欧美在线一区二区三区 | 亚洲 日本 欧美 中文幕 | 免费a级毛片在线播放 | 中文字幕精品一区二区三区精品 | 中文字幕在线观看一区 | 91麻豆产精品久久久久久 | 福利视频亚洲 | 91精品国产乱码久久久久久久久 | 视频在线一区二区 | 成人福利在线 | 精区3d动漫一品二品精区 | 国产一区二区中文字幕 | 97免费在线观看视频 | www.狠狠干 | 日本在线免费观看 | 九九久久精品视频 | 国产精品久久久久久久久久尿 | 欧美在线观看一区 | 天天搞天天操 | 久草福利 | 精品国产视频 | 久久亚洲精品国产精品紫薇 | 日本 欧美 三级 高清 视频 | jav成人av免费播放 | 久久久久久久久久久高潮一区二区 | 国产精品久久久久久久久久免费看 | 红色av社区 | 久色网| 亚洲国产精品99久久久久久久久 | 久久国产精品99久久久久久丝袜 | 欧美中文字幕一区二区三区亚洲 | 一区二区三区免费 | 国产羞羞视频在线观看 | 成人黄色在线 | 亚洲精品中文字幕av | 特级毛片www | 国产精品久久久久久久久久99 | 超碰人人爱 | 久久小视频 | www国产亚洲精品 |