總結一下:運維工程師面試的經歷及面試相關問題(待續(xù))
2018年1月4號面試
筆者其實沒有想到去面試,只是在智聯(lián)上更新了一下簡歷,就陸陸續(xù)續(xù)接到很多獵頭的郵件和電話,實在是沒準備好要去面試,就推掉了幾家公司的面試了。正因為筆者也很久沒有面試了,筆者也想去面試學習一下,閑話少說,下面就分享給大家筆者在2018年1月4號上午10點30分的面試經歷:
首先,獵頭或者公司人資會把公司的介紹及崗位要求發(fā)到你郵箱(或者QQ、微信),下面這份是獵頭發(fā)給我的崗位說明,為了職業(yè)道德操守,公司的介紹和面試通知信息我就不貼出來了,我就把崗位要求貼出來:
職位描述:
1、 負責應用服務器的安裝、配置、優(yōu)化與維護;
2、 負責應用系統(tǒng)的日志信息備份、管理、維護與分析;
3、 負責應用系統(tǒng)的日常監(jiān)測于維護、故障處理、性能分析與優(yōu)化;
4、 負責應用部署系統(tǒng)、環(huán)境配置系統(tǒng)、監(jiān)控系統(tǒng)的開發(fā)、部署、升級與維護,建設高性能的運維平臺。
崗位要求:
1、 熟悉Linux操作系統(tǒng)的基礎知識,熟練使用Linux常用操作命令;
2、 熟練配置Nginx、HAproxy 等應用相關軟件的部署、配置與優(yōu)化維護;
3、 熟悉網絡基礎知識、熟悉TCP/IP的工作原理,會配交換機或路由器,能熟練的對網絡情況進行分析
4、 熟悉shell/perl/python中的一種或多種進行運維程序的開發(fā);
5、 熟悉Nagios,Ganglia等監(jiān)控軟件
看著上面的要求大家是不是覺得要求也不高啊,你要細看就會發(fā)現(xiàn),這家公司要求的還挺多,不僅要會網絡知識(熟悉TCP/IP好像是每家單位的都會寫這樣的要求),還要會開發(fā)技能。相信很多做運維的兄弟在網絡這一塊是個頭疼的事情,都對交換機和路由器不怎么會配置和管理。
然后,筆者詳細了解他們公司,了解崗位要求,在突擊復習一下可能會問到的知識點和技術點。到了面試的這天時間,早早的起床,把牙一定要刷干凈,特別是有口臭的兄弟,***準備點口香糖,到達面試公司前嚼塊口香糖,以免因為口氣的原因熏到面試官,讓你在面試官心里減分。早點要記得吃,如果你是下午面試的話也要吃午飯,吃早點了精氣神就有了。還要注意,帶上你的簡歷和一支筆,雖然他們那邊也會有你的簡歷,為了以防萬一還是準備好簡歷。
***,關鍵點來了,就是和面試官溝通了,有筆試的公司會讓你做些面試題,沒有筆試就直接和面試官聊了,下面是我和面試官溝通完之后記住的一些問題,分享給大家看一下,筆者一共記住了7個問題,好像還有兩個問題實在想不起來了,如果大家有更恰當?shù)幕卮鹨欢ㄒN出來一起探討和進步:
1、介紹下自己?(幾乎每家公司首先都會讓你做個自我介紹,好像是必修課一樣)
筆者回答:此處省略筆者的自我介紹,筆者建議介紹自己的時間不宜過長,3-4分鐘為宜,說多了面試官會覺得你太啰嗦了。說太少了也不行,那樣會讓人感覺你的經歷太簡單了、太空了。正常情況下,一般你在做自我介紹的同時,面試官這個時候在看你的簡歷,他需要一邊看簡歷、一邊聽你介紹自己,如果你說個幾句話就把自己介紹完了,他肯定還沒緩過神來,對你的映像會減分的。在介紹的同時思維要清晰,邏輯要清楚,***是根據(jù)你簡歷上寫的經歷來介紹,這樣可以把面試官的思路帶到你這里來,讓他思路跟著你走。不要東扯一句,西扯一句。竟量少介紹自己的性格、愛好(***能不說就不說),你可以簡單羅列干過幾家公司(最多羅列3家公司/也包含目前所在的公司,注意順序不要亂),都在那幾家公司負責什么工作,都用過什么技術,在著重介紹一下你目前所在的公司是負責哪些工作的,可以稍微詳細一點介紹,不要讓面試官聽著暈頭轉向的感覺。
2、灰度發(fā)布如何實現(xiàn)?
筆者回答:其實對這個問題筆者也答的不好,就不寫出來誤導大家了。大家有好的方法可以共享出來。不過筆事后在知呼上看到了一位網友的建議覺得不錯,大家可以參考看一下 :https://www.zhihu.com/question/20584476
3、Mongodb熟悉嗎,一般部署幾臺?
筆者回答:部署過,沒有深入研究過,一般mongodb部署主從、或者mongodb分片集群;建議3臺或5臺服務器來部署。MongoDB分片的基本思想就是將集合切分成小塊。這些塊分散到若干片里面,每個片只負責總數(shù)據(jù)的一部分。 對于客戶端來說,無需知道數(shù)據(jù)被拆分了,也無需知道服務端哪個分片對應哪些數(shù)據(jù)。數(shù)據(jù)在分片之前需要運行一個路由進程,進程名為mongos。這個路由器知道所有數(shù)據(jù)的存放位置,知道數(shù)據(jù)和片的對應關系。對客戶端來說,它僅知道連接了一個普通的mongod,在請求數(shù)據(jù)的過程中,通過路由器上的數(shù)據(jù)和片的對應關系,路由到目標數(shù)據(jù)所在的片上,如果請求有了回應,路由器將其收集起來回送給客戶端。
4、如何發(fā)布和回滾,用jenkins又是怎么實現(xiàn)?
筆者回答:發(fā)布:jenkins配置好代碼路徑(SVN或GIT),然后拉代碼,打tag。需要編譯就編譯,編譯之后推送到發(fā)布服務器(jenkins里面可以調腳本),然后從分發(fā)服務器往下分發(fā)到業(yè)務服務器上。
回滾:按照版本號到發(fā)布服務器找到對應的版本推送
5、Tomcat工作模式?
筆者回答:Tomcat是一個JSP/Servlet容器。其作為Servlet容器,有三種工作模式:獨立的Servlet容器、進程內的Servlet容器和進程外的Servlet容器。
進入Tomcat的請求可以根據(jù)Tomcat的工作模式分為如下兩類:
Tomcat作為應用程序服務器:請求來自于前端的web服務器,這可能是Apache, IIS, Nginx等;
Tomcat作為獨立服務器:請求來自于web瀏覽器;
6、監(jiān)控用什么實現(xiàn)的?
筆者回答:現(xiàn)在公司的業(yè)務都跑在阿里云上,我們***的監(jiān)控就是用阿里云監(jiān)控,阿里云監(jiān)控自帶了ECS、RDS等服務的監(jiān)控模板,可結合自定義報警規(guī)則來觸發(fā)監(jiān)控項。上家公司的業(yè)務是托管在IDC,用的是zabbix監(jiān)控方案,zabbix圖形界面豐富,也自帶很多監(jiān)控模板,特別是多個分區(qū)、多個網卡等自動發(fā)現(xiàn)并進行監(jiān)控做得非常不錯,不過需要在每臺客戶機(被監(jiān)控端)安裝zabbix agent。
7、你是怎么備份數(shù)據(jù)的,包括數(shù)據(jù)庫備份?
筆者回答:在生產環(huán)境下,不管是應用數(shù)據(jù)、還是數(shù)據(jù)庫數(shù)據(jù)首先在部署的時候就會有主從架構、或者集群,這本身就是屬于數(shù)據(jù)的熱備份;其實考慮冷備份,用專門一臺服務器做為備份服務器,比如可以用rsync+inotify配合計劃任務來實現(xiàn)數(shù)據(jù)的冷備份,如果是發(fā)版的包備份,正常情況下有臺發(fā)布服務器,每次發(fā)版都會保存好發(fā)版的包。
總結一下面試注意幾點事項,可能筆者也說得不太對,為了我們運維工作的兄弟們都能拿到高薪,大家一定要指證出來一起進步、一起探討:
***,你要對自己的簡歷很熟悉,簡歷上的寫的技能自己一定要能說出個一二,因為面試官的很多問題都會挑你簡歷上寫的問。比如你簡歷上寫了這么一條技能“熟悉mysql數(shù)據(jù)庫的部署安裝及原理”。你即然寫了這么一條技能,你在怎么不熟悉你也要了解mysql的原理,能說出個大概意思。萬一面試官問到了你寫的這一條,你都答不上來,那在他心里你又減分了,基本上這次面試希望不大。
第二,如果面試官問到你不會的問題,你就說這個不太熟悉,沒有具體研究過,千萬別不懂裝懂,還扯一堆沒用的話題來掩飾,這樣只會讓面試官反感你。
第三,準備充分,竟可能多的記住原理性的知識,一般面試問的多的就是原理。很少問具體的配置文件是怎么配置的。面試前也要了解清楚“職位描述”和“崗位要求”,雖然有時候大多數(shù)不會問到崗位要求的問題,但也要了解和熟悉。
第四,面試完后一定要總結,盡量記住面試官問的每一個問題,回去記錄下來,如果問到不會的問題,事后要立馬查百度或者找朋友搞清楚、弄明白,這樣你才能記勞,下次面試說不定又問到同樣的問題。
問完之后,面試官就跟我聊薪資待遇了,問我多少錢能達到自己的要求,我就不便透露了,可以私聊,哈哈,后續(xù)筆者會陸陸續(xù)續(xù)更新以前面試的經歷和問題,有需要的朋友可以轉載或者收藏起來一起討論。
2017年2月24號面試
基于大家熱情高昂的氣氛,筆者又花了一個下午的時間回憶并整理在2017年2月24號筆者在東三環(huán)邊上(快到東四環(huán)了,沒有地鐵過去,到了四惠還要轉公交車)的一家傳媒公司的面試經歷,還好筆者有做筆記的習慣,把之前面試的問題都記錄在案,這一次的面試筆者可是記憶猶新,因為這次這家公司都跟筆者發(fā)offer了,實在是真心不想去這家公司就找原因推掉了,大家可別學我這么不靠譜。下面是這家公司中的崗位要求說明:
崗位職責:
1、負責公司產品的版本控制、構建和發(fā)布管理;
2、負責公司統(tǒng)一配置庫管理工作,權限管理與分配準確及時,定期完成配置備份;
3、負責公司內部開發(fā)/測試服務器的運行管理工作;
4、負責Linux操作系統(tǒng)的安裝、配置、監(jiān)控和維護、問題處理、軟件升級、 數(shù)據(jù)備份、應急響應、故障排除等、保證線上環(huán)境的穩(wěn)定運行;
5、負責支撐平臺24×7穩(wěn)定運行,并進行前瞻性容量規(guī)劃;
6、負責公司機房服務器日常維護及網絡系統(tǒng)安裝、部署、維護工作。
崗位要求:
1、計算機相關專業(yè)本科及以上學歷,2年以上運維或配置管理工作經驗;
2、至少熟悉一種監(jiān)控系統(tǒng)搭建,如Nagios/Zabbix/等;
3、至少熟悉一種集群管理工具,如Ansible/SaltStack等;
4、有使用集成發(fā)布工具發(fā)布構建經驗優(yōu)先。比如:bamboo或者Jenkins;
5、熟悉Unix/Linux操作系統(tǒng),熟悉Weblogic/tomcat等中間件,能夠編寫shell腳本,熟悉軟件開發(fā)過程及過程產品,有一定的網絡基礎;
6、熟悉rsyslog, flume等日志收集和處理系統(tǒng);
7、具有強烈的安全意識及較強的溝通協(xié)調和學習能力,良好的團隊合作精神,工作積極主動。
過去之后,前臺美眉把我?guī)У剿麄児镜牡叵率遥覓咭暳艘幌轮車沫h(huán)境,貌似旁邊就是機房,因為我聽到服務器的聲音。等了幾分鐘,面試官下來了,面試官目測比較瘦,看著跟我身材差不多(應該不到120),他說他是負責運維部的,然后開始就叫我先自我介紹,都是一個套路,免不了介紹的,所以兄弟們一定要把自我介紹練好。然后開始問我問題了,跟面試官聊得還行,問我應該有不下10個以上的問題,我記住了下面有10個問題:
1、LVS負載的原理,和Nginx負載有啥區(qū)別?
筆者回答:這個問題我覺得面試官司沒問好,正常都會這么問“LVS有哪些負載均衡技術和調度算法?"。我回答就是按我說的這種問法回答的,反正他也頻繁點頭,當然,筆者回答的可能沒有下面我整理出來的那么詳細,大概意思我都說明白了。
LVS是Liunx虛擬服務器的簡稱,利用LVS提供的負載均衡技術和linux操作系統(tǒng)可實現(xiàn)高性能、高可用的服務器集群,一般LVS都是位于整個集群系統(tǒng)的最前端,由一臺或者多臺負載調度器(Director Server)組成,分發(fā)給應用服務器(Real Server)。它是工作在4層(也就是TCP/IP中的傳輸層),LVS是基于IP負載均衡技術的IPVS模塊來實現(xiàn)的,IPVS實現(xiàn)負載均衡機制有三種,分別是NAT、TUN和DR,詳述如下:
VS/NAT: 即(Virtual Server via Network Address Translation)
也就是網絡地址翻譯技術實現(xiàn)虛擬服務器,當用戶請求到達調度器時,調度器將請求報文的目標地址(即虛擬IP地址)改寫成選定的Real Server地址,同時報文的目標端口也改成選定的Real Server的相應端口,***將報文請求發(fā)送到選定的Real Server。在服務器端得到數(shù)據(jù)后,Real Server返回數(shù)據(jù)給用戶時,需要再次經過負載調度器將報文的源地址和源端口改成虛擬IP地址和相應端口,然后把數(shù)據(jù)發(fā)送給用戶,完成整個負載調度過程。
可以看出,在NAT方式下,用戶請求和響應報文都必須經過Director Server地址重寫,當用戶請求越來越多時,調度器的處理能力將稱為瓶頸。
VS/TUN :即(Virtual Server via IP Tunneling)
也就是IP隧道技術實現(xiàn)虛擬服務器。它的連接調度和管理與VS/NAT方式一樣,只是它的報文轉發(fā)方法不同,VS/TUN方式中,調度器采用IP隧道技術將用戶請求轉發(fā)到某個Real Server,而這個Real Server將直接響應用戶的請求,不再經過前端調度器,此外,對Real Server的地域位置沒有要求,可以和Director Server位于同一個網段,也可以是獨立的一個網絡。因此,在TUN方式中,調度器將只處理用戶的報文請求,集群系統(tǒng)的吞吐量大大提高。
VS/DR: 即(Virtual Server via Direct Routing)
也就是用直接路由技術實現(xiàn)虛擬服務器。它的連接調度和管理與VS/NAT和VS/TUN中的一樣,但它的報文轉發(fā)方法又有不同,VS/DR通過改寫請求報文的MAC地址,將請求發(fā)送到Real Server,而Real Server將響應直接返回給客戶,免去了VS/TUN中的IP隧道開銷。這種方式是三種負載調度機制中性能******的,但是必須要求Director Server與Real Server都有一塊網卡連在同一物理網段上。
回答負載調度算法,IPVS實現(xiàn)在八種負載調度算法,我們常用的有四種調度算法(輪叫調度、加權輪叫調度、最少鏈接調度、加權最少鏈接調度)。一般說了這四種就夠了,也不會需要你詳細解釋這四種算法的。你只要把上面3種負載均衡技術講明白面試官就對這道問題很滿意了。接下來你在簡單說下與nginx的區(qū)別:
LVS的優(yōu)點:
- 抗負載能力強、工作在第4層僅作分發(fā)之用,沒有流量的產生,這個特點也決定了它在負載均衡軟件里的性能***的;無流量,同時保證了均衡器IO的性能不會受到大流量的影響;
- 工作穩(wěn)定,自身有完整的雙機熱備方案,如LVS+Keepalived和LVS+Heartbeat;
- 應用范圍比較廣,可以對所有應用做負載均衡;
- 配置性比較低,這是一個缺點也是一個優(yōu)點,因為沒有可太多配置的東西,所以并不需要太多接觸,大大減少了人為出錯的幾率。
LVS的缺點:
- 軟件本身不支持正則處理,不能做動靜分離,這就凸顯了Nginx/HAProxy+Keepalived的優(yōu)勢。
- 如果網站應用比較龐大,LVS/DR+Keepalived就比較復雜了,特別是后面有Windows Server應用的機器,實施及配置還有維護過程就比較麻煩,相對而言,Nginx/HAProxy+Keepalived就簡單一點
Nginx的優(yōu)點:
- 工作在OSI第7層,可以針對http應用做一些分流的策略。比如針對域名、目錄結構。它的正則比HAProxy更為強大和靈活;
- Nginx對網絡的依賴非常小,理論上能ping通就就能進行負載功能,這個也是它的優(yōu)勢所在;
- Nginx安裝和配置比較簡單,測試起來比較方便;
- 可以承擔高的負載壓力且穩(wěn)定,一般能支撐超過幾萬次的并發(fā)量;
- Nginx可以通過端口檢測到服務器內部的故障,比如根據(jù)服務器處理網頁返回的狀態(tài)碼、超時等等,并且會把返回錯誤的請求重新提交到另一個節(jié)點;
- Nginx不僅僅是一款優(yōu)秀的負載均衡器/反向代理軟件,它同時也是功能強大的Web應用服務器。LNMP現(xiàn)在也是非常流行的web環(huán)境,大有和LAMP環(huán)境分庭抗禮之勢,Nginx在處理靜態(tài)頁面、特別是抗高并發(fā)方面相對apache有優(yōu)勢;
- Nginx現(xiàn)在作為Web反向加速緩存越來越成熟了,速度比傳統(tǒng)的Squid服務器更快,有需求的朋友可以考慮用其作為反向代理加速器;
Nginx的缺點:
- Nginx不支持url來檢測。
- Nginx僅能支持http和Email,這個它的弱勢。
- Nginx的Session的保持,Cookie的引導能力相對欠缺。
2、redis集群的原理,redis分片是怎么實現(xiàn)的,你們公司redis用在了哪些環(huán)境?
筆者回答:reids集群原理:
其實它的原理不是三兩句話能說明白的,redis 3.0版本之前是不支持集群的,官方推薦***的節(jié)點數(shù)量為1000,至少需要3(Master)+3(Slave)才能建立集群,是無中心的分布式存儲架構,可以在多個節(jié)點之間進行數(shù)據(jù)共享,解決了Redis高可用、可擴展等問題。集群可以將數(shù)據(jù)自動切分(split)到多個節(jié)點,當集群中的某一個節(jié)點故障時,redis還可以繼續(xù)處理客戶端的請求。
redis分片:
分片(partitioning)就是將你的數(shù)據(jù)拆分到多個 Redis 實例的過程,這樣每個實例將只包含所有鍵的子集。當數(shù)據(jù)量大的時候,把數(shù)據(jù)分散存入多個數(shù)據(jù)庫中,減少單節(jié)點的連接壓力,實現(xiàn)海量數(shù)據(jù)存儲。分片部署方式一般分為以下三種:
(1)在客戶端做分片;這種方式在客戶端確定要連接的redis實例,然后直接訪問相應的redis實例;
(2)在代理中做分片;這種方式中,客戶端并不直接訪問redis實例,它也不知道自己要訪問的具體是哪個redis實例,而是由代理轉發(fā)請求和結果;其工作過程為:客戶端先將請求發(fā)送給代理,代理通過分片算法確定要訪問的是哪個redis實例,然后將請求發(fā)送給相應的redis實例,redis實例將結果返回給代理,代理***將結果返回給客戶端。
(3)在redis服務器端做分片;這種方式被稱為“查詢路由”,在這種方式中客戶端隨機選擇一個redis實例發(fā)送請求,如果所請求的內容不再當前redis實例中它會負責將請求轉交給正確的redis實例,也有的實現(xiàn)中,redis實例不會轉發(fā)請求,而是將正確redis的信息發(fā)給客戶端,由客戶端再去向正確的redis實例發(fā)送請求。
redis用在了哪些環(huán)境:
java、php環(huán)境用到了redis,主要緩存有登錄用戶信息數(shù)據(jù)、設備詳情數(shù)據(jù)、會員簽到數(shù)據(jù)等
3、你會怎么統(tǒng)計當前訪問的IP,并排序?
筆者回答:統(tǒng)計用戶的訪問IP,用awk結合uniq、sort過濾access.log日志就能統(tǒng)計并排序好。一般這么回答就夠了,當然你還可以說出其它方式來統(tǒng)計,這都是你的加分項。
4、你會使用哪些虛擬化技術?
筆者回答:vmware vsphere及kvm,我用得比較多的是vmware vsphere虛擬化,幾本上生產環(huán)境都用的vmware vsphere,kvm我是用在測試環(huán)境中使用。vmware 是屬于原生架構虛擬化技術,也就是可直接在硬件上運行。kvm屬于寄居架構的虛擬化技術,它是依托在系統(tǒng)之上運行。vmware vcenter
管理上比較方便,圖形管理界面功能很強大,穩(wěn)定性強,一般比較適合企業(yè)使用。KVM管理界面稍差點,需要管理人員花費點時間學習它的維護管理技術。
5、假如有人反應,調取后端接口時特別慢,你會如何排查?
筆者回答:其實這種問題都沒有具體答案,只是看你回答的內容與面試官契合度有多高,能不能說到他想要的點上,主要是看你排查問題的思路。我是這么說的:問清楚反應的人哪個服務應用或者頁面調取哪個接口慢,叫他把頁面或相關的URL發(fā)給你,首先,最直觀的分析就是用瀏覽器按F12,看下是哪一塊的內容過慢(DNS解析、網絡加載、大圖片、還是某個文件內容等),如果有,就對癥下藥去解決(圖片慢就優(yōu)化圖片、網絡慢就查看內網情況等)。其次,看后端服務的日志,其實大多數(shù)的問題看相關日志是最有效分析,***用tail -f 跟蹤一下日志,當然你也要點擊測試來訪問接口日志才會打出來。***,排除sql,,找到sql去mysql執(zhí)行一下,看看時間是否很久,如果很久,就要優(yōu)化SQL問題了,expain一下SQL看看索引情況啥的,針對性優(yōu)化。數(shù)據(jù)量太大的能分表就分表,能分庫就分庫。如果SQL沒啥問題,那可能就是寫的邏輯代碼的問題了,一行行審代碼,找到耗時的地方改造,優(yōu)化邏輯。
6、mysql數(shù)據(jù)庫用的是主從讀寫分離,主庫寫,從庫讀,假如從庫無法讀取了、或者從庫讀取特別慢,你會如何解決?
筆者回答:這個問題筆者覺得回答的不太好,對mysql比較在行的朋友希望能給點建議。以解決問題為前提條件,先添加從庫數(shù)量,臨時把問題給解決,然后抓取slow log ,分析sql語句,該優(yōu)化就優(yōu)化處理。慢要不就是硬件跟不上,需要升級;要不就是軟件需要調試優(yōu)化,等問題解決在細化。
7、cpu單核和多核有啥區(qū)別?
筆者回答:很少有面試官會問這樣的問題,即然問到了,也要老實回答。還好筆者之前了解過CPU,我是這么說的:雙核CPU就是能處理多份任務,順序排成隊列來處理。單核CPU一次處理一份任務,輪流處理每個程序任務。雙核的優(yōu)勢不是頻率,而是對付同時處理多件事情。單核同時只能干一件事,比如你同時在后臺BT下載,前臺一邊看電影一邊拷貝文件一邊QQ。
8、機械磁盤和固態(tài)硬盤有啥區(qū)別?
筆者回答:我擦,啥年代了,還問磁盤的問題,這面試官有點逗啊。那也要回答啊:
HDD代表機械硬盤,SSD代表固態(tài)硬盤。首先,從性能方面來說,固態(tài)硬盤幾乎完勝機械硬盤,固態(tài)硬盤的讀寫速度肯定要快機械硬盤,因為固態(tài)硬盤和機械硬盤的構造是完全不同的(具體的構造就沒必要解釋了)。其次,固態(tài)盤幾乎沒有噪音、而機械盤噪音比較大。還有就是,以目前的市場情況來看,一般機械盤容量大,價格低;固態(tài)盤容量小,價格偏高。但是企業(yè)還是***固態(tài)盤。
9、說一下用過哪些監(jiān)控系統(tǒng)?
筆者回答:這個監(jiān)控的問題又問到了,筆者在2018年1月4號也被問到類似這樣的問題,筆者曾經用過zabbix、nagios、 cacit等。但是在這次面試中只說用過zabbix和nagios。說完了之后,面試官就讓我說一下這兩個監(jiān)控有啥區(qū)別:
從web功能及畫圖來講:
Nagios簡單直觀,報警與數(shù)據(jù)都在同一頁面, 紅色即為問題項。Nagios web端不要做任何配置。 Nagios需要額外安裝插件,且插件畫圖不夠美觀。
Zabbix監(jiān)控數(shù)據(jù)與報警是分開的,查看問題項需要看觸發(fā)器,查看數(shù)據(jù)在***數(shù)據(jù)查看。而且zabbix有很多其它配置項, zabbix攜帶畫圖功能,且能手動把多個監(jiān)控項集在一個圖中展示。
從監(jiān)控服務來講:
Nagios自帶的監(jiān)控項很少。對一些變動的如多個分區(qū)、多個網卡進行監(jiān)控時需要手動配置。
Zabbix自帶了很多監(jiān)控內容,感覺zabbix一開始就為你做了很多事,特別是對多個分區(qū)、多個網卡等自動發(fā)現(xiàn)并進行監(jiān)控時,那一瞬間很驚喜,很省心的感覺。
從批量配置和報警來講:
Nagios對于批量監(jiān)控主機,需要用腳本在server端新增host,并拷貝service文件。 Nagios用腳本來修改所有主機的services文件,加入新增服務。
Zabbix在server端配置自動注冊規(guī)則,配置好規(guī)則后,后續(xù)新增client端不需要對server端進行操作。 Zabbix只需手動在模板中新增一監(jiān)控項即可。
總體來講:
Nagios要花很多時間寫插件,Zabbix要花很多時間探索功能。
Nagios更易上手,Nagios兩天弄會,Zabbix兩周弄會。
Zabbix畫圖功能比Nagios更強大
Zabbix對于批量監(jiān)控與服務更改,操作更簡潔;Nagios如果寫好自動化腳本后,也很簡單,問題在于寫自動化腳本很費神。
10、給你一套環(huán)境,你會如何設計高可用、高并發(fā)的架構?
筆者回答:
如果這套環(huán)境是部署在云端(比如阿里云),你就不用去考慮硬件設計的問題。可直接上阿里云的SLB+ECS+RDS這套標準的高可用、高并發(fā)的架構。對外服務直接上SLB負載均衡技術,由阿里的SLB分發(fā)到后端的ECS主機;ECS主機部署多臺,應用拆分在不同的ECS主機上,盡量細分服務。數(shù)據(jù)庫用RDS高可用版本(一主一備的經典高可用架構)、或者用RDS金融版(一主兩備的三節(jié)點架構)。在結合阿里其它的服務就完全OK,業(yè)務量上來了,主機不夠用了,直橫向擴容ECS主機搞定。
如果這套環(huán)境托管在IDC,那么你就要從硬件、軟件(應用服務)雙面去考慮了。硬件要達到高可用、高并發(fā)公司必須買多套網絡硬件設備(比如負載設備F5、防火墻、核心層交換、接入層交換)都必須要冗余,由其是在網絡設計上,設備之間都必須有雙線連接。設備如果都是跑的單機,其中一個設備掛了,你整個網絡都癱瘓了,就談不上高可用、高并發(fā)了。其次在是考慮應用服務了,對外服務我會采用成熟的開源方案LVS+Keepalived或者Nginx+Keepalived,緩存層可以考慮redis集群及Mongodb集群,中間件等其它服務可以用kafka、zookeeper,圖片存儲可以用fastDFS或MFS,如果數(shù)據(jù)量大、又非常多,那么可采用hadoop這一套方案。后端數(shù)據(jù)庫可采用 “主從+MHA”。這樣一套環(huán)境下來是絕對滿足高可用、高并發(fā)的架構。
持續(xù)更新中......
這篇文章實在是有點長,擠不下了,大家看后期更新的內容可以跳轉到 總結:運維工程師面試的經歷及面試相關問題(2)