網飛公司工程師的云性能哲學
Coburn Watson并不害怕優化全球***的亞馬遜Web服務部署之一所帶來的挑戰,相反他樂在其中。
云性能工程師來到電影租賃巨人網飛(Netflix)公司不到一年,因為他熱衷于解決問題。兒時起,他就已經在這樣做了,那時候高科技意味著在他的TI-99/4A計算機上用Logo編程語言構建應用。工程師技能世代相傳。Watson的父親早在二十世紀70年代就痛大型計算機系統工作,主要關注性能問題。
Watson進入網飛公司的路可謂“曲線救國”。他還是學生時離開德克薩斯州前往加利福尼亞,進入加州大學圣塔芭芭拉分校(UC-Santa Barbara)學習水生生物學,而不是計算機科學或者工程學。Watson熱愛海洋和生物學分析。畢業后,他開始在生物工程上開展工作,同時,計算機開始在分析數據中扮演更加重要的角色。
由于他的技術背景,他開始在實驗室成為系統管理員。這也導致了他多變的IT職業生涯,他曾經是甲骨文數據庫管理員、Java開發者、解決方案架構師和性能經理。
當能夠同世界上***的云系統之一的機會來臨時,Watson發現這個機遇太好而不能錯過。自從他作為云性能工程經理開始,他的團隊找到了網飛公司面臨的一個重要問題,確保在相同的訂閱率上不能讓費用增長。他同工程師和性能團隊合作創建了一個環境,其中云基礎架構的成本不會放慢業務。
“我們不一定嘗試削減成本,”Watson說道,他將網飛描述成為一個成長的初期階段,盡管該公司已經有260萬在線訂閱者。“我們的目標真的不是隨著訂閱者的線性數量增加而增加我們的AWS成本。我們做的是優化資源。”
在去年十一月拉斯維維加斯舉行的AWS的re:Invent會議上,與會者主要關注的是花費在亞馬遜實例上的錢如何控制,這是一次全球合作伙伴和客戶會議。有很多個分論壇和演講,Watson就是演講者之一,提出了在硬性限制和規則上如何通過優化管理實例的指南。
“我們從愿景上接近AWS用例,我們有大量很優秀的工程師團隊,每個人都想做出正確的決定,”他說,“我們沒有圍繞AWS用例執行強制策略。我們也沒有告訴團隊你只可以使用100個用例,你下周一前不能再部署了。”
不適用獨裁的方法,Watson采取一種更加整體的觀點。關鍵的哲學在于網飛通過內部監控工具在其用例上收集的數據的龐大數量且用分析生成報告。
“我們有很多東西運行在那,我覺得能夠有一種很好的聚合的觀點的能力是我們所需要的,”Watson說。網飛每天有成千上萬的實例在運行,使用自動化監控和報告工具將所有的實例轉化成可控的數據。“到我們這種規模,你真的需要這些工具。”
網飛的工具對于工程師軟對很關鍵,一些對于AWS用戶是免費可用的,包括開源云管理和部署工具Asgard。
用技術解決業務問題
Watson表示這些工具的要點在于持續的為公司里面需要用這些數據做決定的人交付數據。定期他會領導一群經理討論他們從報告中學到了什么。他覺得這種會議協助企業解決了業務問題。這個會議非常有效率,因為他們通過電話會議實現。
“我們在開會并討論用例時,我可以通過賬戶、地區、分區、實例類型向下鉆取。我可以通過團隊將其打破,”他說,“我和我那些優秀的同事致力于非常復雜的問題。我們擁有難以置信的效率,因為我們在一個地方工作。”
通過交流,密切監測運營,持續開發***實踐,Watson已經協助創建了一個環境,保持成本在一條線上,且不會阻礙創新或者限制了工程師。
“我們有一個原則,我們真的不想妨礙工程師的容量計劃,”他說。
這個原則也是Watson面向云計算的哲學之一,他的任務核心就是控制成本,不管訂閱者是不是增多。迄今為止都是成功的。Watson仍舊著迷于容量管理問題,而不是在會議上獲得注意力。他希望更多的公司能夠從他的團隊開發的***實踐和開源技術上獲利。