成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

了解Instagram背后的技術

開源
剛被Facebook以10億美金收購的著名手機照片分享應用Instagram最近吸引了無數人的眼球,Android版本登陸Google Play不到一個月下載量就突破1000萬,總用戶數即將超過5000萬。Instagram聯合創始人Mike Krieger說他們用了8周時間打造了最初的Instagram,但現在的系統肯定已經今非昔比。Instagram技術團隊曾發表過一篇文章,介紹了Instagram背后的技術,日前Mike Krieger在名為Scaling Instagram的演講里,又介紹了更多細節,讓人們能了解到5名技術人員是如何支撐起整個系統的。

[丁雪豐 是InfoQ中文站編輯,滿江紅翻譯組核心成員,出版過《Spring攻略》、《JRuby實戰》等多部譯著。主要關注領域:企業級應用、海量數據計算、動態語言應用等。]

剛被Facebook以10億美金收購的著名手機照片分享應用Instagram最近吸引了無數人的眼球,Android版本登陸Google Play不到一個月下載量就突破1000萬,總用戶數即將超過5000萬。Instagram聯合創始人Mike Krieger說他們用了8周時間打造了最初的Instagram,但現在的系統肯定已經今非昔比。Instagram技術團隊曾發表過一篇文章,介紹了Instagram背后的技術,日前Mike Krieger在名為Scaling Instagram的演講里,又介紹了更多細節,讓人們能了解到5名技術人員是如何支撐起整個系統的。

一張照片上傳的過程是這樣的:

采用同步的方式寫入媒體數據庫

如果照片上有地理位置標簽,則以異步的方式將照片提交給Solr進行索引

將照片的ID加入每個關注者的列表里,該列表保存在Redis之中

在顯示Feed時,選取一小部分照片ID,在Memcached里進行查詢

在設計系統時,Instagram的設計哲學是簡單、為最小化運維負擔進行優化并監控一切內容;其核心原則是保持簡單,不要重復發明輪子,盡可能使用經過驗證、穩定可靠的技術。

由于只有5名技術人員(其中僅2.5名后端工程師),精力有限,選擇Amazon的云服務是個不錯的選擇。目前他們使用了超過100個EC2實例用于提供各種服務,運行的操作系統是Ubuntu 11.04,之前的一些版本在高流量時表現不夠穩定。在負載均衡方面,他們使用Amazon的Elastic Load Balancer實現負載均衡,后端運行了3個Nginx實例,SSL只到ELB上為止,降低了Nginx上的CPU負載。DNS和CDN分別由Amazon的Route 53和CloudFront提供,所有的照片都存放在S3上,目前已經有幾TB的規模了。

用于處理請求的應用服務器運行于Amazon High-CPU Extra-Large Instance之上,由于他們的請求更多是CPU密集型的,因此這能更好地平衡CPU與內存。采用的開發框架是Django,WSGI服務器是Gunicorn,通過Fabric在所有機器上進行并行部署,一次部署僅需幾秒鐘。

大多數數據都存放在PostgreSQL里,主分片集群運行于12個High-Memory Quadruple Extra-Large Instance(68.4GB內存)上,另有12個位于不同可用區里的副本,通過repmgr以Streaming Replication的方式進行同步。由于Elastic Block Store的磁盤IOPS不高,因此需要將正在使用的數據都加載到內存里,vmtouch能幫助管理內存中的數據。他們在EBS上使用mdadm實現了軟件Raid,以此提升寫吞吐量;數據庫的文件系統用的是XFS,在從庫獲取快照時,會先凍結RAID陣列,保證快照的一致性。

應用程序在連接數據庫時,由Pgbouncer建立連接池。目前,Instagram的數據按照用戶ID進行分片,某些分片可能會超出物理節點的容量上限,為此他們將數據分成了很多個邏輯分片,映射到少數幾個物理節點之上;當一個節點被填滿之后,可以將某些邏輯分片移到別的節點上,以緩解該節點的壓力。隨著數據量的增長,以后他們也會進行垂直分區,Django DB Router能讓一切輕松不少。

Instagram也大量使用Redis來存放復雜的對象(對象的大小做了一定的限制),用于主Feed、活動Feed、會話系統及其他相關系統。因為要將Redis的所有數據都放在內存里,此處同樣也用了High-Memory Quadruple Extra-Large Instance,并對數據做了分片。當Redis實例的請求達到4萬/秒后,它漸漸成為了瓶頸,于是Redis也做了主從復制,副本的數據會經常導出到磁盤上,通過EBS快照進行備份。

除了Redis,他們還使用Memcached來做緩存,目前運行了6個實例,應用服務器通過pylibmc和libmemcached進行連接。雖然Amazon提供了Elastic Cache服務,但該服務的價格并不便宜,相比之下,還是運行自己的Memcached實例比較劃算。異步任務隊列使用的是Gearman,目前有大約200個工作進程來處理各種任務,比如把照片分享到Twitter和Facebook,通知用戶有新照片等等。Pyapns已經處理了十億的推送通知,非常穩定,他們還自己開發了基于Node.js的node2dm,用于向Android設備發送推送通知。

監控方面,Instagram使用Munin以圖形化的方式呈現整個系統的運行狀況,還通過Python-Munin定制了一些插件,用來顯示業務數據;網絡守護進程Stated可以實時收集數據并做匯總;Dogslow會監控進程,一旦發現運行時間過長的進程,便會保存該進程的快照,以便后續分析,比如響應時間超過1.5秒的請求,通常都是卡在Memcached的set()和get_many()方法上。對于Python的錯誤,只要登上Sentry就能實時獲取錯誤信息。

HighScalability上還根據整理Mike Krieger的演講整理了一些值得借鑒的經驗,比如:

找那些你熟悉的技術和工具,在簡單的使用場景里先做一些嘗試

不要使用兩個工具來處理同樣的任務

事先準備降級方案,以便在需要時降低負載

不要過度優化,或者希望能事先知道站點要擴展,對于一個初創的社交站點而言,沒什么擴展性問題是解決不了的

如果一個辦法不行,趕快換下一個

如果您想進一步了解Instagram背后的技術細節,可以訪問其技術團隊的博客。

【編輯推薦】

  1. 背后支持著Instagram的開源技術
  2. 不懂技術的人不要對懂技術的人說這很容易實現
  3. 傲游瀏覽器新版本發布 視頻解碼技術的盛宴
責任編輯:Yeva 來源: 新浪微博
相關推薦

2012-04-18 11:07:44

FacebookInstagram開源

2012-07-12 09:37:23

Instagram工程技術

2023-11-06 17:37:17

技術架構任務隊列

2017-03-13 17:25:00

移動支付技術支撐易寶

2018-07-17 09:34:15

Service Mes技術Kubernetes

2020-04-27 11:00:27

直播互聯網架構

2011-04-06 11:21:25

PHPPython

2019-10-29 16:08:41

物聯網RFID技術

2012-11-13 10:27:49

雙十一技術討論

2012-08-20 09:41:05

開源技術推特

2023-09-28 21:46:10

2010-11-12 09:04:03

TwitterAPI

2022-09-29 10:25:01

數字孿生物聯網

2022-02-18 08:54:21

docker操作系統Linux

2011-12-12 09:40:49

技術人變化云計算

2020-05-28 08:40:10

人工智能

2020-09-29 11:01:08

漏洞

2020-06-03 09:10:10

5G技術網絡

2011-12-18 18:19:32

iPhone

2012-06-14 09:38:00

存儲虛擬化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美a在线看 | 在线91 | 午夜欧美一区二区三区在线播放 | 免费观看的av | 亚洲精品一区二区三区蜜桃久 | 欧美精品福利 | 日韩色在线 | 国产www在线 | 91美女在线 | 91亚洲一区 | 日韩中文字幕一区二区 | 欧美日韩不卡在线 | 国产一区二区三区久久久久久久久 | 青青草社区 | 日本三级网站在线 | 日韩三区| 理论片87福利理论电影 | 欧美不卡 | 欧美jizzhd精品欧美巨大免费 | 亚洲精品视频在线看 | 成人深夜福利网站 | 在线视频中文字幕 | 亚洲一区 中文字幕 | 国产精品中文在线 | 91精品国产91久久久 | 久久综合入口 | 4h影视| 蜜桃特黄a∨片免费观看 | 五月综合久久 | 欧美精品久久 | 精品国产乱码久久久久久图片 | 91日日 | 精品成人av| 国产精品v | 一区中文字幕 | 91精品欧美久久久久久久 | 色婷婷综合久久久中字幕精品久久 | 婷婷久久综合 | 国产精品7777777| 亚洲精品久久久久中文字幕二区 | 亚洲一区视频在线 |