更智能化的CDN技術,CDN邁向3.0時代
我們的生活無時不刻不依賴著網絡,伴隨著終日對網速慢的抱怨和詛咒,同時也享受著網絡技術發展帶來的紅利。懷著對技術細節刨根問底的執著,我們會發現原來身邊還存在著像CDN這樣生活在舞臺背后的內容分發技術。然而當我們剛想了解他的時候,似乎他的步伐又邁得那么矯健,正在完成CDN 2.0到3.0的跨越,貌似還是一場智能化的跨越。
1.0到2.0,20年技術演進
CDN(Content Delivery Network),即內容分發網絡。其目的是通過在現有的Internet中增加一層新的網絡架構,將網站的內容發布到最接近用戶的網絡“邊緣”,使用戶可以就近取得所需的內容,提高用戶訪問網站的響應速度。CDN PoP(Point of Presence)架構是為內容傳送服務提供支持的軟件堆棧,到現在經歷了1.0到2.0的發展,直到智能化的3.0出現。下面我們將用少量的篇幅對這段歷史進行一下梳理。
CDN PoP 1.0的架構誕生于20年前,這對于當時的網站非常適合,一些小容量的信息可以通過緩慢的互聯網連接實現傳遞。這時CDN的主要挑戰是從部署在互聯網服務提供商(ISP)的邊緣節點 (POPs)傳輸網頁內容。每一個接入POP的終端用戶都會快速獲得響應內容,而不是首先通過網絡(當時依然很慢)來訪問源服務器。通過這種方式,CDN可以很容易把受歡迎的內容發送給大量的互聯網用戶。
CDN PoP 2.0的架構離我們的生活更近了一些,也是我們目前使用最廣泛的CDN技術。由于2.0架構有基本的軟件堆棧組成,但不具備數據和信息的深入分析,更不用談及少得可憐的智能化功能,這也就決定了其架構是被動的、響應式的、無狀態的。2.0架構的目標是緩存邊緣內容,并在邊緣進行一些簡單的處理,從就近原則中爭取TCP傳輸性能上的提升。2.0架構以緩存軟件為核心,同時配套負載均衡、日志分析、DNS等服務。
CDN 3.0,向智能化不斷邁進
隨著網絡服務的創新與移動終端的智能化,與此相適應的CDN也在不斷進化。似乎講到了這里我們該請出今天的主角了——CDN 3.0,下面我們將從幾個方面的對比去闡述3.0究竟有哪些優勢。
關于CDN 3.0的研究其實經歷了大量的理論研究和論證,包括流處理器,批處理,消息代理, Hadoop,NoSQL,機器學習,Cassandra,Spark,深層神經網絡,循環神經網絡,卷積神經網絡以及大量的不同類型的算法等數百個概念。下面我們將從中抽取一些典型的研究內容來論證CDN 3.0的優勢:
- 規則引擎:許多CDN都具有自動規則引擎,客戶端可以為其內容設置緩存規則。機器學習模型中使用分類器可以使***進的規則引擎難度回歸到史前科技水平。
- WAF+DDoS+Bot緩解:這些用于應對威脅的分布式系統將會被監督式和非監督式機器學習模型取代,包括深層神經網絡、重復神經網絡等。
- 深度學習:我們不再需要手動進行緩存軟件棧、路由、存儲等繁瑣的配置,這些工作將會被學習模式所接管。
關于CDN 2.0和CDN 3.0的對比一言不和就上圖:
但3.0架構卻截然不同,與生俱來的大數據和機器學習加持彰顯了其智能化的屬性。他將比2.0架構應對更龐大的邊緣傳輸,每個PoP節點都將成為Hadoop生態中的一環,包括HDFS、Apache Spark、Apache Flink、Kafka、Redis以及許多由Facebook、Google、LinkedIn、Spotify這類公司創建的開源插件等等。
在CDN 3.0架構世界里,緩存工程師,網絡工程師等將與數學家和數據科學家一起工作。整個功能集將迎來無窮的變化,具體反映到所使用的算法類型以及算法數目。本來需要人工介入的任務,如集群性能調優,網絡調優等,將采用機器學習(ML)等手段來解決。
機器學習將調優工作從手動調優改為自調優,即始終處于學習過程中。新的個性化功能特性將利用ML算法,先捕獲訪問者訪問站點的行為,然后將該行為用作分類器的輸入,***基于培訓數據構建模式。此后,每次訪問者訪問該網站時,ML算法都會對哪些頁面產生最多銷售量進行預測并個性化交付內容。
銷售機構他們將不得不接受全新的技術語言的再培訓,其中包括AI,機器學習,大數據,DevOps,數據科學,統計學和應用數學等。今天,機器學習這個詞或許只是營銷部門使用的一個流行語。在適當的時候,CDN行業和機器學習的結合將會進一步深化,因為越來越多的人在微小的細節上受到教育啟發,例如什么算法做什么,每類算法的目的,各種神經網絡之間的差異等等。
我們也可以從了另一個維度去觀察這種變化
圖2 CDN 2.0和CDN 3.0 Feature Set對比
面對網絡和軟件堆棧的大范圍更改,我們所做的或許不再是一味地增加代碼、通過API擴展功能或者是優化BGP路由,可能只需要簡單地做下減法去換成更好用的3.0架構。CDN3.0的重要標志是其能很好地支持目前互聯網的主流應用,同時有更好的性價比,服務質量更有保障,也更安全。事實上,CDN 3.0已經應用在Facebook、LinkedIn和Twitter的場景中。下面我們用一張表格來做一些對CDN2.0和3.0做一些分析。
人工智能,噱頭還是革命
上圖是一個科研機構從2000年開始對技術創新程度按照時間推移的曲線變化,一段時期新技術出現的數量越多,創新等級越高,并稱之為技術分裂曲線。可以看出2015年前,創新技術的萌生和進步是一個線性增長態勢,隨著大數據和機器學習技術的誕生,創新性的增長展現出了瘋狂的態勢。圍繞著這兩項技術的新技術萌生也逐漸推動者科技的發展。按照這個曲線的走勢,在未來的12個月內,機器學習和大數據技術將對整個科技界產生顛覆。
今天,機器學習這個詞或許只是營銷部門炒作的詞匯,但在未來的某一天,它必將改變CDN產業。
參考鏈接:
1、https://www.bizety.com/2017/02/20/cdn-edge-pop-architecture-2-0-end-life-hello-3-0-architecture/
2、https://www.bizety.com/2017/03/07/cdn-pop-architecture-3-0-end-cdn-commoditization-part-1/
3、https://www.bizety.com/2017/03/08/cdn-pop-architecture-3-0-end-cdn-commoditization-part-2/