中國聯通王志軍:Hadoop在通信行業的應用
原創【51CTO獨家報道】2013年11月22、23日,CHINA HADOOP SUMMIT技術峰會在北京福朋喜來登大酒店盛大開幕。近千位大數據方面技術精英,一起暢享Bigdata的發展與未來。51CTO為您帶來大會相關報道。
聯通研究院移動互聯網產品事業部主任王志軍先生,首先分享了中國聯通在流量計費方面的應用。移動通訊從語音的時代跨越到數據的時代,這個時代中運營商有很大的機會,同時運營商遇到了很多流量消費爭議的問題,目前流量消費爭議已經躍升成為用戶通訊服務投訴的首位。首先的問題是數據流量消費遠不如語音消費清晰透明,這個很簡單,語音消費的時候撥打一個電話,對方是誰打了多長時間,這個時間是可以感知到的。運營商也可以語音通話的詳單,如果是發短信,發了多少條短信大體是心中有數的。
聯通研究院移動互聯網產品事業部主任王志軍
現在3G客戶數據流量爭議占3G業務投訴是10%,現在整個比例是在逐漸的上升。個別的省份已經達到了20%的比例。目前中國聯通每月打到10010客服流量上的投訴是近萬起。同時很多用戶也基于運營商無法提供上網記錄的詳單,提出了法律的訴訟。例如某iPhone合約計劃的用戶,他是晚上凌晨到四點睡覺期間發生了巨額的流量,智能手機可能語音的應用、有很多自動更新的應用,這些應用并不是使用了才產生流量,這種情況下用戶難以理解。運營商的計量設備無法提供了詳單就提出了訴訟。
此前有個客服部門的統計數據,每萬元應收收入中因無法提供上網記錄詳單的數據,造成的投訴和退費賠付是60塊錢。GGSN不光是中國聯通在用,來自愛立信、華為、中興、諾基亞都在使用,這種成熟的設備,出現偏差的概率是很小了,絕大部分的賠付是運營商說不清楚,用戶有投訴,為了避免爭議擴大化,運營商是采用了賠付與和解的方式來處理。
好在我們有了Hadoop,Hadoop相當于可以幫助我們解決這些問題,它采用開源的方式,構架了普通的PC服務器之上,拋棄了高端的存儲,也可以保證高可靠性,適合數據快速的寫入,以及有快速檢索的方式,這樣相當于有十億的業務需求解決不了問題,Hadoop幫我們解決了,這是我們跟Hadoop脫離了實驗室的概念,是真正的商用系統上第一次親密接觸。
最后說一下采用Hadoop的體會,第一不要低估數據量增長。第二做持續不斷的優化,構建專職的團隊,要進行系統優化,淘寶優化的方式可能跟聯通優化的方式是不同的,因為各有各的業務的特征。再有重視Hadoop集群內部網絡的互聯,整個網絡Hadoop集群運行的穩定和高效的數據挖掘是很重要的。之前網絡方面出了一些問題,就導致了整個集群在一段時間運行越來越慢,直到整個集群崩潰掉,需要進行重新啟動,有這么一個周期性的過程,很多的問題是網絡引發的。統計分析的查詢做適當分離,我們的系統去提供數據的實時入庫和查詢,當做大量統計分析的時候對入庫會產生影響,可能是入庫的擠壓,對查詢的影響不大,我們只在上面跑一些定期的任務,這些定期任務的結果會構建在另外的集群上,數據庫的結構設計要做好充分的準備工作。