網易視頻云邱似峰:視頻直播架構的演進之路
12月2日-3日,ArchSummit全球架構師峰會在北京召開,來自國內外的近百位技術專家共聚一堂,為現場數千名與會者分享了各自領域的成就和經驗。網易視頻云CTO邱似峰受邀出席,并在活動現場分享了網易視頻云的直播架構演進之路。
直播無疑是2016年最受關注的領域,但如何搭建一個穩定高效的直播系統卻并非一日之功。邱似峰從數據采集、音視頻預處理、音視頻編碼、流媒體傳輸、音視頻解碼、畫面顯示等視頻直播的一整套技術進行了詳細的講述。而網易視頻云又是如何完成直播架構從0到1再到100演進的呢?
為了幫助聽眾更好的理解直播架構,邱似峰將直播過程分為六個部分,即采集、預處理、編碼、傳輸、解碼和服務端錄制。而這些模塊又是如何影響直播的清晰度、流暢度、延時和首屏時間的,邱似峰進行了一一講述。
邱似峰介紹說,傳統的直播解決方案具有2-6秒的延時,比如編碼和預處理、隊列發送、網絡接收隊列、接流節點等都是造成時延的原因,但1-4秒的首屏緩沖確實時延的罪魁禍首。除此之外,國內電信聯通南北分離的網絡環境、高峰時期的延時波動等也是導致直播體驗差的元兇之一。為了解決時延問題,網易視頻云自主研發了“首屏秒開”功能,并在擁塞恢復、追趕延時、QOS策略等直播卡頓問題進行了一系列優化。
互聯網進入直播時代,除了滿足用戶獵奇、窺視、社交等各種心理需求,移動化也讓網絡直播更加多維。教育、娛樂、新聞、電商等不同領域所面向的直播人群不同,平均觀看人數不同,對直播功能之外的個性化服務也有所不同,如何解決這種差異化的需求,已然成為視頻直播架構設計的一部分。
邱似峰介紹說,為了解決視頻傳輸過程中的丟包、帶寬利用率低等問題,網易視頻云在架構上采用了新的視頻傳輸協議和新的帶寬估算算法,而音視頻分離技術則是解決這些問題的又一舉措。音頻數據和視頻數據分別發送,在網絡擁塞的情況下可以優先發送音頻數據,視頻數據根據網絡情況進行重傳,***將音視頻數據再次混合,并融合了融合了視頻畫面增強、音頻回聲消除、自動增益、智能降噪等技術。
據了解,網易視頻云是國內首家推出多路互動直播的視頻云平臺,互動直播業已成為視頻直播架構的重要組成部分。相比于當下流行的單一直播模式,互動直播打破了主播和觀眾之間的互動門檻,比如多位主播和觀眾的面對面互動,對直播在電商、教育、金融、泛娛樂等領域的應用有進一步的促進作用。同時,邱似峰分享了這樣一組數據,網易視頻云的互動直播實現了低于500ms的延時,且1000萬人以上并發觀看。
截止到目前,網易視頻云已經服務了包括網易新聞、網易云音樂、BoBo美女主播、網易云課堂、寶寶樹等知名互聯網產品,并針對泛娛樂、在線教育、視頻電商、在線金融等場景提供了一體化的直播、點播和互動直播服務。