5G新通話概念和關鍵技術
Labs 導讀
通信技術一直以來的追求就是突破空間的限制,不斷拉近人與人之間的距離。如今5G時代已經到來了,5G的爆款業務還在醞釀中,作為通信基礎能力的通話業務下一步將會如何發展?本文將和大家分析討論運營商提出的5G新通話相關的概念和關鍵技術。
1、通話業務發展簡述
從有線電話的發明到現在快150年了,在最初發明時,通話距離短、效率低。隨著通信技術和交換技術的不斷進步和改良,通話的距離不斷的突破。在有線電話時代,通過專有的線路實現基本的語音通話,初步實現了遠隔千里的人們聽到了彼此的聲音。
在1G、2G時代,通過無線電技術,把通話從導線的連接解放出來,解除了空間上的限制,可以通過手機隨時隨地發起通話。通信業務主要面向基礎話音市場和短信市場,網絡技術主要重點是保障語音/短信及時可達,語音清晰,網絡廣覆蓋等。
在3G、4G時代,借助網絡技術速率帶寬的大幅提高,實時通話業務仍以語音市場為主,音質實現了高清HD音質的傳輸,并且支持電話會議。在音頻通話基礎上,在開始拓展視頻市場,支持視頻通話。怎么把帶寬更高效的利用成為業務發掘的重點,各種增值業務的不斷的出現。大家都關注到通話接通前的等待時間的需求,音頻、視頻彩鈴,以及通話后的通話助手開始出現,未接聽電話的短信提示等等,業務和體驗一直在不斷升級。
從實時通信業務的歷程看,網絡的演進和技術的迭代促成一批又一批業務從構想走向最終商用。在這個過程中,運營商的通話一直都是高品質和可靠的代言。
當下,5G及未來數字化生活時代給新實時通信業務提供更多想象空間。
2、什么是5G新通話
5G新通話就是運營商的一種新通話概念的嘗試,雖然名稱是通話,但實際上不僅僅局限于通話,更是實時沉浸式互動。中國移動研究院發布的《5G VoNR+白皮書》給出了對應的概念。
VoNR+(5G新通話) 是指在5G VoNR多媒體實時通信的基礎上搭載新的數據傳輸通道,為用戶提供除高清音視頻之外的更豐富的實時交互服務,并建立以多媒體實時通信能力平臺為中心,統一開放的網絡架構,在兼容現有業務的基礎上實現創新業務的敏捷開發和快速部署[3]。是基于5G VoNR 超高清多媒體通信能力的全媒體增值服務,其將進一步提升 4G VoLTE 業務體驗,豐富業務內涵。
簡言之,是基于VoNR(5GNR)基礎上的實時通信網絡架構,可以快速集成新的業務形態,以滿足人們多元化的通信需求。承載實時交互信息的交互的信道更寬,交互的內容類型更多,交互形式更豐富。
而且,5G新通話業務能力將進一步對人與人之間的通信進行感官延伸,使能并開啟人與人、人與物、物與物之間全新的多媒體實時通信時代。
3、相關標準進展
3.1 3GPP 通話相關進展
賦予實時通話更多的業務可能性。
在R16完成 5G 網絡 IMS Data Channel 實時交互通道相關技術標準,于 2020 年 3 月寫入并發布了 TS26.114 V16.5.0 版本,實現了5G VoNR業務能力的增強。在CT1 R17 FS_eIMS5G2,研究IMS如何更好的使用5GC的能力,特別是利用5GC的MEC能力實現信令媒體面的優化。
SA1 R18 FS_MMTELin5G,可視菜單,屏幕共享,AR通信,第三方ID接入場景和需求討論中。有待在R18重啟IMS切片、服務化等研究內容,將納入SA1新通話需求。
3.2 3GPP XR通信相關
使能實時通話和XR等新技術相結合。
XR場景的應用在R16也有對應的標準定義,發布了3GPP TR 26.928,將eXtended Reality(XR)引入到3GPP服務和網絡。包括XR類型服務和應用程序的基線技術、媒體流的體系結構模型、QoE/QoS問題等。使能5G新通話除了傳統的服務類別外,引入新的交互類別,提供了3D、XR視覺和音頻等,豐富了通話的交互形式。
3GPP當前在R17也有多個相關領域的內容,如媒體架構相關的SA4 R17 FS_5GSTAR,研究交互式AR通信媒體架構,網絡輔助實現媒體渲染。
目前,3GPP正在研究基于IMS數據通道的交互式通話,其基于VoLTE/VoNR高清語音和高清視頻通話,與WebRTC技術相結合,通過擴展提供數據通道,讓語音和視頻通話與擴展的數據通道同步,從而能在高清視頻通話中實現屏幕共享,疊加AR,甚至是聽覺、視覺、觸覺、動覺等同步的全沉浸式體驗。
3.3 GSMA
豐富了通話的業務場景。
在2019年提出了“RCS Live”《Enriched Calling Technical Specification》(富媒體呼叫技術規范)。從業務場景上通話前、通話中、通話后對富媒體通話業務的以時間軸按階段做了詮釋。
2021年1月NG 5GJA啟動virtual work task,制定Data Channel白皮書,納入Data Channel典型應用場景、構建產業和生態。
2021年2月IP COMMS啟動Future of Voice Calling討論,探討話音業務的未來發展方向。
2021年3月IP COMMS啟動Business Voice Calling討論,探討面向2B的話音發展方向。
3.4 CCSA最新進展
國內對通話發展的獨立思考和創新。
TC3 WG1,2020年11月啟動下一代實時通信網絡技術研究,從傳統業務的演進和體驗增強,新型業務的構想和需求識別等方面,基于現有IMS系統研究構建下一代通信網絡架構。
TC3 WG4,2020年11月啟動,5G增強實時通信業務,面向通信網絡和媒體技術的持續演進及人們多元化的通信需求等提出潛在的、高價值的增強實時通信業務場景,包括傳統業務、企業通信、新型業務、特殊群體和安全通信等,探討對網絡架構和安全隱私等關鍵訴求,支撐下一代通信網絡技術研究。最近TC3第35次全會也有相關議題的討論。
4、關鍵技術
4.1 VoNR技術
5G新通話,又名為5G VoNR+,由此可見VoNR是基礎,那什么是VoNR?
語音業務作為基本業務是5G不可或缺的一部分,為此,標準組織3GPP確定了5G沿用4G的語音架構仍基于IMS來提供語音業務,在5G SA組網下主要有EPS Fallback和VoNR兩種方案。
EPS Fallback,指5G NR不支持語音業務,當UE在5G NR中發起或接收語音呼叫時,通過重定向或切換的方式回落到4G網絡,由VoLTE來提供語音業務,當語音通話結束后,UE再返回到5G網絡。
VoNR,指直接由5G網絡端到端承載語音業務。在這種方式下,為了保證語音通話的連續性,支持VoNR與VoLTE之間切換,系統會根據UE上報的測量報告決定語音是否需要切換到4G或者5G。
由于NR指的是5GS的無線接入網部分,而上述的VoNR指的是語音承載于包含無線gNB和5GC的5GS,因此,有些廠商也將之稱為Voice over 5GS,或者Vo5G。
打通VoNR有什么意義?
首先,EPS Fallback只是5G語音的過渡方案,VoNR才是最終目標。VoNR在語音和數據業務體驗上優于EPS Fallback,且利于加速淘汰老舊落后的CS語音技術,重耕2/3G優質頻段。
如上圖,在5G部署早期,5G NR網絡還未形成連續覆蓋,為了避免5G與4G之間頻繁進行語音切換而導致用戶體驗差,一般采用EPS Fallback方案。但在該方案下,由于在NR上建立語音通話時發起切換回落到4G網絡,會增加語音呼叫建立時長,通話時數據業務也回落到4G網絡,會大幅降低數據速率,從而會影響用戶體驗。
隨著5G網絡大規模部署,5G NR形成連續覆蓋,5G語音就采用VoNR方案了。由于VoNR直接由5GS端到端承載IMS語音業務,語音呼叫建立時長更短,語音質量更好,且用戶在語音通話的同時能享受到暢快的5G網速,用戶體驗大幅提升。此外,隨著VoNR規模部署,更多的語音業務向4G/5G網絡遷移,這利于加速淘汰老舊的2/3G CS語音,重耕2/3G優質頻段。
其次,也是最大的意義所在,既然 VoNR是5G SA架構下最終的語音解決方案,打通VoNR當然就意味著行業向5G的終極建網目標——5G SA邁出了關鍵的一步。
眾所周知,5G SA網絡的精髓在于引入了5G核心網,其基于云原生設計,控制面采用了基于服務的架構(Service Based Architecture, SBA),SBA=網絡功能(NF)服務+SBI(基于服務的接口),網絡功能(NF)通過SBI由模塊化的NF服務(即微服務)組成,且是無狀態的,可靈活擴展、重用,從而可彈性高效、靈活敏捷的通過網絡切片等技術使能千行百業的多樣化應用,完整支持eMBB、uRLLC和mMTC三大場景,賦能各行各業數字化轉型。也正因如此,打通VoNR的關鍵在于5G核心網能力,也考驗5G核心網與IMS的融合能力。
5G核心網是打通VoNR的關鍵。讓我們再來詳細看VoNR的架構和流程。
在VoNR方案下,UE先連接5GS,通過5GS注冊IMS,這要求5GC與IMS之間需實現互聯互通;同時,為了支持VoNR與VoLTE之間平滑切換,5GC還需支持N26和S5接口,以實現與EPC之間緊密交互。
那5GC如何與IMS互聯互通呢?主要有兩種方案:一是通過Diameter信令將IMS網絡直接連接到5GC,二是升級IMS以支持5G核心網的SBA架構。
第一種方案定義于R15版本,其無需對現有的IMS進行更改或升級,可快速開通VoNR,但會導致互聯互通更復雜,以及無法充分發揮5G核心網功能。5G新通話的兩個備選方案Composer、MSRP都是基于這個方案,因此業務拓展性都相對較弱。
第二種方案定義于R16版本,是面向未來最理想的實現方式。該方案將IMS升級為基于云原生設計,采用SBA,這意味著IMS也與5GC一樣靈活彈性,且具備參與網絡切片的能力,從而可將網絡切片擴展到語音領域,可支持更多的5G用例,比如VR協作、AR輔助、實時游戲、遠程醫療、遠程控制等應用都需要IMS切片來保障語音體驗。DC(Data Channel)方案就是就基于這個方案。
4.2 系統總體架構
5G新通話系統架構如下圖所示,以音視頻實時通信基礎層作為基礎進行搭建,通過實時通信能力層進行原子能力擴展和提煉,并最終經過實時通信使能層對接運營商自有創新業務、第三方應用、Web 應用及 2B 行業應用等。實時通信能力層作為實時通信“能力智庫”的核心,負責提供豐富的、可共享的業務原子服務能力,并通過 API 向使能層提供;實時通信使能層以動態編排的能力框架對外支撐千行百業的多樣化訴求,支撐行業更高效的進行業務探索和創新,構建企業的核心差異化競爭力。
4.3 實時通信基礎層
5G VoNR+ 實時通信基礎層可以基于基礎音視頻能力網元構建,可提供傳統音視頻呼叫路由、呼叫控制、媒體控制及協議適配等能力。實時通信基礎層通過 Restful 接口向能力層提供原子 API,簡化網絡拓撲,提升網絡靈活度。
4.4 實時通信能力層
5G VoNR+ 實時通信能力層作為實時通信的業務中臺,在基礎音視頻之外,通過 IMS 數據通道提供實時交互、實時共享及遠程控制能力。拓展實時通信到實時交互,用戶感官體驗從“聽 / 看”延伸到“觸摸”及對遠端的操作;對實時通信通話前、通話中信息內容,可操作性進行全方位升級。實時通信能力層作為 5G 話音的新生態引擎,通過對基礎音視頻和實時交互能力進行提煉抽象,北向通過Restful API 接口開放給使能層。
4.5 實時通信使能層
5G VoNR+ 實時通信使能層通過開放業務能力,實現運營商網絡價值最大化,需要引入更多行業伙伴,具備更靈活的應用使能。提供可編程的管理平臺,通過編排引擎、場景化引擎、資源管理等能力實現即插即用,動態加載能力,快速構建生態,支持更多垂直行業可使用運營商音視頻能力使能人與物。同時,作為業務應用的統一管理門戶,向上支撐多用應用形態,如,運營商創新應用、多種第三方應用及行業應用,并支持應用的接入、管理、維護及應用安全。
4.6 統一媒體管理
5G 時代,AR/VR 通信等新媒體業務帶來了更高的帶寬、更靈活的媒體編解碼處理能力、更短的媒體連接路徑訴求。業界近年來流行的 RTC 架構也都提供了編解碼算法、就近接入、路由選擇等媒體面的優化處理。面向 5G,需要優化現有媒體面技術,提供統一媒體管理能力。除支持傳統音視頻、放音、會議等媒體能力之外,還支持基于 IMS 數據通道來傳遞業務邏輯數據、操作指令、肢體數據等 ( 如 XR 通信 ),并具備對多種媒體進行合成、渲染能力。統一媒體面應支持可編排的媒體處理能力,動態加載新增的媒體能力庫和媒體資源庫,以動態拔插的方式支持新業務快速上線。
4.7 交互式數據通道
為了實現上述業務場景,需引入新型交互式數據通道。實時交互式通話應用對網絡帶寬、時延、可靠性及服務質量等要求很高,需要確定性保障承載的支持。3GPP、GSMA標準組織已對交互式數據通道技術展開研究。
GSMA 在 RCS 中提出了 Enriched Calling,在通話中引入增強能力。Enriched Calling 技術可應用于 VoLTE/VoNR通話中,滿足數據實時交互的一些應用場景 , 如通話前文本、圖片、位置等信息的傳輸,通話中文件共享和共享屏幕標記等。
3GPP 也制定了 IMS 數據通道標準,其基于 VoLTE/VoNR高清音視頻通話,與 WebRTC 技術結合,通過擴展提供數據通道 IMS Data Channel,讓語音和視頻通話與擴展的數據通道同步,從而能在高清視頻通話中實現屏幕共享,疊加 AR,甚至是聽覺、視覺、觸覺、動覺等同步的全沉浸式體驗。IMS Data Channel 基于 UDP 提供高實時性的單流或多流數據交互通道,可以在通話過程中同時進行桌面共享、白板共享及發送文件等操作。IMS Data Channel可靈活支持可靠傳輸模式、部分可靠傳輸模式及不可靠傳輸模式等多種數據通道,兼顧各種應用對底層通道的多樣化訴求。IMS Data Channel 不關注所傳遞通道中內容及其格式,僅需要通信雙方對于通信格式達成一致,可采用 Webpage+JavaScript 腳本通用方式通過 IMS Data Channel 傳遞多樣化應用內容,支撐新業務快速創新、快速部署、快速上線。基于擴展的數據通道,可以一邊與家人朋友視頻聊天,一邊共同玩同一款游戲、觀看一樣的視頻或分享一段美妙的音樂,也可以疊加 AR 應用于行業遠程維修場景,還可以同步聲音、視頻、觸覺和動覺來實現如遠程醫療等實時交互式應用。
落地該能力需要端側改造支持IMS Data Channel。終端需升級音視頻通信協議棧來支持 IMS Data Channel通道的建立和協商,通過內置原生系統服務實現疊加于音視頻之上的數據通道的連接和管理。基于 Web 技術及 JavaScript 腳本可以實現應用及網絡自定義的靈活界面顯示,減少對端側繁瑣的定制訴求;同時,終端應支持將IMS Data Channel 向應用層開放調用接口,使能 IMS Data Channel 作為新的行業應用入口,壯大基于運營商音視頻的行業應用生態。5G VoNR+ 終端功能如下圖。
要求包括:
- 終端應支持 3GPP TS26.114 DCMTSI 客戶端能力,通過SDP協商機制建立數據通道。
- 終端應支持 Web 引擎實時處理數據通道的業務數據并實時在用戶UI呈現。
- 終端應支持根據交互式業務的可靠性要求,協商業務帶寬、時延及丟包率等 QoS 指標。
4.8 實時音頻編碼演進
從2G、3G、4G到現在的5G時代,為了增強實時語音通信的清晰度,語音編碼技術從AMR(Adaptive Multi-Rate)、AMR-WB(Adaptive Multi-Rate - Wideband)演進到EVS(Enhanced Voice Service)。
EVS增強語音語服務是繼AMR-WB高清語音編碼技術后對通話編碼技術又一次改進,提高了編碼的靈活性和效率,專為LTE開發和優化的,主要應用于VoLTE高清語音。EVS頻率范圍已經擴展到14~17KHz,逼近人耳可感知的20KHz極限,聲音越來越接近自然的聲音。5G還能做哪些提升呢?當前聲音清晰度雖然接近自然聲,但是沉浸性極低,因為語音通話仍然采用一個聲道的方式,導致聲音空間方向維度數據丟失,無法實現沉浸式體驗。為此3GPP正在制定IVAS新的語音標準,旨在實現沉浸式語音的傳輸。
沉浸式語音及音頻服務(IVAS)編碼,使能沉浸式通話。
在2017年9月的TSG SA會議上,3GPP啟動了一個新的工作項IVAS_Codec,研究對EVS編碼的擴展,用于沉浸式語音及音頻服務(IVAS,Immersive Voice and Audio Service)。總體目標是開發用于身臨其境的4G和5G服務和應用的單一通用音頻編解碼器IVAS。IVAS目前已經在R16版本標準化。
IVAS是下一代3GPP 編解碼器,建立在EVS編解碼器的基礎上,具有更好的用戶體驗和更好的抗丟包能力。IVAS_Codec工作項本后的想法是涵蓋實時語音會話、電話會議、VR會話和用戶生成實時和非實時多媒體內容用例。除了滿足日益增長的對豐富多媒體業務的需求外,沉浸式的電話會議應用將受益于這個下一代編解碼器。
4.9 5G支持XR能力
5G網絡具備大帶寬和低延時特性,將極大的促進XR(eXtended Reality)業務的發展。XR是不同類型現實的總稱,代表所有現實和虛擬構成的環境及計算機技術產生的人機交互。XR包括AR(Augmented Reality,增強現實)、VR(Virtual reality,虛擬現實)和MR(Mixed reality,混合現實),應用涵蓋了健康、教育、娛樂、工業等領域。XR交互是5G新通話的發展方向。
該標準發布了XR業務的QoE、分發、渲染、編解碼、媒體格式等內容,還詳細描述了23種XR用例,例如3D圖像消息、AR分享、沉浸式6DoF媒體流、實時3D通信、6DoF VR會議、在線VR游戲等。XR將是5G上極其重要的一種業務。XR和5G結合后會對通話業務帶來什么樣的創新還有待想象和發掘。
以上是5G新通話的概念和關鍵技術的相關內容,在下一期還會就應用、產業和展望進一步分析。
參考文獻
[1] 重新定義MBB語音體驗(IVAS技術),3GPP標準專家,MWCS-2021論壇.
[2] 《5G時期語音業務關鍵技術及演進方案研究》中國移動.
[3] 《5G VoNR+白皮書》 (2020)中移研究院 & 華為.
[4] 3GPP TR 26.928. “Extended Reality (XR) in 5G”, 2020.
[5] 3GPP TS 26.114. “IP Multimedia Subsystem (IMS); Multimedia Telephony; Media handling and interaction”, 2020.
[6] 《統一IMS(第二階段)的業務技術要求---5G增強實時通信業務》CCSA TC3 35次全會討論稿.
[7] 《下一代實時通信網絡技術研究》CCSA TC3 35次全會討論稿.
[8] 《5G新通信 | 新業務、新體驗,邁向通信新時代》網優雇傭軍.