阿提哈德航空公司:利用數據科學優化航空公司運營
過去幾年,全球航空業發生大規模動蕩,包括疫情給航空業帶來的災難性影響,已經讓不少航空公司陷入困境,這在業內已經不是什么秘密了。盡管世界范圍內一片混亂,但阿聯酋國家航空公司——阿提哈德航空(Etihad)仍設法通過使用數據科學生成的洞察力,來提高生產力并節省成本。
阿提哈德航空公司總部位于阿布扎比,從2003年開始運營,近年來,阿提哈德航空使用數據湖和一套統一的、人工智能驅動的分析工具來優化人員配備、乘客處理和客戶查詢響應。
阿提哈德航空公司戰略、管理和投資組合總監Reem Alaya Lebhar博士表示:“數字化轉型讓我們變得更精簡、更敏捷、更高效。當我們審視自己作為一家中型航空公司的定位時,我們就決定了治理和思維方式必須發生改變。”
Reem Alaya Lebhar
阿提哈德航空從使用Cloudera Data Platform開始了自己的數據科學之旅,之后將數據遷移到云端,建立了數據湖。但是因為他們采用了多家廠商的技術來支持數據湖,所以導致分析數據的方式效率低下,他們需要改變這一點。
阿提哈德航空公司企業數據管理負責人Martin Hammer說:“阿提哈德航空正在進行數字化轉型之旅,我們的數據戰略支持我們利用整個組織中所有可用數據、打破孤島、增強每個業務流程的愿景。”
在數據科學平臺上實現統一分析
阿提哈德航空公司決定統一他們的數據建模和數據分析,選擇Dataiku端到端的機器學習平臺來實現這一點。
Dataiku公司中東和土耳其區域副總裁Siddhartha Bhatia表示:“阿提哈德航空過去一直在收集數據,但是他們需要的是從這些數據中獲得洞察。他們想要對一切實施標準化,打破這些孤島,變成高度的標準化。”
作為一家全球航空公司,阿提哈德航空的數據運營覆蓋了很多不同國家。作為一款基于服務器和瀏覽器的應用,Dataiku允許遠程和分布式團隊可以橫跨不同時區和部門展開協作。
Dataiku中嵌入的低代碼可視化工具,讓業務負責人能夠與數據科學家進行密切合作。阿提哈德航空公司數據科學經理Talal Mufti指出,這讓公司有機會提升分析師的技能。
Talal Mufti
阿提哈德航空希望能夠對他們的數據模型進行快速部署、調度和自動化,此外還希望在成本方面有所降低。
阿提哈德航空確定了很多短期的使用實例,并對這些實例進行進一步評估,看哪些實例可以帶來利益最大化的影響。
阿提哈德航空首先根據利益最大化對這些使用實例進行優先級排序,這一步可以在部署Dataiku平臺的早期階段完成。
財務收益和成本節約成為了阿提哈德航空選定使用實例的主要因素,雖然他們是在疫情爆發之前就采用和部署了這款分析平臺,但是在后續階段的確產生了一些影響。
預測旅客到達
阿提哈德航空選擇的其中一個用例是預測旅客到達情況,幫助他們更有效地在機場部署地勤人員來調度航班。
飛行移動操作是需要大量支持人員的,其中一些是固定員工和現場員工,還有一些是合同員工,總體上看包括了值機人員和行李搬運工,之所以采用這種模式,是因為航空公司并不總是很清楚什么時候需要操作人員和支持人員。預測窗口期是14天,連續間隔30分鐘,直到每次飛行前的4個小時。
Martin Hammer
阿提哈德航空公司使用Dataiku平臺構建了一個預測系統,來模擬和預測乘客到達情況。這么做的好處是,機場管理人員能夠就地勤人員、需要什么人員、何時需要等問題做出更好的決策。這樣在對接外部供應商的時候,就可以更好地進行合同談判。
Dataiku團隊承擔的另一個使用場景,是管理和響應接收到的查詢電子郵件。阿提哈德航空公司的CRM系統持續不斷地接收和記錄收到的電子郵件查詢,而挑戰在于,如何在盡可能短的時間內對這些電子郵件進行分類、轉發和回復。他們需要對這些電子郵件進行自動分類以保證最終正確送達。
Bhatia說:“問題是,你如何有效地發送這些電子郵件,確保郵件被正確的人處理,并盡快回復那些提問的人呢。”
使用NLP優化客戶響應時間
Dataiku構建了一個電子郵件分類系統,可以查看被詢問的內容,并使用NLP(自然語言處理)對電子郵件進行分類,這樣CRM系統就可以確保將這些電子郵件發送到正確的人那里進行處理。
自然語言處理讓計算機系統能夠理解口語或者文本并做出決策,在這個過程中,自然語言算法是提供文檔或電子郵件自動要點摘要的一個基礎,這些算法還可以根據類別對文本進行分類,組織信息并完成電子郵件轉發和垃圾郵件過濾。
在Dataiku內部,自然語言處理模型會提取電子郵件,對其進行智能分析,然后根據特定問題對其進行分類,并在CRM系統中創建自動案例。
API可觸發對電子郵件的處理。API與自然語言處理模型連接,對電子郵件進行處理,在CRM系統中進行分類,然后調用操作。
Mufti表示:“Dataiku幫助我們開發了整個組織的使用實例,這些實例有望在未來5年內顯著節省成本。”
解決數據建模的難題
數據科學在后期遇到了一個挑戰:數據漂移。這是指,在一段時間內傳入的數據開始發生與用于構建模型的原始數據的偏離,這帶來的影響就是,之前對原始數據所做的訓練將不再奏效。
Sid Bhatia
Bhatia表示:“這樣你的預測能力和模型的預測能力就不再像應有的那樣有效。”Dataiku可以對模型進行重新開發、重建和重新訓練,然后再推出。
Dataiku平臺最初的使用實例幫助阿提哈德航空公司節省了大量成本,而且在經歷了具有挑戰性的、后疫情時代的復蘇之后,阿提哈德航空建立了對持續使用數據科學的信心。
Hammer表示:“Dataiku是我們企業數據平臺的關鍵組成部分之一,為我們的數據科學社區提供了所需的所有工具,并促進了不同利益相關者群體之間的協作。”
展望未來,阿提哈德航空公司計劃繼續使用這個數據建模平臺來解決運營瓶頸,并在各種用例中提高流程的效率。