音頻分析:自動駕駛汽車的重要技術
隨著供應鏈管理、制造運營、移動服務、圖像和視頻分析、音頻分析的進步,下一代自動駕駛汽車有望改變汽車消費者的認知。隨著這些技術的不斷發展,到2030年,自動駕駛汽車行業的全球市場規模有望達到近600億美元。
無人駕駛汽車機器學習下的音頻分析包括音頻分類、NLP、語音/語音和聲音識別。特別是語音識別已成為自動駕駛汽車技術的一個組成部分,為駕駛員提供增強的控制。到目前為止,在傳統的汽車模型中,由于缺乏高效的算法、可靠的連接性和邊緣處理能力,語音識別仍然是一個挑戰。此外,車內噪音會降低音頻分析的性能,從而導致錯誤識別。
機器中的音頻分析一直是一個不斷研究的主題。隨著技術的進步,亞馬遜的Alexa和蘋果的Siri等新產品正在上線。這些系統正在通過云計算技術快速發展,這是其他識別系統以前缺乏的策略。
最近,各種機器學習算法,如kNN(最近相鄰距)、SVM(支持向量機)、EBT(集成袋裝樹)、深度神經網絡(DNN)和自然語言處理(NLP)使音頻分析更有效、更好定位于為自動駕駛汽車增加價值。
在音頻分析中,對數據進行預處理以去除噪聲,然后從音頻數據中提取音頻特征。這里使用了音頻特征,如MFCC(梅爾頻率倒譜系數)和統計特征,如峰度和方差。MFCC的頻段在梅爾尺度上等距分布,非常接近人類聽覺系統的反應。最后,將訓練好的模型用于推理,從安裝在汽車中的多個麥克風中獲取實時音頻流,然后對其進行預處理,然后提取特征。提取的特征將傳遞給經過訓練的模型以正確識別音頻,這將有助于在自動駕駛汽車中做出正確的決策。
數據處理和機器學習模型訓練
對于新技術,最終用戶的信任是關鍵,而 NLP 是在自動駕駛汽車中建立這種信任的游戲規則改變者。NLP允許乘客使用語音命令控制汽車,例如要求在餐廳停車、更改路線、在最近的商場停車、開/關燈、打開和關閉車門等等。這使得乘客體驗豐富和互動。
讓我們來看看音頻分析為自動駕駛汽車帶來好處的一些應用。
緊急警報器檢測
可以使用各種深度學習模型和機器學習模型(如SVM(支持向量機))檢測任何緊急車輛(如救護車、消防車或警車)的警報聲。監督學習模型——SVM用于分類和回歸分析。SVM分類模型使用緊急警報聲和非緊急聲音的大量數據進行訓練。有了這個模型,系統就被開發出來,識別警報聲,為自動駕駛汽車做出適當的決定,以避免任何危險情況。有了這個檢測系統,一輛自動駕駛汽車可以決定靠邊停車,讓緊急車輛通過。
發動機聲音異常檢測
自動及早檢測可能的發動機故障可能是自動駕駛汽車的基本功能。汽車發動機在正常情況下工作時會發出一定的聲音,而在出現問題時會發出不同的聲音。K-means聚類中可用的許多機器學習算法可用于檢測發動機聲音中的異常。在k-means聚類中,聲音的每個數據點都被分配到 k 組聚類中。數據點的分配基于該集群質心附近的平均值。在異常引擎聲音中,數據點將落在正常集群之外,成為異常集群的一部分。使用此模型,可以持續監控發動機的健康狀況。如果有異常聲音事件,然后自動駕駛汽車可以警告用戶并幫助做出正確的決定以避免危險情況。這可以避免發動機完全故障。
按喇叭換車道
為了讓自動駕駛汽車完全像人類駕駛的汽車一樣工作,它必須在后面的車輛需要緊急超車時必須改變車道的情況下有效地工作,并以鳴喇叭表示。隨機森林是一種機器學習算法,將最適合此類分類問題。它是一種監督分類算法。顧名思義,它將創建決策樹的森林,最終合并所有決策樹以進行準確分類。可以使用該模型開發一個系統,識別特定的喇叭模式并做出相應的決定。
NLP(自然語言處理)處理人類語言以提取含義,這有助于做出決策。乘員實際上可以與自動駕駛汽車交談,而不僅僅是發出命令。假設你為你的自動駕駛汽車指定了一個像Adriana這樣的名字,那么你可以對你的汽車說:“Adriana,帶我去我最喜歡的咖啡店。” 這仍然是一個簡單的句子來理解,但我們也可以讓自動駕駛汽車理解更復雜的句子,例如“帶我去我最喜歡的咖啡店,在到達那里之前,在吉姆家停下來接他。” 重要的是要注意,自動駕駛車輛不應盲目服從車主的指示,以避免任何危險情況,例如危險的、危及生命的情況。在危險情況下做出有效決策,
因此,由于安全性和可靠性的增強,基于機器學習的音頻分析歸功于自動駕駛汽車的日益普及。隨著機器學習的不斷發展,越來越多的基于服務的產品變得可用,提供音頻分析、NLP、語音識別等服務,增強乘客體驗、道路安全和及時維護汽車發動機。