成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據分析與機器學習如何為業務安全賦能?

安全 應用安全 數據分析
本文給出了幾個通過數據分析和機器學習的方法檢測業務系統中異常的案例。可以看出由于業務系統的功能不同,其數據源和分析方法有較大的差別。

目前傳統的安全檢測、防護類設備針對業務應用安全基本上沒有防護效果。數據分析與機器學習為業務安全問題提供了一個有效的解決方案。基于業務的歷史數據,通過統計分析與機器學習的方法學習出業務的歷史特征,結合專家知識形成業務特征的基線。根據基線來檢測業務行為是否存在異常。本文給出了幾個通過數據分析和機器學習的方法檢測業務系統中異常的具體案例:web業務安全、物聯網卡業務安全、變電站業務安全。

隨著高級持續性威脅(APT)攻擊的泛濫以及內部人員威脅的增加,針對企業業務系統的安全威脅日益增多。當前,一般企業的安全檢測類產品有操作系統(OS)漏掃、Web漏掃、數據庫(DB)漏掃等,但這些設備都不能發現客戶自開發應用的安全問題、業務邏輯方面的安全問題。同時,目前部署的入侵檢測系統(IDS)等檢測類設備由于是基于特征庫或者啟發式規則進行檢測,對于針對業務邏輯類攻擊、APT類的攻擊往往毫無感知。傳統的防火墻(Firewall)往往針對五元組進行檢測,對上層應用的防護效果不大。Web應用防火墻(WAF)主要針對Web攻擊進行防護,而對業務邏輯、業務數據偽造等攻擊無能為力。同時,沙盒類APT攻擊檢測措施的重點是檢測威脅OS或某些應用的惡意代碼,對針對客戶應用數據的檢測更是無能為力。

業務系統的異常有很多類型,最常見的有以下幾種:

  • 業務邏輯異常。例如用戶通過運營商的網站辦理繳費業務,通過某種方式繞過了支付的步驟,導致在用戶未支付的情況下成功辦理了收費業務。
  • 業務濫用異常。例如對網站進行薅羊毛,雖然業務的操作邏輯完全正常,但是薅羊毛屬于對業務的濫用,也是業務異常。
  • 業務數據異常。例如業務的參數異常,業務的統計數據異常等。

綜上所述,目前傳統的安全檢測、防護類設備針對業務應用安全基本上沒有防護效果。與網絡層面的安全不同,業務應用安全的特點是用戶的行為符合訪問控制規則,并且對業務的每一步操作都不帶有明顯的攻擊特征,例如沒有SQL注入,沒有跨站腳本攻擊(XSS)等攻擊特征。但是用戶對業務的整體操作流程存在著異常,例如驗證碼猜測,密碼暴力破解,關鍵業務操作步驟缺失等。因此,需要一種全新的方案來檢測業務系統的安全。

數據分析與機器學習為業務安全問題提供了一個有效的解決方案。基于業務的歷史數據,通過統計分析與機器學習的方法學習出業務的歷史特征,包括操作邏輯特征,時間特征,參數特征,統計信息特征等,結合專家知識形成業務特征的基線。根據基線來檢測業務行為是否存在異常。

與網絡安全不同,業務系統的種類繁多。對于Web類型的業務來說,由于其一般工作在TCP/IP網絡協議的第七層,即應用層,其業務參數及業務操作定制化程度很高。另外對于像工控系統,其業務主要是針對設備的控制指令操作,或者設備本身的數據上報與心跳。因此,對于不同類型的業務系統,其面臨的業務安全問題差別較大,需要針對不同的安全場景開發相應的解決方案。下面分別針對幾種典型的場景,給出相應的業務層面的分析手段。

一、Web業務安全場景

Web類型的業務一般工作在TCP/IP網絡協議的第七層,主要采集業務辦理過程中瀏覽器的HTTP頭數據來學習業務的操作序列。HTTP頭數據中包含有時間,HTTP請求類型,body,cookie,referer等字段信息。其中,HTTP請求類型信息可以區分出相應的請求是否對應了關鍵的業務操作;body和cookie信息可以用來標識出用戶信息和會話的信息;referer信息可以用來標識業務的資源信息。其系統結構如圖1所示。

Web業務安全系統結構

圖1   Web業務安全系統結構

采用關聯分析和統計分析的方法對采集到的HTTP頭數據進行分析,以得出業務的操作序列。在用戶對業務系統的操作過程中,瀏覽器主要有兩種類型的HTTP請求,即GET類型的請求和POST類型的請求。而對于業務辦理的操作來說,由于需要向服務器提交數據,所以業務辦理的關鍵步驟對應的都是POST類型的HTTP請求。

提取出POST類型的數據以后,根據cookie和body中的信息將一個用戶在同一次會話的數據聚合在一起。將聚合以后的操作序列按照時間進行排序,就得到了有序的業務操作數據。

在HTTP請求數據中,referer信息可以標識出業務的資源,例如運營商系統中的流量套餐,彩鈴等業務。每個用戶在一次會話過程中可能會辦理多項業務,這些辦理業務的操作數據會一起出現。因此需要將這些數據按照referer信息進行聚合,以分別提取出用戶辦理業務的操作序列。

將前面提取出的業務操作序列進行去重,即得到包含有用戶信息和會話信息的序列。為了提取出業務本身所對應的操作序列,需要去掉用戶信息和會話信息,只留下業務本身的操作信息。在實際的業務系統中,業務本身的操作信息由URL的跳轉序列,和序列中每一條URL所對應的body信息中的屬性名組成。統計出原始數據中每一組URL跳轉序列出現的次數,再分別統計出每一組URL跳轉序列下所對應的不同的body參數屬性名稱組合出現的次數,并按照從多到少的順序進行排序。出現次數多的序列更有可能是正常的業務操作序列。將提取出的序列與專家知識進行結合,即可得到業務操作序列的基線,用于檢測業務操作序列的異常。

根據前面的方法,針對某彩鈴訂購網站的HTTP請求數據進行統計分析,得到的業務最小操作序列如表1所示。在表1中,URL序列就是通過統計學習得到的一條最小操作序列。在后面的參數字段就是在這種操作序列下出現的body中的參數字段的組合。出現次數指的是在給定的原始數據中相應序列組合的出現次數。在表1中一條URL序列對應了三種body的組合,也就是說表1中包含了三種可能的業務。統計學習出來的結果還需要經過管理員的確認,以保證其準確性。這樣通過歷史數據學習來取得業務的操作序列可以幫助管理員配置安全審計系統中的業務操作基線,減少管理員的工作量。

Web業務最小操作序列示例

表1   Web業務最小操作序列示例

二、物聯網卡業務安全場景

物聯網卡指的是運營商用在物聯網業務中的SIM卡。物聯網卡的類型與功能如表2所示。

物聯網卡的類型與功能

表2   物聯網卡的類型與功能

由于很多物聯網卡的功能與普通手機卡的功能相同,所以物聯網卡會存在著被濫用的情況,即被用在個人手機業務中,或者被用來進行薅羊毛、電信詐騙等。另外,由于物聯網卡一般不會與設備進行綁定,所以也會存在物聯網卡實際應用的業務場景與合同約定的場景不同的情況。基于大數據分析和機器學習的方法可以有效的發現物聯網卡業務數據的異常,進而發現被異常使用的卡。

物聯網卡異常分析流程

圖2   物聯網卡異常分析流程

如圖2所示,采集物聯網卡的語音話單、短信話單、流量話單、上網日志和發卡與用卡單位相關信息等數據,根據異常分析模型數據需求,從話單中提取出有效的關鍵數據特征,如通話信息、短信發送信息、上網行為信息等,采用統計分析,關聯分析和相似度聚類分析、深度學習等基于機器學習的方法進行行為模式分析。其中,統計分析針對原始數據進行統計,并基于專家知識找出統計結果的異常。關聯分析將多個維度進行關聯,進一步提高檢測的準確性。基于機器自學習的行為模式分析通過歷史數據學習出卡的行為模式特征,并基于特征來檢測卡的當前行為是否異常。將分析的結果經過人工審核與確認,最終找到被異常使用的物聯網卡。

基于某運營商的物聯網卡的相關數據進行分析,并結合人工調查的結果,得出物聯網卡主要存在以下幾種異常使用的情況:

1. 挪用異常

物聯網卡被應用的場景發生了變化。例如原來被用在電梯衛士中的SIM卡被用在了車務通中。由于物聯網卡的發卡合同規定不允許私自變更卡所應用的物聯網業務,因此這種情況屬于異常使用。通過和人工確認,發現異常的卡號有320個。

2. 濫用異常

物聯網卡只能應用在物聯網業務中,不能應用在個人業務中。如果物聯網卡被用在了個人的手機中,這種情況屬于卡被濫用的情況。經過分析和人工確認,發現存在濫用異常的卡號一共有1020個。

3. 合同及管理異常

在實際調查中發現,有很多的卡雖然在數據分析的結果中被認為是異常,但實際上這種異常并非由于卡被異常使用所引起,而是由于在管理中的疏忽所導致。例如有些卡存在個人業務的行為特征,而實際調查中發現這些卡本身就是已經實名制的個人手機卡,但卡的相關信息卻出現在了物聯網卡的數據集合中。這種情況一般是由于卡在被管理的過程中出現差錯導致的,而卡本身并不存在被異常使用的情況。另外還有一種情況是物聯網卡的發卡合同中只規定了卡所對應的收費套餐,而沒有規定卡所應用的行業場景。這種情況也屬于對卡的管理存在漏洞導致的異常,而不是卡本身存在被異常使用的情況。

三、變電站業務安全場景

變電站是電力系統中變換電壓、接受和分配電能、控制電力的流向和調整電壓的電力設施。它通過其變壓器將各級電壓的電網聯系起來。而智能變電站是指通過智能設備以全站信息數字化、通信平臺網絡化、信息共享標準化為基本要求,自動完成信息采集、測量、控制、保護、計量和監測等基本功能,并可根據需要支持電網實時自動控制、智能調節、在線分析決策、協同互動等高級功能的變電站。與傳統變電站不同,智能變電站采用IEC61850的標準。這是一個國際通用的變電站自動化系統。它對于設備的行為,數據的命名以及定義都進行了規范。智能變電站使用電子式互感器替代傳統的電壓互感器,使用光纖接線替代傳統的信號電纜硬接線,傳輸的數據也變為數字量。

與一般的IT網絡不同,由于工業網絡中經常存在輪詢,診斷,周期刷新等業務,工業網絡中傳輸的報文在時間上通常具有一定的規律。變電站網絡如果遭到入侵導致工作異常,其報文傳輸的時間特性通常會發生變化。因此對變電站網絡中報文傳輸的時間特性進行分析,可以為變電站網絡是否遭到入侵提供一種檢測的方法。這里以智能變電站中的MMS報文為例,來分析其傳輸的時間特性。

將采集到的MMS報文按照源IP/port,目的IP/port,報文類型和關鍵字進行聚合,聚合以后統計其傳輸間隔的時間特性。其時間特性如圖3所示。

圖3    聚合以后的MMS報文的時間間隔特性

如果MMS報文的時間間隔特性發生變化,則說明中間有對系統的操作,或者系統出現了異常情況。由于時間特性的變化會很微小,不容易直接檢測到,這里采用小波變換的方法進行檢測。如圖4和圖5所示。

MMS報文的時間間隔與其小波變換

圖4    MMS報文的時間間隔與其小波變換

MMS報文的時間間隔與其小波變換

圖5    MMS報文的時間間隔與其小波變換

圖4所示是對圖3中的序列進行小波變換以后所得到的結果。在圖5中,時域信號發生了微小的變化。這種時域的變化不容易直接檢測。但是采用Haar小波變換的方法卻可以檢測這種變化,如圖5中間的曲線圖所示,時域序列的微小變化會引起小波變換以后的結果發生較大的變化。通過檢測這種變化,即可檢測到原始時域序列的變化,進而檢測報文傳輸的異常。

以上給出了幾個通過數據分析和機器學習的方法檢測業務系統中異常的案例。可以看出由于業務系統的功能不同,其數據源和分析方法有較大的差別。根據系統的特點和功能對其數據進行分析與學習,將得到的結果與專家知識結合,即可發現業務系統中的異常情況。

【本文是51CTO專欄作者“綠盟科技博客”的原創稿件,轉載請通過51CTO聯系原作者獲取授權】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2022-04-02 11:47:11

數據分析業務崗位

2019-07-23 16:37:05

大數據IT人工智能

2023-11-01 11:36:47

2020-07-02 10:27:27

大數據農業技術

2024-03-25 13:59:20

機器學習工業應用

2022-07-05 11:18:50

數據分析銷售業績

2021-01-28 11:39:01

數據分析銷售

2017-07-06 12:48:35

大數據動向新零售

2019-11-01 10:00:14

前端業務代碼

2024-04-11 10:00:00

GenAI人工智能

2016-12-14 11:39:19

數據分析大數據多光譜

2022-05-31 06:04:14

數據治理數據安全

2022-11-21 11:50:59

2021-10-28 19:22:35

數據分析

2022-05-11 11:33:53

數據分析業績業務

2022-08-16 11:33:43

數據分析業務數據

2021-02-22 17:29:41

體系數據分析模塊

2023-03-28 18:16:38

2021-03-10 11:44:12

數據分析決策分析管理數據

2019-01-16 15:56:57

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美精品综合在线 | 欧美精品在线播放 | 久久国产精品一区二区三区 | www.色综合| 日本久草视频 | 91在线观看免费视频 | 成人精品国产一区二区4080 | 亚洲综合日韩精品欧美综合区 | 国产精品久久久久久久久久三级 | 日韩在线免费 | 国产一区二区三区在线 | 国产日韩欧美在线 | 免费观看一级特黄欧美大片 | 欧美6一10sex性hd| 一级毛片播放 | 大象一区| 伊人久久麻豆 | 91人人澡人人爽 | 欧美一级二级在线观看 | 黄色一级电影在线观看 | 久草在线视频中文 | 成人久久| 国产一区二区在线免费观看 | 日韩精品一区二区三区中文在线 | 久久精品一 | 国产区在线 | 中国毛片免费 | 国产丝袜人妖cd露出 | 久久亚洲欧美日韩精品专区 | 国内精品久久久久久久影视简单 | 97色在线观看免费视频 | 欧美视频精品 | 午夜精品久久久久久久99黑人 | 亚洲精品视频一区 | 久久一热| 精品国产一区二区在线 | 欧美日韩国产一区二区 | 三级国产三级在线 | av手机免费在线观看 | 久久综合久 | 北条麻妃国产九九九精品小说 |