每個數據開發人員對商業智能和數據分析都要了解的十個方面
譯文【51CTO.com快譯】 你還記得自動報表被稱為商業智能或BI的日子嗎?此后不久,技術用戶和業務用戶當中圍繞工作流、流程和用戶體驗的討論真正定義了業務分析或BA。近期在數據分析、預測建模、側重數據挖掘的機器學習以及社會、文本和風險分析等方面的進步讓人們關注預測分析或PA。據維基百科聲稱,BI、BA和PA側重于發現、解讀和傳達數據中有意義的模式,而這就是分析的定義。
商業智能業務分析員(BI BA)與非技術型主題專家(SME)為伍,了解數據要求,以便做出明智合理的決定。預測分析員(PA)常常是在數據挖掘和統計方面有著扎實背景的數據科學家。
真正的商業智能實施始于主題專家撰寫或引出用戶故事。作為商業智能業務分析員,你要確保撰寫的這些用戶故事表達了業務部門的心聲,可以由業務用戶和數據技術員共同探討。比如說,“作為產品經理,我要看到供應商的部件/組件給每個部門帶來的盈利能力,那樣我才能評估供應鏈。”作為保險行業的預測分析員,你在評估定價模型的同時,可能挖掘人口統計、心理、計量經濟學和統計等數據。
作為一名開發人員,你要構建代碼,以便請求、驗證、復制、移動、存儲、轉換、推導并顯示格式日益多樣化的數據。下面是你處理商業智能和分析時要了解的十個方面。
1. 自助式BI必不可少。
我們進入21世紀已有近20年。現代商業智能環境理應為業務用戶提供易于使用的數據分析功能,比如機場航班查詢亭或銀行ATM。為了增強分析功能,自助式BI應當與音樂發現系統一樣豐富。亞馬遜音樂和iTunes允許按類型、年份、歌手及其他元數據來發現音樂。你熟悉那些界面,尋求未知音樂方面的信息。同樣,如果你使用CarMax或Autotrader,實際上有眾多選項可以縮小查找汽車的數據挖掘活動。音樂和汽車都有自助選項。難怪如今精明的業務用戶要求自助式分析,也懂得自助式分析。
2. 提醒比靜態報告更受重視。
你的手機用來處理遠比語音通話多得多的活動。消息本身就是一類重要的編碼信息。不僅限于簡單的SMS,豐富的消息讓用戶對言簡意賅的提醒的期望甚過對文本的期望。照片、表情符、動畫或視頻都完善了之前作為文本消息的信息。相比這種傳統做法:準備好一份完整的報告以列舉關鍵績效指標方面的變化,往你的手機發送文本消息都是一種相當大的進步。
3. 描述性分析只是個起點。
“發生了什么?”后視鏡很重要。幾十年來,后視鏡并沒有被認為是可有可無的配件。報表同樣具有類似的價值。企業內部需要你的多列報表,匯總和鉆取數據,以便了解過去發生的活動。數據采集的速度和對當前及前瞻性分析的需求將決定你的分析成熟度。
4. 數據整合不僅限于操作型系統。
如果清點一下內部數據系統,保準讓你大吃一驚。比如說,一家地區性銀行有50個或更多個軟件系統在生成數據,這一點也不稀奇。核心銀行業務、柜員管理、ATM、租賃管理以及通過并購得到的重復系統都有底層的數據庫系統。從自主開發系統、文件管理器,到SQL Server、Oracle、MySQL及其他一大批商業及開源引擎,不一而足。如果你供職于任何行業的一家大中型企業,就會熟悉存在的種種DBMS系統、版本和數據孤島,一同存在的還有內部操作型系統和共享文件系統上Excel文檔中相關的數據子集。
對大多數行業來說,這些數據之前完全以基于字符的格式存在。近些年來,數據已開始包括社交媒體線索、音頻、圖像和視頻。你的數據整合流程應包括這類數據以便分析。挖掘分析時需要包括來自政府和行業來源的合格的數據集,以便提供適當的分析基礎。
5. 診斷性分析回顧過去。
“它為什么會發生?”是診斷性分析關注的問題。為什么商業建筑商未能償還貸款?為什么病人在約會時間過后要等兩個小時?為什么軟件意外停止運行?你對每個例子的分析都需要獲取并挖掘歷史數據和元數據。
6. 數據可視化并不新奇。
你是Tableau開發人員嗎?它是一款領先的商業數據可視化軟件。用戶尋求數據中的趨勢時,可視化是一種常用方法,而不是翻閱一頁頁的報表或借助Excel中的多列排序。就在不久前,可視化還是新奇工具。如今可以使用增強現實來分析數據。可供你選擇的平臺包括手機和標準電腦。可使用應用編程接口和開發者軟件。你可以構建一種“看得見摸得著”的數據分析解決方案。你的想象力在用數據增強現實方面顯得很寶貴。
7. 預測性分析預測概率。
“可能會發生什么?“預測性分析專注于預測未來的幾率和趨勢。你無法訪問未來的數據,所以只好根據特定的幾率來預測結果。就某個問題而言,數據質量越高、數量越多,確定性越高。確定網上顧客會訂購的下一個商品是公認的例子。預測客戶在一段時間內的價值經常被引用。你可能會運用自身在統計方面的背景,在找出統計關聯時,從對一組變量進行回歸分析開始入手。系數促使分析大數據集里面的變量和不斷調整的幾率。你會發現,寶貴的預測性分析其幾率很少在50%以上。
8. 物聯網數據流分析將無處不在。
物聯網以典型的事務型系統通常所沒有的步伐和數量來提供。車載傳感器生成的數據并不依賴道路上的嵌入式設備。傳感器裝在車上,與車載處理器通信,并與其他車載系統聯系。無人駕駛汽車就是結果。你實時分析數據流所采用的方法縮小了范圍。你需要過濾掉與研究無關的“干擾數據”。
9. 規范性分析建議行動措施。
“應該采取什么樣的行動措施?”這是規范性分析試圖要回答的問題。你回答這個問題的方法取決于常常與預測和風險規避有關的優化或模擬模型。
10. 分析即服務提供高質量的數據,以便豐富數據。
日益成熟的云帶來了許多服務級別。軟件即服務由成千上萬個系統來提供,一些很小,比如待辦事務列表,另一些很龐大,比如多租戶模式的Salesforce CRM。現在,XX即服務占有一席之地。因此,數據和分析成了關鍵的服務。專業公司和國際知名公司都在提供這項服務:用高質量的廣泛數據豐富你的內部數據。IBM的Watson作為一項服務來提供。你可以迅速連接充分利用REST的API,利用強大的計算能力來處理數據。預計在今后幾年,會廣泛出現針對特定領域的數據分析云。你的數據會成為用來豐富內部分析操作的一種手段。
商業界變化不斷。商業智能和分析是你為企業在趨勢和公司健康運行方面提供指標和衡量尺度的手段。
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】