激活數據價值 永洪科技的智勝法則
原創【51CTO.com原創稿件】近十年前,隨著技術的不斷更新迭代,大數據逐漸走向成熟,而如今,大數據已經漸地淡出人們的談資。從2015年開始,大數據已經在Gartner新興技術成熟度曲線中消失,Gartner對此的解釋是,大數據不再是“新興的”,而是正在慢慢融入我們的生活中。
這一說法,也得到了永洪科技高級副總裁邵文龍的認同。他表示,雖然新興技術成熟度曲線中已經沒有了大數據,但是很多其他技術都是基于大數據的,大數據已經成為這些技術的基礎。
永洪科技高級副總裁邵文龍
根據福布斯的報道,89%的行業高管認為大數據將像互聯網一樣改變傳統的商業運作模式。的確,隨著新興技術的不斷演進,大數據逐漸成為了企業中重要的資產。如何從數據中挖掘出有價值的信息,輔助企業甚至是直接進行決策,成為了眾多企業的必行之路。
大數據已經走向成熟?
得益于互聯網的飛速發展,企業中的數據越來越多,過去,企業的關注點在于大量的多樣的數據如何存儲,而如今,更多的企業則希望從這些數據中挖掘價值,為企業的業務發展做出決策。
大數據發展了很多年后,是否已經走向了成熟呢?邵文龍告訴筆者,從企業的數據架構方面來看,技術還在不斷地演進,還有很多創新的技術在不斷推出來,比如Spark、Flink等等;如果從企業應用的角度來判斷,大數據是已經走向成熟了,因為更多的企業開始行動,將大數據作為企業的基礎設施。
在當前階段,大數據的熱點更多集中在大數據的應用以及分析方面,怎樣從數據中挖掘價值,是很多企業的關注點。此外,企業希望服務提供商可以提供大數據一站式的解決方案,從大數據的基礎架構、數據倉庫,到數據分析平臺、商業智能的展現能力,甚至是數據挖掘能力、人工智能的能力全部包含,一攬子的解決方案受到了更多企業的青睞。
數據爆炸式增長帶來多方變化
過去數據大多都是由業務系統所產生,靜靜的存儲在企業的數據庫中,而如今產生數據的來源也是多種多樣的,有來自新媒體、社交數據,也有來自物聯網等傳感器的數據,并且這些數據的形態也是多樣的、雜亂的。而這些不同來源的數據給企業的大數據處理、分析帶來了更大的挑戰。此外,數據的類型,例如視頻、音頻、圖片等不同格式的數據也增加了企業的存儲、清洗、甚至是分析挖掘的難度。
在數據爆炸的時代,帶來的變化不僅是數據處理分析難度的變化,更多的是用戶以及技術上的變化。邵文龍表示,大數據分析和數據挖掘已經逐漸變成企業領導人的共識,他們需要從數據中挖掘價值從而指導自己企業的運營以及決策,因此企業需要利用好歷史數據以及外部數據,從而更好的做出規劃以及決策。此外,企業對于大數據處理的需求也更為清晰。過去很多用戶只是看到大數據很熱就開始做大數據,但是并不知道用大數據來具體做什么事情。而現在這樣的小白用戶越來越少,大部分企業還都是需求明確的。這說明企業對于大數據是有一定的認可度的,大數據已經成為企業的必備品。
第二個變化是技術方面的變化。從Gartner的新興技術成熟度曲線中可以看到,雖然大數據在Gartner的新興技術成熟度曲線2015年的報告中消失,但是很多新興的技術背后都是由大數據作為支撐,大數據已經變成其他技術的基礎。比如,像人工智能,數據就是其重要的因素,如果沒有數據,那么算法模型都只是空殼,并不能產生真正的價值。
雖然,現在像視頻、圖片等非結構化數據已經很多,但是企業中大部分數據還是結構化數據居多。邵文龍表示,結構化數據更加容易挖掘出價值,規律性和特征比較容易總結,因此價值密度相對較高。
永洪科技的PASO應對之法
數據來源多樣化、數據量級增加、數據來源復雜等多種原因,擾亂了數據之間的關系,增加了用戶對數據治理、分析挖掘的難度,同時,對數據安全、隱私保護也帶來了更高的挑戰。
為此,永洪科技提出了PASO(Platform,Application,Service,Operation)平臺,通過技術手段和非技術手段兩方面解決這些挑戰問題。技術方面主要通過Platform和Application的方式,能夠有效的涵蓋用戶所面臨的挑戰,比如數據清洗、數據治理等難題,并且可以通過可視化拖拽這樣簡單易操作的方式實現,同時可以通過相關的血緣分析,找到數據的原始存在位置以及對數據進行過的操作,從而對數據了如指掌。
在非技術手段方面則是通過Service和Operation兩方面著手。永洪科技設有售前、售后、客戶成功實施等不同的團隊,都有完整的服務體系,提供從前端到后端完整的服務,隨時幫助用戶解決遇到的問題和挑戰。而Operation則是永洪科技已經根據以往的經驗,將利用數據的方法、遇到的問題和解決方案制作成實踐方法,將這些實踐方法毫無保留的告訴用戶,讓用戶可以避免很多問題的發生。當然,如果用戶出現其他解決不了的問題時,永洪科技的技術人員還是會幫助其進行解決。邵文龍表示,通過技術和非技術相結合的方式,能夠解決用戶在數據量很大時遇到的挑戰,讓用戶能夠真正的使用起來。
而對于數據安全,永洪科技通過數據權限控制以及產品安全雙重保障的。在權限控制系統中,數據的權限是分層的,可以定義數據的查看權限,例如根據部門或是根據人員級別查看,這樣保證不同層級的用戶可以看到授權的數據。第二,永洪科技的產品是可以抵抗第三方攻擊的。若用戶使用手機或者公共環境登入系統查看數據,可能會被中間人攻擊將個人信息劫走,進而查看到公司相關數據,造成損失。邵文龍表示,永洪科技每發布一個版本都要通過第三方的嚴格的安全檢測和掃描,并且在發布前都要進行數周的穩定性測試和漏洞掃描,在壓力集中的情況下保持運行數周不出問題,才會正式發布,以便保證產品的高可靠性、穩定性。
為客戶多想一步:標準化產品+定制化開發+行業解決方案
商業智能是從九十年代提出的,將企業中現有的數據進行有效的整合,快速準確地提供報表并提出決策依據,幫助企業做出明智的業務經營決策。早期的商業智能有兩個特點,一是構建在關系型數據庫上,因此分析就是非實時的;二是數據量并不是很大。因此,早期商業智能所做出來的數據挖掘和呈現,往往都需要很長的時間。而當大數據出現以后,商業智能進入到第二階段,從原有的IT人員逐步轉向了業務人員,業務人員可以根據自己的需求自己操作,馬上就可以呈現結果內容。
但是在分析需求變更時,業務人員不會直接調整報表,需要IT人員重新建模或修改已有分析模型,耗時較長,響應速度較慢。因此,永洪科技提供了自主研發的大數據高性能計算引擎軟件MPP數據集市,采用了列存儲、內存計算、分布式計算、分布式通信,高性能多層緩存等技術,當用戶將數據從數據庫導入到分析平臺時,可以及時響應。
邵文龍表示,客戶在商業智能方面的需求比較發散,很難有一款商業智能的產品能夠完全滿足用戶,因此,永洪科技采用標準化的產品+定制化的開發+行業解決方案,來滿足不同行業不同用戶的需求。
標準化的產品提供通用型的技術能力,比如Z-Suite一站式大數據分析平臺,覆蓋了數據分析過程的各個環節,包括數據采集、清洗、整合、存儲、計算、建模、訓練、展現、協作等,讓用戶可以在一個統一的平臺上完成全流程數據分析任務,降低了實施、集成、培訓的成本。對于某些特殊的功能,則是可以通過定制化或插件的形式提供,目前永洪科技也開放了產品接口,感興趣的人員可以自己開發后放到應用市場中,如果用戶沒有找到合適的插件,永洪科技的技術人員也是可以開發的。
Z-Suite 技術架構
對于行業用戶,永洪科技也是有不同行業的解決方案,通過永洪科技的行業專家數十年的行業理解,總結出不同行業的業務需求和挑戰,從而制定通用型的行業解決方案。目前,永洪科技已經針對制造、零售、金融、電商、交通、電力、醫療、電信、互聯網、高教、政府等不同行業做出了解決方案,覆蓋了主流行業的數據分析和挖掘的需求。
雖然很多企業都意識到大數據可以為企業帶來價值,但是往往想的還不夠透徹。邵文龍舉例說,以零售行業為例,如果客戶數據倉庫已經準備好,永洪科技會與客戶的業務人員以及IT人員溝通,了解清楚客戶做大數據分析的目的,客戶一般是想要做數據銷售情況的展示效果,但是永洪科技還可以幫助用戶做銷量預測、庫存優化等等,幫助客戶多想一步,將數據分析挖掘做的更加透徹。
AI+BI:讓數據價值可衡量
人工智能技術的出現,讓機器可以模仿人類的思考方式變得更加智能。人工智能和商業智能該如何結合呢?邵文龍表示,很多用戶不太關心后端的技術是使用的哪些以及如何實現的,只是關心提出的需求是否能滿足。但是,永洪科技會根據用戶的需求來選擇合適的AI模型以及匹配的BI展示形式。
在數據清洗后會分成訓練集和測試集,根據訓練集進行訓練模型,調整模型參數,驗證模型,然后將模型部署到測試環境中進行測試,測試沒問題后部署到生產環境中,結果將在商業智能上進行展現,讓用戶在無感知的的情況下體驗到AI與BI的結合。
邵文龍認為,現在用戶對于AI的需求會越來越多,未來會逐漸變成一種典型的場景。因為用戶在效果上是能夠感知的、觀察的、可衡量的。通過AI技術的結合,將復雜的模型高度抽象,幫助用戶發現通過肉眼觀察分析看不到的內容,并且可以預測判斷未來的內容,讓價值變得可衡量。
不過,人工智能的模型訓練是需要大量投入的,找到合適的算法模型才能分析預測出更精準的結果。從訓練模型、調整參數、驗證模型、部署模型等一系列的流程,都是需要大量的人力、計算力,以及時間等成本。永洪科技也正在研發AI相關的標準化產品,將復制性比較強的項目進行總結,從而做出標準化的模型和功能,減少多方面的投入成本。
未來的三步發展
從商業智能到大數據分析,再到現在人工智能技術的結合,未來大數據的發展會集中在哪些方向呢?邵文龍表示主要在智能分析能力、提升產品性能、產品對數據挖掘洞察力的支持三個方面,而這三方面也將是永洪科技的研發方向。
首先,智能分析的能力也就是Gartner今年預測的十大戰略技術之一的增強分析技術。為了獲得更好的數據洞察能力,增強分析將把大數據重塑為智能數據。作為一種先進的數據處理工具,增強分析能夠從大數據中獲得洞察力的真正本質。因此,當用戶打開報告后可以直接看到數據異常點以及產生的原因,而不再需要手工的鉆取與分析。此外,用戶的交互方面也是智能的,業務人員可以通過自然語言的方式來進行查詢,直接獲取數據洞察力。
第二是提升產品的性能。由于數據量越來越大,企業后臺的計算能力也是成指數級增加,因此無論是基礎架構還是軟件系統,都需要更強的性能來做支撐,以保障數據的分析挖掘的能力。永洪科技的MPP數據集市是大數據計算引擎,在永洪MPP的基礎上,正在通過技術革新來進一步提升產品的性能,保證用戶在使用時的使用體驗。
第三是產品對用戶需求的支持要有保障。由于人工智能技術的加速發展,企業對數據挖掘的洞察力要求也會越來越多,數據訓練的模型,驗證模型,評估模型,部署實施等一系列流程都要清晰。服務提供商的產品要能夠支持不同的數據模型,并且可以與現有的數據分析進行無縫結合,統一展現出數據分析以及預測的結果。
結語
永洪科技于2012年成立,致力于為企業提供高效可靠又簡單易用的數據分析解決方案。七年多的發展中,雖然有很多技術推陳出新,但是永洪科技始終保持初心,扎根于數據分析領域,幫助企業將數據轉換成有價值的信息。除了提供標準化產品,個性化服務以外,永洪科技利用技術能力降低數據分析的門檻,將數據分析變得更加簡單易用,讓用戶真正的使用起來。而永洪科技的堅持以及理念也得到了資本市場的認可,從2013年到2016年四年時間里,永洪科技先后完成了四輪融資,獲得了包括騰訊創投、元生資本、經緯創投等投資機構的青睞。隨著智能時代的來臨,在技術不斷演進的過程中,相信永洪科技會幫助企業挖掘出更大的數據價值。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】