惠普高管:大數據分析要逐步到位
原創(chuàng)蘋果,是代表一種水果,還是一部電影,亦或是蘋果公司呢?同樣的文字卻代表著不同的意思,這就要求大數據分析要能夠理解在不同環(huán)境下文字的正確含義。如今,數據類型逐漸增多,企業(yè)不能單純的收集分析內部系統中的結構化數據,更應該看到外部的非結構化數據,例如音頻、視頻、社交媒體、傳感器等數據的價值。企業(yè)如何利用這些不同類型的數據進行分析,已然成為各行各業(yè)的巨大挑戰(zhàn)。
惠普中國區(qū)副總裁、惠普軟件集團大中華區(qū)總經理于志偉認為,“目前,很多企業(yè)都不知道怎樣有效的利用大數據,存儲了非結構化數據后卻不知道怎樣利用,越來越多的非結構化數據無法被企業(yè)控制,但非結構化數據對決策的影響會更加重要。”
惠普中國區(qū)副總裁、惠普軟件集團大中華區(qū)總經理于志偉
近日,惠普推出了新版Autonomy中的組件IDOL 10.5,讓用戶可以分析各種類型的數據,通過對上下文的語義環(huán)境理解,讓非結構化數據變成可以理解的內容。通過連接器,Autonomy可以連接到400到500種不同的系統。只要這些信息是公開的,惠普就可以對這些數據進行分析。
Autonomy是黏稠劑
惠普去年推出大數據分析平臺HAVEn,包括Hadoop、Autonomy、Vertica、Arcsight以及各種應用組件。如今大數據的數量之大要求企業(yè)必須有低成本的存儲能力,Hadoop就可以解決大規(guī)模的存儲問題;當存儲后,企業(yè)需要從這些數據中識別出規(guī)律,找到數據的模式,這就是Autonomy發(fā)揮的作用,讓非結構化數據變成可以理解的內容;第三步,當數據理解后,就要對其進行大規(guī)模、快速分析,Vertica就派上用場了。
作為HAVEn平臺中的一部分,惠普公司軟件集團Autonomy信息分析部副總裁兼總經理Rohit de Souza認為,Autonomy起到了黏稠劑的作用。Autonomy是為Hadoop開發(fā)的,用戶可以直接在Hadoop中運行Autonomy,并且數據不需移動到數據倉庫中。Rohit de Souza表示,在信息爆炸式增長的去試下,如果把海量數據移動才能發(fā)現其價值,就會增加成本和難度,因此Autonomy不需要借助數據庫,只要訪問權,就可以在數據所在的位置系統中進行分析。
惠普公司軟件集團Autonomy信息分析部副總裁兼總經理Rohit de Souza
HP IDOL for Hadoop把Hadoop從某種程度上較窄的傳統數據存儲倉庫變成強大的智能分析平臺,能夠從PB級的數據中獲得洞察。通過把情感分析、集群和實體抽取等強大的HP IDOL功能嵌入Hadoop節(jié)點,企業(yè)可以進行先進的客戶、安全、運營分析等等。
通過在HP ArcSight 企業(yè)安全管理(HP ArcSight Enterprise Security Manager)內分析非機構化電子郵件、社交媒體數據以及安全、應用和運營事件,面向HP ArcSight的HP IDOL電子郵件分析包和IDOL社交媒體分析包能幫助用戶預防并管理內部威脅、黑客威脅和惡意通信。
不能一口吃下一頭大象
大數據的到來,讓很多企業(yè)看到希望,也面臨著挑戰(zhàn)。如果利用好大數據,從數據中獲取更大的價值,是每個企業(yè)都關心的事情。但是,面對如此海量的數據,該如何開始呢?
Rohit de Souza表示,“如果要吃下一頭大象,要一口一口吃下去。任何企業(yè)要想直接跳躍到分析所有信息,將所有信息匯總做大數據分析,那肯定要失敗的。”Rohit de Souza建議,企業(yè)要選取一個沒有充分利用的數據類型,從這個數據類型開始,一步步慢慢增加不同數據類型,逐步到位。
大數據對于企業(yè)來說越來越重要,涵蓋的環(huán)節(jié)也會越來越多,選擇技術涵蓋比較廣的企業(yè),在將來擴展時會省心很多。于志偉認為,惠普大數據有三大特點,首先是全面性,從軟件、硬件到服務是整體的解決方案,此外還有很多最佳行業(yè)實踐;第二是技術方面,惠普擁有眾多技術的知識產權;第三是靈活性,于志偉認為,企業(yè)可以在任何一個點開展自己的大數據之旅,而惠普擁有豐富的本地資源支持,提供適合客戶的解決方案。
不取代行業(yè)專家
每個行業(yè)都有不同的特點,因此,在做大數據分析時,需要量體裁衣,制定適合行業(yè)的模型,從而達到最優(yōu)結果。很多廠商對外宣傳,通過大數據分析取代行業(yè)專家,例如,今后不需要醫(yī)生給患者看病,通過大數據分析可以直接開藥診斷等。
但是,Rohit de Souza卻不認同。“惠普的目的不是要取代行業(yè)專家,而是與行業(yè)中的企業(yè)合作,更加有效的動用行業(yè)特定的專業(yè)知識,建立不同行業(yè)的、涵蓋知識產權的數據庫,從而為企業(yè)提供有針對性的解決方案和服務。”
目前,很多不同行業(yè)的企業(yè)都在使用。中國移動使用HP IDOL搜索引擎,可以搜索任何收集里的應用是數據;CCTV未來廣告通過使用視頻分析功能捕捉商標出現次數,同時結合社交媒體的情感分析,改變廣告營銷方法;通過攝像頭對馬路上的監(jiān)控,阿富汗政府通過惠普Autonomy的視頻分析功能,分析在哪些路段會出現恐怖事件,發(fā)出預警從而進行預防;斯坦福大學兒童醫(yī)院,使用IDOL通讀所有病例,快速找出不同藥品之間的交叉影響,幫助醫(yī)生節(jié)省了85%的時間。