走近IBM企業內容管理之揭秘全新“軟”實力
原創(接上文: 走近IBM企業內容管理之中國市場成長策略)
上篇文章我們介紹了IBM ECM在中國的市場成長策略,接下來要向大家介紹的便是在IBM的發展策略下ECM提供了怎樣的產品和技術能力,在用戶企業實踐方面又有怎樣的經驗可以分享。IBM軟件集團在此前的2012年策略發布會中曾提出智慧“軟”實力的觀點,并表示希望可以通過軟件技術幫助企業實現成長和創新。作為IBM提出的“軟”實力的重要組成部分,新版的企業內容管理(ECM)產品于5月31日在全球同步上市,他們分別是ICA(內容分析)、ICC(內容捕獲采集)和ICN(文檔、影像、社交內容管理)。
ICA (IBM Content Analytics)——內容分析
非結構化數據的爆炸式增長,使有價值的信息散落在各個“孤島”。這些非結構化信息包括辦公文檔、視頻影像與音頻、HTML網頁、電子郵件、文本、報表等等,這些信息通常被放在企業的數據庫、文件系統、網站及門戶等等IT系統中。來自IBM南加州ECM實驗室的開發負責人Susan Chen女士認為,“企業運營中所使用的數據,80%以上是非結構的,它的增長率甚至是結構化數據的兩倍。這些數據來自于每天擁有兩千億往來的電子郵件,再加上影像、辦公文檔、音視頻文件等等,可見是海量數據。如果能夠有效利用海量數據,我們便可以提早發現問題,提升對客戶的服務,降低作業成本,能夠發掘新的收益機會。”Susan Chen在5月31日——世界無煙日,IBM ECM用戶大會上形象的例舉了一個非結構化數據判斷吸煙患病風險的例子,她談到,“我們做了一個醫療界客戶的POC(為觀點提供證據),我們用ICA分析五千個病人的記錄,其中一個項目是找病人抽煙的習慣判斷他得心臟病的風險性。從有結構式的數據中,有35%的記錄中找到了抽煙指標;在文本數據中從81%的數據找到抽煙指標,并且準確度高了很多。所以如果只對來源數據進行分析可能會錯過一些很重要的洞察。” Susan Chen提到的ICA便是IBM ECM解決方案中的“主角”之一,IBM內容分析管理產品,全稱IBM Content Analytics。
“企業內容分析的數據對象正在發生變化,從事務性的結構化數據轉向交互性的非結構化數據已成趨勢。”Susan Chen表示,ICA能夠對異結構數據源進行企業級搜索以及文本分析。筆者了解到,ICA的工作原理是通過分析搜尋功能將捕獲的數據輸入UIMA管道(一個用于分析非結構化內容的組件架構),結合按照UIMA開放標準編寫的注釋器進行內容分析。生成后的數據會被添加至索引目錄,然后用戶可以根據ICA的分析結果界面進行有選擇的信息發掘和獲取結論,以作為準確的業務決策參考。ICA的搜索結果會是怎樣的界面呢?如下圖所示,這八個例子便是ICA分析結論的代表視圖。
ICA提供三種系統配置方法滿足不同數據的需要。“小數據比如說做POC的時候可以部署在單個工作站;如果是生產系統可以部署一到數個服務站;用大量數據的時候可以利用BigInsights做分析。”Susan Chen表示,“平時的工作中可以支持五千萬到一億的數據文檔,ICA的第三版本提供了面向大數據的配置。ICA和BigInsights的集成架構,設計的重點是要把系統中最耗計算資源的部分,也就是文檔處理前的準備、內容分析、建索引和全局分析,通過Hadoop、Map Reduce的模式分布在一群廉價的機器上,這群廉價的機器等于就是一個計算云。”
下圖是一個亮點,這是ICA能夠支持的30多種異構的數據源。根據Susan Chen介紹,這些數據源代表著150多種不同的表格。值得一提的是,這些數據源中除了支持IBM自己的產品之外,Oracle 11g、微軟SQl Server、Sybase系列均在其中;包括EMC、CA Technologies等廠商的內容管理產品也可以成為被ICA捕獲收集的數據源。這是怎樣實現的呢?筆者有機會采訪到了IBM軟件集團行業解決方案ECM開發部項目總監 William Lobig先生,并獲得了一些回答。
ICC (IBM Content Collector)——內容捕獲收集
以微軟的企業級協同門戶SharePoint作為數據源的例子來說,IBM的內容管理解決方案是通過怎樣的技術實現了數據源捕獲?這便涉及到IBM ECM的另一款產品ICC(內容捕獲采集),William Lobig表示,“ECM方案中的ICC產品提供了這樣的連接器,以模塊化存在于ECM方案中。這樣的Connect連接器,可以連接不同的數據源。具體的關于怎樣采集和捕獲SharePoint中的數據,如果要把它轉化到IBM的ECM里面,可以利用一個指針一樣的功能,當需要內容庫的時候便可以調用SharePoint,這是按需求來做的。這是IBM自己的解決方案,只不過我們使用了微軟公開的API。”下圖為ICC最新3.0版的一些概括。
IBM Content Collector 3.0(點擊放大)
#p#
ICN(IBM Content Navigator)——文檔、影像、社交內容管理
ICN是IBM ECM解決方案中的另一款“主角”產品,IBM中國開發實驗室ECM產品開發經理徐光新女士介紹說,“IBM Content Navigator是用JavaScript編寫的外部客戶端,它支持最新的HTML 5.0。它提供的是組建化的用戶界面的設計,支持多個Web容器,有很強的可擴展能力,客戶根據不同的應用場景對用戶界面進行定制,也可以很方便地加入自己新的功能。”
ICN的主要應用場景是文檔管理、影像管理和社交互動管理。徐光新談到,“IBM Content Navigator通過API的調用可以發揮后端IBM存儲庫的企業級的管理能力,支持企業級的生產系統,比如影像管理系統或者客服系統;我們也加入了新功能支持團隊協作和社交內容的協作。團隊空間是一個非常典型的團隊協作的使用場景,利用IBM Content Navigator用戶可以方便的根據業務需求或者項目需求,用IBM Content Navigator建立自己的團隊空間,可以在團隊空間里定義不同的角色,支持基于角色的權限管理,也可以定義常用的文件夾、文檔模板、搜索模板或者工作流,所有這些都不需要IT人員的參與和幫助。”
IBM Content Navigator目標使用場景(點擊放大)
IBM Content Navigator的架構具備怎樣的組成和特點?徐光新表示,“IBM Content Navigator作為通用的ECM客戶端,主要目標是組件化可重用,有很強的客戶化的能力,有靈活的擴展性。該架構最下面是不同的存儲庫,如OnDemand、FileNet內容平臺等;再往上是中間服務層,這一層通過API的調用和各個存儲庫進行連接,同時提供了跨存儲庫的能力和服務,比如搜索的能力、文檔察看能力;再向上是客戶端的框架,遵循MVC架構,在模型層提供了JavaScript類庫,它對一些常用的業務邏輯進行了封裝,比如和存儲庫連接進行數據交換的邏輯,比如請求處理、或者桌面、團隊空間、搜索、工作列表對這些常用業務邏輯進行了分裝可以方便的復用;在模式層之上是viewer層,我們對一些常用的可用控件的提供了JavaScript的類庫,一些常用可視控件包括查詢的表單、目錄樹、工作列表等等,這些可視控件用來構建IBM Content Navigator的用戶界面,用戶可以構建自己的各種web應用。”
徐光新女士談到,“在模型層中ICN提供了Objective-c類庫,用來支持IOS的客戶端應用,并且在這個框架上也可以追加微軟的一些客戶端應用。在整個框架中,每個層面都提供了很多的擴展點,這為IBM合作伙伴的平臺快速定制和開發客戶端應用提供了便捷。”
IBM軟件集團行業解決方案ECM開發部項目總監 William Lobig,在IBM ECM中國用戶大會上展示了一版ECM新品發布路線圖,這讓我們能夠看到IBM ECM在2012年的一些研發計劃。詳情如下圖。
中國市場中企業內控的契機
就像前篇文章中IBM軟件集團解決方案部企業內容管理產品開發副總裁John Murphy提到的,最初ECM中的信息生命周期管理產品是針對美國市場的需求而研發,后來看到中國市場的成長與客戶對信息管控的需求后ECM的方案才更多的面向中國的企業客戶。中國自2009年頒布《企業內部控制基本規范》后,又于2010年又發布了相應的配套指引,一系列的對企業的規范要求應該是以法規遵從、規避運營及財務風險為主要目的,這便為上市公司及大型企業提出了對企業內容的管控約束,而中小型企業亦要參照執行。據筆者了解,以金融行業為例,企業需要將內容數據保留至少7年的時間,以備審查和管理所用。
這種對于企業內控管理的要求不僅僅是來自政府的推動,作為企業用戶也會希望通過加強內控管理,提高工作效率,根據對企業運營內容的分析更好的做出業務決策。有需求便有了市場,面對這種契機,確實會吸引許多IT廠商的目光。John Murphy認為,“從數據和信息的生命周期管理來說,對于數據的保留來說,應該保留真正應該保留的數據。我們有能力和產品能夠做到這一點,比如在我們的內容庫里有這樣一些內容,對數據來進行保留和控制的能力。在我們的內容庫里增加所謂記錄的保持,這種記錄的保持又進一步加強了我們這方面的能力。比如說需要保留的內容里面,可能需要保留的時間更長一些,因為你需要這些數據和記錄。現在有一些什么變化呢?因為過去更多的關注哪些東西是必須要保留的。目前在過去能力的基礎上,我們又增加了一種能力,對于那些不需要的信息進行合理的處置。這里也滿足了法規遵從的要求,就可以按照規范的要求比如什么時間或者為什么要把那些不需要的數據刪除掉。我們認為這種能力是目前IBM公司獨有的能力,可能再過兩三年會有其他公司照搬我們的做法。”
從John Murphy的回答中顯然能夠看出IBM表現的自信,但是筆者認為對于擁有跨國業務能力的IT廠商來講,怎樣更好的將技術方案“本土化”或將是自己最大的挑戰。以業務需求引導的IT創新能力會日益加深對企業成長的影響。企業內容管理可以影響企業運營,幫助業務更好的決策,這樣的IT能力或將逐步演進成為現代化企業的剛性需求。
相關文章:走近IBM企業內容管理之中國市場成長策略