旁觀之大數據 從知識產權說起
我現在從事的是知識產權工作,接觸的也是專利數據較多,之前在工程設計院接觸的也都是工程數據,不會算法,也不懂存儲。所以今天我可以以第3視角給大家分享一下我眼中的大數據,僅代表個人觀點,見識有限,歡迎大家一起學習討論。
現在的大數據研究更偏向于可以直接間接歸納整理的運算邏輯數據。實際上很多存儲在網絡里的有價值的文獻數據的利用也剛起步,包括了視頻,音樂,文章等。這些數據的價值會隨著國內版權意識和專利權意識的提升而越來越擴大化。
文獻數據本身價值來源于原創性和基礎性。成果做到盡可能多的獨立原創,又能被別人更可能多的引用,甚至用做基礎進行二次開發,跨界商用。我最近開始學習怎么做專利情報分析,需要懂的專業知識很多。下面繼續談當下的大數據。
即使是在大數據工具當前運用較廣的消費市場運用方面,也是有缺陷的。這里就和好多人有識之士的觀點一致了,大數據再美也只是工具,做判斷的還需要人。
我引用曹建輝老師在《卓越領導者》第60頁的一段話:
第二,不憑數據,而憑眼光和感覺。這五位卓越領導者在判斷行業未來的市場前景以及客戶的需求趨勢是,沒有一個人用到大量的數據,只有對行業的認知,感覺基礎上的“認為”。事實上,新興行業沒有經驗數據可依;已有的行業,未來也絕不會復制從前,不會按原有模式發展下去。所以絕不可依賴已有的數據,未來的變化和趨勢從來都不是根據數據模型和數據推測出來的,而必須憑眼光和感覺來判斷,這才是看待和選擇行業的根本。
其實不光是看待和選擇行業。在很多事情上,數據模型做的再好,分析的再合理,也不從來不能是我們的決策的根本依據。就像36大數據里群友討論的大家都驚嘆于亞馬遜中國大數據做的多好(國外公司是有購買數據分析報告的習慣),但在中國還是被淘寶給干翻在地。這就是典型的分析報告無效的案例。甚至報告往往得出的結論是錯誤的。
下面有個例子是知識產權方面的。
在最近的一次日本律師事務所分享報告上,在日本專利的長篇數據圖表分析之后,他補充說明了一句,這個圖表不能判斷日本專利訴訟的很低。還要考慮日本的特有的文化,還有日本商會很多都是百年老店,經營管理思維偏向傳統。一般專利侵權行為也都不會追究,即使追究也是發函給你,認錯態度好就可以。認錯了,對于這些老店來說就是勝利了,也就沒必要再對簿公堂。上法庭會被認為有損老店形象了。侵權時態度誠懇,甚至侵權費可能也會少要,甚至免了。當然這個只是就當下的,近年來日本文化一直也在演變。所以大家別真的主動在日本侵權,真正撕破臉,上法庭賠償金額,會非常高的。律師那天舉例的最近年糕專利的故事,賠償金額我當時沒拍照,應該是不到8000萬,應該是日元吧,數字僅做參考。不過另一方面可以確切的知道,日本人是有多愛吃年糕。告成功后又告了一家,又成功了。不知道這又會對未來日本專利訴訟的境況會產生多大的影響。
所以在大數據概念日益火爆的今天。我們在驚嘆于這些大數據分析技巧,和得出看似真相的結論的同時,要保持相對清醒的頭腦,更多時候還是要回歸到技術知識,市場前景本身,理性冷靜的做判斷,不能過依賴。尤其是金融業,即使通過復雜的計算,各種的包裝美化能賣出產品,產生一時的利潤,也要考慮其合理性。極端的案例就是,08年華爾街的金融天才們就是玩轉了整個世界又能怎么樣。
那大數據未來怎么發展呢?
14年知識產權報文章《創業板企業在大數據領域的技術與專利現狀分析》節選:
第一類是與海量數據存儲和處理相關的企業;
第二類是與數據中心建設相關的企業;
第三類是與行業數據應用相關的企業。
遵循“數據采集、數據存儲、數據檢索、數據分析和數據應用”的大數據產業鏈,而分布式存儲管理、實時計算、非或半結構化數據處理、基于云平臺的數據挖掘、數據可視化和數據產品應用等則是該大數據產業鏈中的關鍵技術。
未來專利申請的方向
數據獲取及數據分析方法:隨著全球企業競爭不斷深化,數據已經成為企業的核心競爭力,誰掌握數據,誰在行業領域就有發言權。但數據必須通過不斷積累才能形成大數據,大數據必須通過各類分析方法的應用才能形成價值,特別是大數據的實時分析,需要面對瞬息萬變的市場,及時做出反應。因此,在專利申請方面要注重對數據獲取和數據分析方法的保護。
非結構化和結構化數據的集成:隨著海量、多類別數據的涌現,企業中的數據已經不是單一的以文本為主的結構化數據,還包括圖片、聲音、視頻、地理位置等各種類型的數據。據統計,目前85%的數據屬于非結構化數據,如何統籌考慮傳統的結構化數據和非結構化數據的融合和整合,挖掘出兩類數據中的關聯價值,也是專利申請的方向之一。
基礎大數據平臺建設:在對上述企業專利分析的過程中我們也看到,涉及大數據基礎平臺的專利申請比較少,這與我國基礎研究相對落后相關,但同時我們也看到,在一些企業中已經把大數據基礎平臺的研究作為了重要的方向,因此,在進行技術研發的同時,一定要注重對核心關鍵技術進行適時的保護,這不僅是企業在大數據領域競爭的基礎,也是企業發展的保證。
知識產權報從專利的角度解讀了大數據發展方向。尤其認同數據關聯價值這個說法。之前我工作幾年的部門就是設計院內的工程數據中心,我們當時最有價值的工作就是做設備關聯關系表。以工程文件中的設備位號關聯設計圖紙,3維模型,廠家設備文件等。
數據關聯后,在不同的地方,不同的領域往往能產生更大的衍生價值。在發明專利里也有類發明叫用途發明。技術的跨界運用有時能創造巨大的社會價值。這方面主要藥品領域案例較多。這里舉個比較直觀的,類似但不能新申請專利的新用途事例。行車記錄儀的新用法:最近有美女叫老公去看行車記錄儀,告訴他要當爸爸了,懷孕了。前文中的日本年糕專利的案例這則信息,他們的實際賠償金額是通過嚴格計算的,側面我們也就能知道市場銷量。
海量數據存儲和處理;數據中心建設也很重要,這是工具,是技術基礎。個人看但這個相對中小企業來講長期看并不實際,這塊終將會只剩幾個大玩家。大數據時代給我們的會有很多新的可能,大到有報道已有飛機場利用大數據給每個飛機計算單獨的航線,小到利用大數據真正實現量體裁衣。
所以相信未來的大數據會加速滲透到各個行業領域。量化我們的生活行為,更加深度的挖掘創新并滿足我們生活需求。其中已經入侵和并影響了我們運動出行,飲食習慣,社交等的個人數據。
最后,當下我們就能看到的是有關大數據很多事正在發生著,比如正在重建社會信息體系(各種互聯網金融的白條),剝去銀行保險業的神秘內衣。但大家對大數據也不要報太多期許,能顛覆很多行業。當年發明出留聲機后就有預言廣播這種只能被動聽聲音的會被取代。但事實呢?都發展的很好。
補充:最近大家很期待政府的大數據,其實政府的大數據一是每年花大量的人力物力去普查,但考慮到體制和立場問題,公開并不一定準,比如失業率。就算是公開的也會很有限的。譬如下面的黨員不能買賣股票的新聞。還是很大部分數據真正涉及利益的數據是不可能會公開的,所以大數據的來源還得主要靠自己。
最近看到新聞,中紀委回應黨員能否炒股:四類人員不能買賣股票
一是上市公司的主管部門以及上市公司的國有控股單位的主管部門中掌握內幕信息的人員及其父母、配偶、子女及其配偶,不準買賣上述主管部門所管理的上市公司的股票。
二是國務院證券監督管理機構及其派出機構、證券交易所和期貨交易所的工作人員及其父母、配偶、子女及其配偶,不準買賣股票。
三是本人的父母、配偶、子女及其配偶在證券公司、基金管理公司任職的,或者在由國務院證券監督管理機構授予證券期貨從業資格的會計(審計)師事務所、律師事務所、投資咨詢機構、資產評估機構、資信評估機構任職的,這些黨政機關工作人員不得買賣與上述機構有業務關系的上市公司的股票。
四是掌握內幕信息的黨政機關工作人員,在離開崗位三個月以內,繼續受該規定的約束。