美網與大數據
IBM一直在與美國網球公開賽的幕后組織—美國網球聯盟合作,到現在為止這個合作已經持續了22年。整個時間段里,該公司一直在提供傳送得分和統計數據的基礎設施,但在過去的幾年里,事情變得有趣了。
例如,2012年美國公開賽***次有了自己的iPad應用程序(iPhone應用程序在2009年實現),打破了得分信息、直播與點播視頻及分析的情況。甚至從一個復雜的社會媒體的角度來看:當iPad應用程序被打開的時候,你將會看到一個列的集合,每列顯示一連串的消息,這些消息是散列的標簽,具體到公開賽舉行的國家網球中心的個人球場(和比賽)。

僅僅輕拍幾下,你就可以導航視頻流的菜單,也可以是球場,也可以轉播現場比賽,當然是高清的。你也可以很容易地看到***的畫表,關于所有的5個主要賽事(男、女單打和雙打,以及混合雙打)。本周在火島租賃的海濱別墅里,我主要使用了這個應用程序,在那里數字用戶線(順流速度低于3Mbps)是唯一的寬帶選項,并且閱讀器也運行得良好。
回到網絡中
然而你并不一定需要一臺iPad來利用這項技術。例如,在你的臺式或筆記本電腦上登錄www.usopen.org,你就可以利用很多相同的專題節目,甚至是一些你在iPad上不會獲得的。例如,從頂部導航條中選擇視頻和廣播,然后從下拉菜單中點擊美國公開賽直播,選擇一個球場,并開始觀看。在我寫這篇文章的時候,我正在看安吉麗?科伯和維納斯?威廉姆斯正在進行他們的第二回合的比賽。既然我在上網,我就不只是想看線性視頻和傾聽各種評論;在視頻直播中,我也想做一些疊加的數據分析。正如你所想的那樣,IBM并沒有讓我失望。
首先,我可以點擊比賽數據按鈕,看看實時更新的統計數據,如***發球的百分比、發球雙誤和自然失誤的數量,并且我可以看到這些計算的數字關于整個匹配或特定的設置。 在屏幕的左上角,有一個按鈕標記著“進入比賽的按鍵。”如果我點擊它,一些非常有趣的數據就會出現。在去年的公開賽中***上演的專題節目,在確定給定匹配成功時,可以確定三個最重要的因素,這是為每個特定的對手專門定制的。在該網站的SlamTracker專題節目上,你可以看到同樣的數據(而不是作為在視頻直播上的一個疊加),可用于分數和統計:

這些措施還包括目標和狀態的數量。實際上,它們是關鍵性能指標(KPIs),回到競技體育上,比賽顯示的關鍵是一個計分卡,使得這個術語能夠完整循環的使用。但不是直接在線分析處理(OLAP),這些關鍵性能指標是源于在過去7年的所有四大滿貫賽事中、總計3900萬數據點的數據的執行預測分析。
通過對受人喜愛的科伯在大部分比賽中的分析,得出她是最終的獲勝者。盡管科伯比維納斯有更高的排名,但是比賽的結果的確是有某種程度的不安,這也是IBM準確的預測分析。
這是真正有價值的數據,而且IBM與娛樂體育節目電視網(ESPN)合作并將數據提供給后者實況轉播的評論家來保持對話的進行。但是很清楚的事情是,在這個網絡時代和交互式分析中,你不再需要依賴評論員來得到它。相反,你只需要一個瀏覽器和一只鼠標,或者一個iPad和你的手指,來成為你自己的大滿貫數據分析員。 #p#
藏在幕后的是什么?
很自然地,讀者會很想知道IBM產品的后端是什么以及其技術在美國公開賽中的使用。以下是我所知道的:
SlamTracker技術(包括比賽數據和比賽的關鍵)大量使用IBM在2009年收購的SPSS技術。
IBM有著強大的關系數據庫,數據庫對得分數據和操作使用得非常頻繁。
WebSphere MQ(fka MQ系列),IBM基于消息的基礎性中間件是用來進行得分交付的,讓你能夠更快速的獲得在線分數。
WebSphere的技術用于整體服務體系結構。
最令我感興趣的是關于上面列表中的所有技術使用如何能超過10年(它們中的一些也更多)。核心統計、關系、SOA和中間件技術還沒有在數據和分析的這個階段變得不重要。另外,特別值得注意的是,Hadoop、Netezza和Cognos業務智能技術還沒有做出削減。Hadoop、數據倉庫和商業智能(BI)當然是重要的;但是IBM應用程序的傳統企業技術表明,大數據和BI特定技術對于好的分析實現來說,并不一定是先決條件。