eBay利用大數據促進在線交易
eBay網站有 1.8 億個活躍用戶。在任何一個給定的時刻,都會有 3.5 億左右的商品被銷售。eBay 的拍賣搜索引擎上,每天會產生 2.5 億次搜索。Hugh Williams 說,公司在 Hadoop 集群和 Teradata 服務器上擁有的原始數據是 10 PB。通過對這些數據的利用,公司可以提高在線的交易量,引導用戶購買更多商品。
Hugh Williams主要談到了搜索引擎的優化。通過對數據的分析,公司可以把握用戶的行為模式,從而優化搜索結果。“如果將時間倒退幾年,你使用 eBay 的搜索引擎時,會發現它只理解字面意思”,Williams說,“你可以在搜索引擎輸入文字,它將按照字面含義尋找,但是并不能真正理解你想法的深層含義”。
現在,eBay要使搜索引擎更加“直覺化”。例入,eBay 發現,那些想要購買 Pilzlampe 的用戶,如果他們輸入了“Pilz lampe“的話,更有可能購買商品,因為搜索引擎會給出更多結果,因此,搜索引擎通過在單詞中增加一個空格,就可以增加在線交易量。
eBay會根據自己掌握的信息,改變或重寫用戶的搜索請求,增加同義詞或者替換語句,從而給出更具相關性的結果。另外,eBay還通過大數據來預測商品是否銷售出去,銷量會是多少,然后調整商品在搜索引擎上的排名。
Williams說,增加因素來改變搜索結果是有風險的。公司通常需要幾個月來增加一項因素,而且他們不知道是否真的對用戶有用。為此,eBay會在一小部分用戶那里進行測試,然后觀察他們的反應。
改善搜索引擎的過程中,對用戶搜索請求的情景判斷是一個挑戰。比如用戶在搜索“吉朗貓球隊(Geelong Cats)”的時候,搜索引擎可能會把“貓”做為關鍵詞,然后搜索寵物這一類別,這對于用戶來說是無用信息。“在我們這樣的大規模下,會發生很多微小的問題,因此需要數據專家之類的人員來調查這些事情。”Williams 說。
【編輯推薦】