成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

eBay構建三層數據業務平臺應對大數據

數據庫
美國電商網站eBay每天要處理100PB的數據,其中包括50TB的機器數據,這對于eBay來說是個不小的挑戰。

 [[113840]]

在日前在倫敦舉行的GartnerCRM高峰論壇上,eBay全球業務分析負責人DavidStephenson做了演講,他表示,我們做網站的目的很簡單,就是要讓交易成功。

作為交易市場,eBay的首要任務就是讓銷售者和消費者都能獲得滿意的體驗。

應對大數據,從提出正確的問題開始

eBay借助分析軟件更好地理解客戶。Stephenson希望能夠將小商鋪的個性化推薦成功運用到面向全球的eBay網站上。他表示:“在小商店,理解客戶很重要。店主需要提供個性化的推薦、了解客戶偏好、從客戶身上不斷學習。”

網絡測量數據對Stephenson來說還是陌生的新數據類型。eBay會生成大量的網站分析數據,Stephenson稱之為“客戶的足跡”。它可以鮮明地告訴工作人員誰來過他們的網站,都做了些什么。

Stephenson表示:“網站上能夠提供和實體店購物同樣的體驗,客戶可以比較不同的商品。我們也能夠了解到客戶的意圖。”這些都在慢慢改變著eBay。

eBay的網站分析無所不至,就像是在每個顧客前面安裝了攝像頭一般。細致的網站分析也給數據管理帶來困難。整個網站平均每月產生1億小時的錄像,客戶數據多的難以想象。Stephenson坦言:“誰也沒有辦法每月處理1億小時的數據。”

“我們只能盡量理解客戶,應用數據科學技術利用更多的數據和更新類型的數據。”

eBay面臨的是1億的用戶,3萬多種商品,每秒鐘幾千美元的交易。Stephenson表示,交易數據還只是所有數據的“冰山一角”。

eBay開始處理所有的客戶行為數據。

大數據給eBay帶來的挑戰首先是,要提出正確的問題。Stephenson表示,要回答一個簡單的問題,比如“昨天搜索某一關鍵字時,置頂顯示的商品是什么?”,系統要處理50億的瀏覽頁面。因此,最重要的問題是要問關鍵的業務問題。

三個平臺實現全面的用戶行為分析

除了提出問題,Stephenson還希望網站能夠運行情感分析、網絡分析和圖片分析,這些都難以在傳統交易性數據庫中實現。

eBay把它的數據分析業務分發到三個平臺,第一個是Teradata提供的傳統企業數據倉庫(EDW)。Stephenson表示:“核心交易系統必須具有極高的穩定性。我們每天要處理50TB的數據,系統絕對不能停機。”

2002年,eBay搭建了13TB的Teradata企業數據倉庫,提供高效的大規模并行關系型數據庫。截止到目前,系統構建在上千個節點上,數據量已經增長到14PB。

說到用戶行為數據,過去,eBay只能保留1%的樣本,其他全部扔掉。

Stephenson介紹到:“對于提出的很多問題,我們事先并不知道,我們是根據客戶的行為數據決定問什么問題的。大概有85%的問題是新問題。如果你只關注結構不關心數據,你就無法問出新問題,但如果你要存儲所有的數據,數據量會大的根本無法分析。”

這其實是企業面臨的一個困境,究竟應該扔掉一部分數據,還是把所有數據都保存。

為了解決這個問題,eBay開始搭建它的第二個平臺。七年前,公司開始搭建能夠存儲所有客戶數據的平臺。Stephenson表示:”對于客戶行為數據,我們希望能夠通過大數據方法將其保留。“

eBay需要一個能夠管理幾百PB各種類型數據、只需要5個人就能維護、并且分析師可以輕松訪問的產品。

公司和Teradata合作,開發出一款有幾百個用戶定義功能的客戶應用。該系統運行在商業硬件上,應用自有軟件,能夠處理所有客戶數據,廉價存儲數據。

這就是著名的eBay開發的客戶數據倉庫Singularity。

該系統可以在32秒內運行臨時查詢。Stephenson表示,那是Hadoop處理類似的查詢要30秒。

Stephenson表示Singularity在網站的“A/B測試”中發揮了重要作用,這可以比較出不同的產品組合中,哪種組合最受歡迎。eBay用它測試了很多東西,比如測試網站消費者是否喜歡網站顯示商品大圖。

這項技術還可以用于搜索提示,Stephenson稱之為“搜索欄里的經濟學家”。eBay可以根據用戶已選擇的話題或者已提出的問題,提供搜索查詢建議。因為整個系統中,基本每一個問題都被問過了。

通過這樣的查詢,eBay銷售者就可以了解到是否需要降價、包郵或提供其他優惠。

除了企業數據倉庫和Singularity,eBay還使用了Hadoop,這就是它的第三個平臺。eBay部署了兩個2萬節點的Hadoop集群,能處理80PB的數據。

有了這三個平臺,eBay終于可以實現對所有用戶行為數據的存儲與分析。

責任編輯:彭凡 來源: 36大數據
相關推薦

2010-01-14 16:20:54

VB.NET三層數據結

2021-12-01 10:18:54

數據匹配大數據數據分析

2016-08-03 13:17:36

IBM

2022-05-09 09:00:00

Splunk數據分析工具

2017-03-23 12:51:56

互聯網

2011-10-20 12:52:54

IBM

2014-08-01 10:29:17

大數據業務模型

2014-04-08 10:17:10

大數據華為

2023-11-09 16:12:06

大數據大數據堆棧

2018-10-31 14:32:53

數據中心網絡架構

2018-02-08 11:10:08

云計算大數據安全

2012-11-07 10:56:06

大數據

2012-12-20 09:38:38

2017-11-29 10:34:38

2021-03-29 10:58:47

大數據智慧城市大數據應用

2010-01-11 09:25:01

千兆路由交換機技術

2018-12-24 09:54:38

2011-08-17 11:24:41

數據業務網絡干擾

2011-04-19 13:53:41

三層架構

2014-12-16 19:05:51

Informatica大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99精品国产一区二区三区 | 国产午夜视频 | 欧美精品一二区 | 日日射夜夜骑 | 亚洲精品一区二区三区中文字幕 | av免费网站在线 | 无码一区二区三区视频 | 青青草视频网 | 色播久久 | 精品久久久一区二区 | 国产精品欧美一区二区 | 亚洲性在线| 精品亚洲视频在线 | 成人免费观看男女羞羞视频 | 中文字幕欧美一区二区 | 成人中文网 | 国产成人一区二区 | 91在线看| 男人天堂99 | 日本电影免费完整观看 | 黄色大片毛片 | 欧美成人免费在线视频 | 九九九视频精品 | 日韩中文久久 | 国产一区三区视频 | 亚洲精品一区二区三区蜜桃久 | 波多野结衣一区二区三区 | 午夜影晥| 日韩欧美天堂 | 国产一区二区在线播放 | 一区二区三区精品 | 综合久久久 | 特一级毛片 | 欧产日产国产精品视频 | 久久精品免费 | 日韩欧美亚洲一区 | 亚洲精品福利在线 | 国产精品久久久久久久久久三级 | 视频一区二区中文字幕 | 日韩中文电影 | 一区二区在线免费观看 |