成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

專(zhuān)訪(fǎng)淘寶明風(fēng):如何構(gòu)建高性能的數(shù)據(jù)挖掘平臺(tái)?

原創(chuàng)
系統(tǒng) 系統(tǒng)運(yùn)維
淘寶是一家擁有海量數(shù)據(jù)的公司,對(duì)于數(shù)據(jù)挖掘來(lái)說(shuō),海量數(shù)據(jù)本身具有噪聲、異構(gòu)、算法復(fù)雜、技術(shù)復(fù)雜等問(wèn)題,如何構(gòu)建高性能的數(shù)據(jù)挖掘平臺(tái),對(duì)于淘寶而言非常重要。近年來(lái),淘寶在數(shù)據(jù)實(shí)時(shí)性和大規(guī)模計(jì)算及挖掘方面積累了很多實(shí)踐經(jīng)驗(yàn),本文中,淘寶技術(shù)專(zhuān)家明風(fēng)在51CTO記者采訪(fǎng)時(shí),也分享了很多經(jīng)驗(yàn)和方法。

【51CTO專(zhuān)稿】淘寶是一家擁有海量數(shù)據(jù)的公司,對(duì)于數(shù)據(jù)挖掘來(lái)說(shuō),海量數(shù)據(jù)本身具有噪聲、異構(gòu)、算法復(fù)雜、技術(shù)復(fù)雜等問(wèn)題,如何構(gòu)建高性能的數(shù)據(jù)挖掘平臺(tái),對(duì)于淘寶而言非常重要。近年來(lái),淘寶在數(shù)據(jù)實(shí)時(shí)性和大規(guī)模計(jì)算及挖掘方面積累了很多實(shí)踐經(jīng)驗(yàn),本文中,淘寶技術(shù)專(zhuān)家明風(fēng)在51CTO記者采訪(fǎng)時(shí),也分享了很多經(jīng)驗(yàn)和方法。

[[90809]]

(左:明風(fēng) 右:51CTO記者)

【嘉賓簡(jiǎn)介】黃明,淘寶技術(shù)專(zhuān)家,花名:明風(fēng)。2010年加入淘寶,一直從事Hadoop相關(guān)的的數(shù)據(jù)開(kāi)發(fā)和挖掘工作,見(jiàn)證和支持了基于云梯的數(shù)據(jù)開(kāi)發(fā)平臺(tái)的發(fā)展。現(xiàn)任淘寶技術(shù)部數(shù)據(jù)挖掘與計(jì)算團(tuán)隊(duì)的Leader,負(fù)責(zé)Spark計(jì)算平臺(tái)和淘寶數(shù)據(jù)推薦產(chǎn)品和業(yè)務(wù)。

淘寶的數(shù)據(jù)特點(diǎn)

對(duì)于淘寶的數(shù)據(jù)特點(diǎn),明風(fēng)認(rèn)為主要有以下幾個(gè)方面:

一、,淘寶每天的數(shù)據(jù)都是T級(jí)別的,怎樣對(duì)這些T級(jí)別的數(shù)據(jù)做很好的分析、采集、以及在做完數(shù)據(jù)清洗后,對(duì)于比較完整的行為數(shù)據(jù)進(jìn)行挖掘,這是個(gè)需要解決的難題。因?yàn)閿?shù)據(jù)量大的話(huà),很多傳統(tǒng)算法很難直接應(yīng)用,需要進(jìn)行并行化的改進(jìn)。并行化改進(jìn)之后,數(shù)據(jù)會(huì)慢下來(lái),如何在兩者之間達(dá)到一個(gè)平衡點(diǎn)是非常重要的。

二、復(fù)雜,淘寶上的主體是買(mǎi)家、賣(mài)家和店鋪,買(mǎi)家的行為是一個(gè)從收藏、搜索、購(gòu)買(mǎi)、評(píng)論等,這些行為并不是按照一定的時(shí)間順序去發(fā)生的,而是混合在一起。這些數(shù)據(jù)行為代表了消費(fèi)者的購(gòu)物模式,怎樣從混亂的行為中找到消費(fèi)者的購(gòu)物模式,是一個(gè)很復(fù)雜的過(guò)程。

三、有趣,淘寶的數(shù)據(jù)很豐富,從用戶(hù)的復(fù)雜行為可以看見(jiàn)買(mǎi)家很多活生生的特點(diǎn),以及中國(guó)消費(fèi)者的消費(fèi)行為的心里,我們做過(guò)最簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì)分析,能夠了解中國(guó)各省女生需要買(mǎi)什么,男生需要買(mǎi)什么,這些數(shù)據(jù)能很好的反應(yīng)出中國(guó)消費(fèi)的一個(gè)風(fēng)向標(biāo),所以說(shuō)淘寶的數(shù)據(jù)是非常有意思的。

構(gòu)建高性能的數(shù)據(jù)挖掘平臺(tái)

隨著數(shù)據(jù)挖掘業(yè)務(wù)的發(fā)展,基于傳統(tǒng)的Hadoop下的MapReduce,速度和靈活度,已經(jīng)不能滿(mǎn)足日益復(fù)雜的挖掘算法的需求,面臨多次迭代的機(jī)器學(xué)習(xí)算法,Mahout顯得力不從心。如何讓Hadoop這頭大象插上翅膀,飛馳起來(lái),將大數(shù)據(jù)的價(jià)值發(fā)揮到淋漓盡致?明風(fēng)談到:“基于Yarn模式的Spark,可以?xún)烧呒骖櫋?rdquo;這并不是說(shuō)淘寶要Follow業(yè)界最新的技術(shù),是因?yàn)樘詫氂袑?shí)際需求的。對(duì)于淘寶數(shù)據(jù)挖掘團(tuán)隊(duì)而言,一個(gè)高性能的計(jì)算框架對(duì)于在上層做數(shù)據(jù)挖掘與推薦是非常重要的,另外,在Spark上可以實(shí)現(xiàn)很多比較復(fù)雜的機(jī)器學(xué)習(xí)算法,用MLBase機(jī)器學(xué)習(xí)算法對(duì)消費(fèi)者的行為進(jìn)行最準(zhǔn)確的數(shù)據(jù)挖掘與分析,從而達(dá)到最好的推薦效果。

構(gòu)建過(guò)程中需要注意的問(wèn)題

無(wú)論是選擇Spark還是選擇其他框架,都有一些共性的東西。明風(fēng)認(rèn)為,“首先你需要明白搭建這個(gè)高性能系統(tǒng)的瓶頸在哪里,一個(gè)系統(tǒng)多快是取決于最慢的那一點(diǎn),所以一定要把最慢的那一點(diǎn)提升到你需要的性能點(diǎn),才能獲得高性能。這一點(diǎn)是特別值得注意的。Spark能夠在一個(gè)批量計(jì)算以及流式計(jì)算中,取得一個(gè)很好的平衡,把中間的一個(gè)點(diǎn)降到最低,這個(gè)是非常必要的。”

其次,明風(fēng)談到:“淘寶在做Spark過(guò)程中,由于很多東西都是很新的,所以要保持和社區(qū)良好的互動(dòng)交流,將我們的改動(dòng)反饋到社區(qū)里,形成一個(gè)良性循環(huán)。在淘寶,無(wú)論是Hadoop、HBase還是Spark,我們都是這樣的工作模式,才能讓我們的平臺(tái)出在最佳的狀態(tài)。”

以上便是構(gòu)建高性能數(shù)據(jù)挖掘平臺(tái)的重點(diǎn)內(nèi)容,更多精彩看點(diǎn),請(qǐng)您關(guān)注以下視頻獲悉:

[[90810]]

責(zé)任編輯:黃丹 來(lái)源: 51CTO.com
相關(guān)推薦

2011-10-21 14:20:59

高性能計(jì)算HPC虛擬化

2011-10-25 13:13:35

HPC高性能計(jì)算Platform

2012-12-11 22:41:20

淘寶部署雙11

2020-11-09 17:15:08

戴爾

2020-06-05 07:20:41

測(cè)試自動(dòng)化環(huán)境

2011-12-15 13:28:57

2023-08-11 08:34:40

開(kāi)發(fā)工具

2011-04-13 13:28:46

JavaScript程序員

2011-10-24 09:43:18

高性能計(jì)算HPC云計(jì)算

2022-12-09 08:40:56

高性能內(nèi)存隊(duì)列

2023-10-12 09:00:00

AerospikeRedpanda高性能

2018-06-19 16:58:36

UCloud彭晶鑫存儲(chǔ)

2014-08-25 09:03:44

HuluSpark On Y

2019-07-23 11:41:45

數(shù)據(jù)庫(kù)SQLDocker

2009-10-29 09:11:50

Juniper高性能網(wǎng)絡(luò)

2009-06-03 14:24:12

ibmdwWebSphere

2025-06-03 08:15:00

微服務(wù)架構(gòu)異步任務(wù)隊(duì)列

2022-06-02 12:56:25

容器網(wǎng)絡(luò)云原生

2019-06-12 15:20:25

Redis高性能線(xiàn)程

2024-12-02 14:28:17

JavaScriptWeb開(kāi)發(fā)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产一区不卡 | 91亚洲国产| 亚洲午夜精品久久久久久app | 97精品国产97久久久久久免费 | 黄色一级大片在线免费看产 | 亚洲欧美激情精品一区二区 | 亚洲网在线 | 久热免费在线 | 国产免费观看一区 | 国产精品一区久久久 | 成人福利网站 | 91免费看片 | 免费亚洲婷婷 | 欧美伊人久久久久久久久影院 | 午夜寂寞影院在线观看 | 青青草华人在线视频 | 国产精品久久久久久二区 | 日韩精品一区二区三区 | 成年无码av片在线 | 亚洲国产精品99久久久久久久久 | 午夜精品久久久久久久星辰影院 | 天堂一区二区三区四区 | 中文字幕国产精品 | 天堂网色 | 亚洲人成人一区二区在线观看 | 91精品国产综合久久小仙女图片 | av中文字幕在线观看 | 欧美一区成人 | 国产午夜影院 | 九九热精品视频 | www.av在线| 国产成人一区在线 | 一区二区三区视频在线观看 | 色婷婷国产精品综合在线观看 | 久在线视频播放免费视频 | 亚洲一区二区精品视频 | 欧美久久一区 | www狠狠爱com | 欧美久久久久久久 | 中日韩毛片 | 亚洲国产成人av好男人在线观看 |