成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(七)

大數(shù)據(jù)
今天的干貨,不是一般的干,噎死人那種干。沒下面這些準(zhǔn)備的話直接退出吧,回去度娘啊谷哥啊弄懂是什么東西再回來。

[[207619]]

今天的干貨,不是一般的干,噎死人那種干。沒下面這些準(zhǔn)備的話直接退出吧,回去度娘啊谷哥啊弄懂是什么東西再回來。

知識儲備必須有這些:

BitMap知識。概率論二項分布。泰勒展開。函數(shù)求極限。求期望值。求方差、標(biāo)準(zhǔn)差。log對數(shù)變換。極大似然估計。

照例甩一波鏈接。

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(一)

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(二)

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(三)

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(四)

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(五)

大數(shù)據(jù)計數(shù)原理1+0=1這你都不會算(六)

來了喔。

真的來了喔。

我們先定義幾個代數(shù)。

整個BitMap 有m個坑,還要有u個坑還沒被占。我們已經(jīng)假設(shè)了值經(jīng)過 Hash 后近似服從獨立均勻分布。

對事件進行定義:

A = “經(jīng)過n個元素進行Hash后,第j個桶值為0”

則A出現(xiàn)的概率如上。意思就是坑為1的概率都是1/m,那么坑為0的概率為 (1 - 1/m),如此重復(fù)n次 ,就得到上面的式子了。

又因為每個桶都是獨立的,所以整個BitMap的期望值為A的概率直接乘以m。

做一個小小的trick(小把戲)變換,也就是強行把內(nèi)部滿足某個求極限的式子。喏,這個。

當(dāng)m和n都趨向于無窮大的時候,求一下極限,就得到了這個

這個是有u個坑的估計,而我們想知道的是基數(shù)n,做一下log變換。

根據(jù)極大似然估計的判定定理。

既然是可逆的,那么這樣我們就得到了下面這個估計了。 

好了,剛剛我們已經(jīng)得到期望,現(xiàn)在我們求一下方差和比率t的方差和期望,后面有用,至于怎么求的,自行找一下怎么求。

我們定義一下函數(shù)f。

然后對進行泰勒展開,得到下面這串玩意。

取前三項。原論文里說,因為第二項展開的期望為0,所以保留前三項,求期望得到

代入前面求到的期望值,化簡可以得到。

所以直接除于n,可以得到偏差比率為:


至此,偏差比率的推導(dǎo)就完成啦,能看到這里的都是大神,說實話。

那標(biāo)準(zhǔn)差又是怎么樣的呢?

還是它,泰勒展開。

這里啟發(fā)性地取前兩項。

一步一步推導(dǎo)下來,再配合前面求的方差,嗯相信你可以的。

所以標(biāo)準(zhǔn)差就是這樣。

至此,原理,偏差率,標(biāo)準(zhǔn)差都推導(dǎo)完畢,但是還有一點點問題。就是,這樣去算有什么條件呢,對于m的取值?啟發(fā)性地取泰勒展開前三項和前兩項又分別代表什么?這個大家自己去論文看,我要是開心,我可能也會說說看。

是不是很干貨?我也知道很干,但是真的要細(xì)細(xì)閱讀,讀完***搭配上原始論文好好看一下,我看了蠻久的說實話。

好了睡覺了。要是覺得很干就點個贊吧,讓我知道還有人在看。

【本文為51CTO專欄作者“大蕉”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號“一名叫大蕉的程序員”獲取授權(quán)】

戳這里,看該作者更多好文

責(zé)任編輯:武曉燕 來源: 51CTO專欄
相關(guān)推薦

2017-09-12 14:58:27

大數(shù)據(jù)計數(shù)原理

2017-09-19 15:09:50

大數(shù)據(jù)計數(shù)原理

2017-09-30 08:05:41

大數(shù)據(jù)計數(shù)原理

2017-09-26 15:51:29

大數(shù)據(jù)計數(shù)原理

2017-10-27 15:23:56

大數(shù)據(jù)計數(shù)原理

2017-10-13 16:32:49

大數(shù)據(jù)計數(shù)原理

2017-09-15 17:49:25

大數(shù)據(jù)計數(shù)原理

2022-03-27 22:07:35

元宇宙虛擬人IBM

2015-03-16 11:33:16

程序員代碼bug

2021-07-07 06:54:37

網(wǎng)頁Selenium瀏覽器

2017-02-08 19:49:03

內(nèi)存SSDDRAM

2023-05-16 07:15:11

架構(gòu)模型對象

2019-12-26 09:56:34

Java多線程內(nèi)部鎖

2021-04-20 09:55:37

Linux 開源操作系統(tǒng)

2020-09-27 06:50:56

Java互聯(lián)網(wǎng)注解

2014-12-11 10:01:09

程序員

2010-10-26 11:05:27

霍金

2016-09-13 22:46:41

大數(shù)據(jù)

2019-07-09 13:19:02

微軟瀏覽器Windows

2019-12-17 15:10:21

Python字符串代碼
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日本精品视频 | 精品三级在线观看 | 久久久久久国产精品久久 | 亚洲www | 精品一区二区三区四区五区 | 国产精品久久久久久久久免费樱桃 | 欧美国产日韩一区 | 日日做夜夜爽毛片麻豆 | 日韩一区二区三区在线播放 | 欧美另类视频在线 | 国产精品免费一区二区 | 亚洲精品一区二三区不卡 | 国产精品久久久久无码av | 久久精品亚洲 | 免费观看一级视频 | 国产美女在线看 | 日韩国产欧美视频 | 成人在线免费电影 | 成人妇女免费播放久久久 | 国产一区二区三区不卡av | 日韩久久久久 | 欧美精品久久久 | 中文字幕av亚洲精品一部二部 | 中文一区二区 | 欧美一区二区在线 | 亚洲毛片 | 91一区 | 中文字幕福利视频 | 伊人久久精品 | 在线免费观看黄网 | 97色在线观看免费视频 | 在线天堂免费中文字幕视频 | 精品国产一区二区三区久久狼黑人 | 99re6在线视频精品免费 | 国产一区不卡 | 国产精品成人一区二区三区夜夜夜 | 亚洲欧美中文日韩在线v日本 | 亚洲精品在线视频 | 亚洲视频免费一区 | 国产精品v | 在线四虎 |