成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數(shù)據(jù)的兩點(diǎn)常見誤解

大數(shù)據(jù)
一談到大數(shù)據(jù),大家都是贊揚(yáng)聲一片。高效、能預(yù)測未來走勢。但任何技術(shù)都有其局限性,今天我們就來談兩點(diǎn)常見誤解。

 

我時(shí)常聽創(chuàng)業(yè)者說自己的公司每天會(huì)生產(chǎn)/記錄很多的數(shù)據(jù),雖然他們暫時(shí)還沒想明白怎么用這些數(shù)據(jù),但把這些數(shù)據(jù)都先存起來了。他們經(jīng)常還說,通過這些數(shù)據(jù)他們的產(chǎn)品/服務(wù)將得到很大的提升,仿佛這些數(shù)據(jù)就是公司的救世主一樣。我不想討論這種觀點(diǎn)正確與否,但想在這里解釋兩個(gè)關(guān)于大數(shù)據(jù)的常見誤解:

一、數(shù)據(jù)不等于信息

經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來用。其實(shí)不然,數(shù)據(jù)指的是一個(gè)原始的數(shù)據(jù)點(diǎn)(無論是通過數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更能不能代表信息就會(huì)成比例增多。我們來看兩個(gè)簡單的例子:

備份。很多人如今已經(jīng)會(huì)定期的對(duì)自己的硬盤進(jìn)行備份。這個(gè)沒什么好多解釋的,每次備份都會(huì)創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。

多個(gè)社交網(wǎng)站上的信息。我們當(dāng)中的很多人在多個(gè)社交網(wǎng)站上活躍,隨著我們上的社交網(wǎng)站越多,我們獲得的數(shù)據(jù)就會(huì)成比例的增多,我們獲得的信息雖然也會(huì)增多,但卻不會(huì)成比例的增多。不單單因?yàn)槲覀儠?huì)互相轉(zhuǎn)發(fā)好友的微博(或者其他社交網(wǎng)站上的內(nèi)容),更因?yàn)楹芏鄡?nèi)容會(huì)十分類似,有些微博雖然具體文字不同,但表達(dá)的內(nèi)容十分相似。

二、信息不等于智慧(Insight)

好吧,現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對(duì)我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足一下三個(gè)標(biāo)準(zhǔn):

可破譯性。這可能是個(gè)大數(shù)據(jù)時(shí)代特有的問題,越來越多的企業(yè)每天都會(huì)生產(chǎn)出大量的數(shù)據(jù),卻還沒想好怎么用,因此,他們就將這些數(shù)據(jù)暫時(shí)非結(jié)構(gòu)化(unstructured)的存儲(chǔ)起來。這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯。比如說,你記錄了某客戶在你網(wǎng)站上三次翻頁的時(shí)間間隔:3秒,2秒,17秒,卻忘記標(biāo)注這三個(gè)時(shí)間到底代表了什么,這些數(shù)據(jù)是信息(非重復(fù)性),卻不可破譯,因此不可能成為智慧。

關(guān)聯(lián)性。我們?cè)?jīng)對(duì)關(guān)聯(lián)性的重要性進(jìn)行過解釋。這里不再贅述了,無關(guān)的信息,至多只是噪音。

新穎性。這個(gè)和我前文舉的那個(gè)社交網(wǎng)站的例子類似,不同的是,這里的新穎性很多時(shí)候無法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進(jìn)行判斷。舉個(gè)例子,某電子商務(wù)公司通過一組數(shù)據(jù)/信息,分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10塊錢,然后又通過另一組完全獨(dú)立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時(shí)候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。

說了這么多,是想表達(dá),其實(shí)我們手上有用的數(shù)據(jù)并沒有我們想象的那么多——大數(shù)據(jù)本身就是個(gè)耍噱頭的詞。在如今這個(gè)年代,一個(gè)普通的創(chuàng)業(yè)公司每天就能生產(chǎn)1GB以上的數(shù)據(jù),稍微大一點(diǎn)的公司每天生產(chǎn)的數(shù)據(jù)都以TB來技術(shù)。但在花錢進(jìn)行大數(shù)據(jù)分析之前,我們要意識(shí)到,數(shù)據(jù)不代表信息,更不代表智慧。

原文鏈接:http://www.pingwest.com/common-misunderstanding-about-big-data/

【編輯推薦】

責(zé)任編輯:彭凡 來源: PingWest
相關(guān)推薦

2016-11-01 09:23:24

大數(shù)據(jù)風(fēng)控互聯(lián)網(wǎng)

2017-09-20 08:34:37

大數(shù)據(jù)技術(shù)開發(fā)者UI

2009-07-16 09:25:27

Java常量定義

2011-04-29 08:46:58

C#代碼規(guī)范

2013-05-06 10:22:28

大數(shù)據(jù)Hadoop

2019-07-10 09:21:36

大數(shù)據(jù)數(shù)據(jù)庫Hadoop

2018-08-28 06:21:19

網(wǎng)線布線線纜

2009-02-01 09:06:15

.NET多線程.NET線程管理

2015-08-03 10:25:58

C語言特性不為人知

2024-11-04 15:49:02

2021-08-26 14:55:55

開發(fā)React代碼

2022-09-01 23:34:18

大數(shù)據(jù)數(shù)據(jù)分析工具

2013-10-28 15:03:05

大數(shù)據(jù)大數(shù)據(jù)系統(tǒng)

2022-04-10 23:07:21

瀏覽器FirefoxLinux

2010-05-13 11:12:59

統(tǒng)一通信平臺(tái)

2010-02-02 09:54:05

軟交換技術(shù)

2012-08-23 11:18:15

2013-10-29 09:49:45

大數(shù)據(jù)誤解

2010-08-11 10:41:22

AdobeFlex

2015-01-09 11:43:01

云加密云數(shù)據(jù)安全公有云
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 综合色站导航 | 国产日韩精品视频 | 精品九九| 国产一区二区三区免费观看视频 | 欧美成人久久 | 欧美日韩国产一区二区三区 | 人人九九精 | 草草视频在线观看 | 国产精品99 | 精品久久久久一区二区国产 | 欧美视频在线看 | 一区二区在线免费观看 | 91麻豆精品国产91久久久更新资源速度超快 | 中文字幕 在线观看 | 欧美国产视频一区二区 | 伊人免费网 | 日韩成人在线播放 | 欧美精品啪啪 | 精品国产综合 | 国产高清免费视频 | 久久久国产一区二区三区四区小说 | h视频在线观看免费 | 成人中文网 | 欧美精品一区二区在线观看 | 欧美a√| 视频国产一区 | 亚洲精品视频观看 | 中文字幕一区二区三区四区 | 欧美久久久久久久久 | 国产日韩欧美 | 日本a视频 | 中文字幕一区二区三区乱码图片 | 精品欧美色视频网站在线观看 | 成人av免费在线观看 | 久亚州在线播放 | 一区二区精品在线 | 亚洲精品一区二区在线观看 | 蜜臀网| 亚洲最大的黄色网址 | 五月免费视频 | 亚洲视频在线观看一区二区三区 |