成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

BBC:大數據帶來的弊病?近因效應

大數據
現今如此多大數據被收集與分析所帶來的問題。當你想尋求更長遠的視角而開始回顧過去時,你會發現現在的東西太多而過去的東西又太少。目光短淺深深地植入在高估以歷史為代價的短期趨勢的強大的結構傾向中。

世界上90%的數據都是過去幾年里產生的,你可能已經熟知這個統計了。這是真的。我能找到的關于這個表述的最早的陳述之一可以追溯到2013年五月,但這個趨勢一直顯著地持續著。確實,過去三個世紀以來每兩年世界上數據的總量便會提高到十倍——這個比率甚至使得發現處理器性能加倍的摩爾定律都相形見絀。

這樣一個信息增長比率所帶來的問題之一是現在這個時刻的數據總是比才過去不久的要出現得大得多。想想一下回顧一本描繪你人生前八年的一本相冊,從出生到成年。假設你有你人生頭兩年的兩張照片。假定在匹配現在這樣一個信息增長比率下,你將會擁有印象深刻的2000張六歲到八歲的照片;20萬張十歲到十二歲的;以及驚人的兩億張十六歲到十八歲的照片。也就是說在***兩年里每一秒種便會有不只三張照片產生。

“當你想尋求更長遠的視角而開始回顧過去時,你會發現現在的東西太多而過去的東西又太少。”

當然,這并不是全球數據的一個***的類比。一開始,世界上許多數據的增長都是因為更多的人參與創造出了更多的信息資源以及更龐大更細致的格式。但是關于均衡性的觀點是有根據的。如果你打算回顧像上面一樣的記錄的話或者嘗試著分析它,你將發覺離現在越近的東西越會變得毫無意義。記錄這么多次有用的信息卻更少,為什么會這樣呢?

這就是現今如此多大數據被收集與分析所帶來的問題。當你想尋求更長遠的視角而開始回顧過去時,你會發現現在的東西太多而過去的東西又太少。目光短淺深深地植入在高估以歷史為代價的短期趨勢的強大的結構傾向中。

[[186834]]

大數據所帶來的問題之一是現在這個時刻的數據總是比才過去不久的要出現得大得多。(來源:iStock)

為了理解這個的重要性,思考一下社會科學關于近因效應的發現,它描述了人們假設未來的事件將類似于最近的經歷的傾向。這也是我們熟知的“可具有性”啟發式的另一種說法:依據任何最容易想到的東西進行思考的傾向。這也是一種普遍的心理屬性。如果在過去的幾年里在你住的地方你已經見證了異常寒冷的夏天,比如,你可能被引導著說出夏天越來越冷了——或者你們當地的氣候可能在變冷。實際上你不應該把你讀到的任何東西讀入數據。你需要運用更長遠的眼光去了解關于氣候變化趨勢的有意義的東西。在短期內,你***不要隨意推測——但我們中有誰能夠真的做到呢?

“短期的分析不只是無效的——它們經常是無用的甚至誤導人的”

現實生活中多數復雜現象經常也是這樣的:如股票市場、經濟、公司興衰、戰陣與和平、人際關系以及王朝更迭。短期的分析不單單是無效的——它們經常是無用甚至誤導人的。瞧瞧眾多經濟學家排著隊宣布像2009年金融危機這樣的事件是不可能發生的,直到它真的發生了。在那種程度上可以做到有效預測的那種概念本身就是問題的一部分。

值得一提的是在決定數據去留時新奇經常是主要的考慮因素。推陳出新:在這個數字趨勢的世界上,搜索算法本質上偏向于新鮮事物,所謂的超鏈停用從***法院決定到整個社會媒體服務業等各方面十分猖獗。對于當下的偏向從結構上在我們周邊的所有科技中已經根深蒂固,尤其要歸因于我們大約五年后丟棄我們大多數一度繁榮的機器的喜好。

該怎么做?這不只是一個更擅長保存舊數據的問題——盡管這不能說是個壞主意,考慮到我們對現在于過去的幾十年而不是過去幾年的保存多無能為力。更重要的是,決定哪些數據是在***時間值得保存的——并且以知識的名義有意義地剔除信息意味著什么。

我們需要更擅長于決定哪些數據值得在***時間保存的。(來源:iStock)

我們需要更擅長于決定哪些數據值得在***時間保存的。(來源:iStock)

我們需要的是一種我喜歡稱為“選擇性遺忘”的能力:訓練我們的工具更擅長于放下剛剛過去的東西以保持眼光上的連續性。這是一種類似治療的方式助我們合理安排相冊——盡管需要更多的數學。什么情況下兩百萬張照片不如兩千張有價值呢?當樣本比較多涉及領域卻比較少的時候;當可以提出的問題不那么重要的時候;當提供的細節的級別只是逐步灌輸懷疑和只有盲目的自信的時候。

有許多的數據集是不能復原的,當完成的時候價值是極大的:基因序列;人口數據;地理和物理學的困難知識。然而,若科學越不嚴謹,規模就越可能與質量成反比—更重要的是時間本身就是一個過濾器。我們要么仔細選擇忍受什么,有哪些是重要的,還有要帶著有意義的心態去捕捉我們后退的過去,要么它的印記被現在不斷增加的噪音所替代。

時間的削弱是有多方面的,因為在它仍然是一個限制因素里面有一個至關重要的意義:人的時間和注意力的可用性。企業,個人和政府都有相當多的信息,與他們幾年前相比。然而,在白天的日子里他們沒有任何可用的關注,董事會成員,***執行官,民選官員或者幾個小時的時間。越來越好的工具的存在幫助決策者對他們所擁有的信息提出有意義的問題-制造者對他們擁有的信息提出有意義的問題-但你只能分析可企及的問題。單純地積累不是一種答案。在一個越來越大的數據時代,你選擇不知道的事情和你所做的一樣重要。

責任編輯:武曉燕 來源: 36大數據
相關推薦

2018-09-06 15:05:12

2012-02-29 08:48:43

大數據非結構化數據

2013-05-27 13:42:33

數據存儲大數據昆騰存儲

2013-10-25 11:18:26

BBC大數據

2016-09-13 09:10:35

大數據

2014-04-30 13:46:06

IoTIT架構個域網

2013-10-31 11:46:37

2015-10-09 10:15:41

大數據公司

2016-12-23 21:15:03

大數據思維模式變化

2021-06-09 14:37:10

大數據互聯網大數據應用

2012-11-09 11:24:51

移動云計算數據平臺

2015-08-19 13:10:35

大數據網絡運營

2013-08-01 10:07:45

Splunk

2012-06-11 17:14:45

2013-05-07 10:11:28

2020-02-04 11:06:42

大數據技術存儲

2015-09-07 10:53:48

2015-12-11 22:40:10

大數據OpenPOWERPOWER8

2014-07-01 17:21:59

大數據亞馬遜CTO

2020-12-23 14:20:16

人工智能大數據數字化轉型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜精品久久久久99蜜 | 毛片com | 成人亚洲视频 | 少妇一级淫片aaaaaaaaa | 色播av | 一区在线观看 | 亚洲一区视频在线 | 国产精品99久久久久久动医院 | 一区二区成人 | 国产精品中文字幕一区二区三区 | 91精品国产一区二区在线观看 | 不卡在线视频 | 精品一区二区视频 | 欧美日韩手机在线观看 | 欧美另类视频 | 亚洲精品成人 | 亚洲成人一二三 | 久草新在线 | 国产精品国产精品国产专区不蜜 | 99精品久久久 | 日本三级播放 | 日韩精品久久久久 | 精品成人佐山爱一区二区 | 噜噜噜噜狠狠狠7777视频 | 中文在线观看视频 | 亚洲国产精品精华素 | aaa级片 | 中文在线a在线 | av网站在线播放 | 国产精品美女久久久久aⅴ国产馆 | 国产精品一区久久久 | 国产成人精品高清久久 | 日韩欧美网| 九九热这里 | 国产精品入口久久 | 免费激情 | 成年女人免费v片 | 碰碰视频| 欧美精品一区二区三区蜜臀 | 毛片日韩 | 91精品国产高清一区二区三区 |