成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數據熱的冷思考:無法取代傳統的新聞傳播科研方法

大數據
在網絡傳播技術高速發展的今天,“大數據”一詞甚囂塵上,在各行各業中都被熱切地討論。傳媒學界和業界對大數據具有各種美好的期待,

古希臘哲學家畢達哥拉斯曾經提出“數是萬物的本源”的思想,認為世界萬物歸根結底都是由某種數量關系決定的。在歷史上,人類量化世界的野心和嘗試從未停止,而科技的進步則不斷為這一目標提供越來越快捷的技術條件。2012年,技術詞匯“大數據”進入人們的視野,不同于傳統意義上“數據=數字”的是,在互聯網、物聯網高速發展的今天,網購經歷、視頻節目、微信語音都是數據。大數據技術量化一切的優勢,使其在幾年內成為每一個行業不可或缺的生產力,擁抱大數據時代到來的言論甚囂塵上。大數據時代,也意味著信息大爆炸時代的到來,是信息大傳播的時代。在傳媒業,與其他傳播技術相似,大數據的出現促進了整個行業的發展與變革。新聞從業人員通過數據采集與挖掘獲得了大量新聞素材,這不僅是人類認知世界的新角度與新方式,而且變革了新聞生產的全流程,“數據新聞”被視為新聞業未來發展的一大趨勢。智能化時代,能在分秒間生成新聞產品的“機器人記者”誕生了,受到了廣泛關注。同時,基于大數據的個性化推薦服務,不僅實現了新聞信息的精確定位,節省了用戶搜索信息的時間,而且也重構了整個廣告業格局,數據成為廣告營銷業實現精確定位消費者的重要依據。

然而,值得令人反思的是,在傳媒業廣為追捧大數據的今天,相關的管理規范、制度、法律卻相對滯后,甚至缺失,由此帶來了許多新的問題。從數據分析角度來看,理論上講,大數據應當是有別于抽樣調查得到的小數據,是全樣本數據。然而,事實上大數據的采集與分析過程都難以窮盡所有數據。而且這些收集到的數據還存在著混亂、真假難辨、可利用度低等新問題,需要傳媒業重新審視它們的價值。同時,通過數據追蹤和收集,隱私問題成為大數據時代面臨的最大問題和挑戰。盡管以Cookie技術為基礎的匿名化信息可能給用戶的生活帶來許多便利,如亞馬遜網站根據用戶個人喜好推薦相關書籍。但是多個實例證明,他人借助這些匿名數據同樣可以追蹤到用戶本人,只要用戶連網,便無真正隱私可言。新技術的誕生與發展也帶來了許多令人擔憂的社會影響,甚至可能威脅人類的安全與發展。大數據不是完美的,大數據是一把雙刃劍。在促進行業快速發展的同時,也存在著種種隱患,亟待解決的問題非常多。因此,對傳媒業大數據熱進行審慎、理性的反思非常必要。

一、大數據無法取代傳統的新聞傳播科研方法

從簡單的算數、度量,到如今的各種移動終端,數據向來是人類感知、認識以及表達世界的一種重要方式。在小數據時代,由于技術手段有限,人們只能采用抽樣的調查方法對事物進行分析,并將局部的研究結果延伸至總體。傳統的郵寄調查、電話調查、攔截面訪等新聞傳播學科的研究方法均是基于這個原理展開。然而每一種抽樣方法都存在一定不足,難以反映總體樣本的全貌,調查人員一般會增加抽樣的數量,以提高統計的精確度,但這也意味著調查成本的增加。大數據技術輕而易舉收集大量數據的能力,引發了人們對全樣本、全數據的想象。大數據的確具有不可替代的優勢,但就此認為一種新興的技術將完全取代人類數千年積累下來的科學發展成果,這無疑走進了大數據自大的怪圈。隨著大數據的不斷發展,越來越多的實例證明,全數據分析具有不可替代優勢的夢想在現實中并不容易實現,大數據只能對傳統的新聞傳播調研方法進行補充,卻無法取而代之。大數據對傳媒業的價值有待重新考量。

(一)全數據是“烏托邦”

在大數據浪潮勢不可擋的今天,互聯網應用推進了社會各個組織機構的信息化進程,物聯網技術的發展得以讓各種移動設備連接在一起,每一天都能輕易存儲下令人驚嘆的數據量,全球數據量平均每兩年翻一番。因此,區別于傳統的抽樣調查方法,有人提出全數據模式,它指的是借助大數據技術,獲取樣本量等于調查總體的數據總量,并進一步進行研究分析的方法。但在現實中,全數據的實現遇到了許多問題,具有一定的理想性。

在我國,“信息孤島”普遍存在。除了考慮安全因素以外,更多的是因為組織部門之間的利益驅使而導致的。目前,數據正在滲透各個行業,成為所有行業重要的戰略資產和核心競爭力。在“互聯網+”、“大數據+”概念的引導下,幾乎所有行業都意識到數據資產的重要性。市場先進入者占據了大量數據資源,由于生怕日后被后進入者趕超,各個市場主體彼此之間不愿進行共享,形成數據割據的局面,甚至在同一個組織內的不同部門也是如此。不同領域、行業、部門為了在“孤島”內更完整地捕捉用戶的信息,重復收集數據,既增加了數據采集的成本,又因為不同部門分析標準的不統一導致了分析結論的南轅北轍,造成數據過剩而分析結果卻不準確的問題。這個特征在科技公司領域尤為明顯,例如:三大科技巨頭公司BAT(百度、阿里、騰訊)之間經常發生互相屏蔽的事件:微信和淘寶之間進行相互屏蔽,用戶的興趣產品和購買記錄等數據便無法跨平臺進行共享。每個公司據此得出的用戶信息圖景都是不完整的,這與理想中的全數據模式有根本的背離。全數據應當具有數據量大且完整的優勢,而“信息孤島”帶來的后果卻是變相的大樣本抽樣調查,而且抽樣的樣本還不一定具有精確性和代表性,結果的準確性甚至不如傳統的市場調查方法。除了科技領域以外,隨著大數據應用逐漸滲透到非科技領域,其他傳統行業、部門也紛紛設立數據壁壘,進一步阻止了全數據模式的實現。例如:政府部門之間的數據不流通,造成了公共服務領域和政府監管市場中協商與決策的不便與困擾。所有的這些信息壁壘,及其帶來的相關數據分析問題,不僅成為本行業發展的阻礙,也同時使傳媒業喪失了大量潛在的新聞源。

大數據浪潮雖已呈不可逆轉之勢,但就目前看來,全數據模式的確是技術發展衍生的一個“烏托邦”,因此,不能盲目地相信大數據的分析結果,對這些結果采取審慎的態度非常必要。促進數據的開放也是不斷將“烏托邦”轉化為現實的一個重要途徑。開放性本是大數據時代的應有之義,也是全數據模式得以成立的重要前提。自2009年以來,美國奧巴馬政府接二連三地簽署、頒布了與開放數據相關的政策,這既提高了政府的執政效率,也為科技創新產業的發展添加源動力,數據的“二次利用”是一片更為廣闊的藍海。

(二)大數據處理過程中存在一定問題和風險

大數據意味著信息爆炸,數據繁雜、混亂,這既加大了數據處理與分析的難度,也增加了出現數據錯誤的可能性。在互聯網領域,無價值數據遠遠多于有價值數據,這就需要分析人員對相關數據進行一系列的處理,主要包括數據采集、存儲、清洗、分析、展現等若干步驟。由于其中許多環節都存在一定的問題和風險,因此數據分析的最終結果也受到了一定影響。

首先,數據采集環節存在多樣混亂、可靠性差、系統性低等問題。大數據時代是一個信息過載的時代,人們從多個渠道、多種方式獲取數據。在互聯網中,每一秒鐘產生的信息量都是令人咋舌的。每一天互聯網產生800EB的數據量,需要1.68億個DVD光盤才可容納(蔣均牧,2012)。數據來源多元化導致許多依據不同標準收集的數據混雜在一起,而數據量極大又造成人工排查的困難。同時數據的可靠性也難以保證,真假信息魚龍混雜,致使數據分析結果的不確定。虛擬空間的匿名性特點為謠言的傳播提供了條件,網絡空間中充斥著大量假消息,一些消息甚至是許多未經專業培訓的人都難以分辨的,以這種數據出發而獲得的分析結果也不具備真實性。互聯網中相當一部分的信息、評論是由“水軍”、“自動發帖機”等發出的,不僅真假難辨,這種數據也是無意義的。利益中的一方利用技術手段提升“好評度”,則難保另一方不會利用同樣的手段增加“差評度”,數據統計便成為一種既無意義且耗成本的行為。另外,目前網絡媒體充斥著大量非結構性及半結構化數據,比如圖片、視頻、音頻等數據,系統性較低。傳統的數據分析范式難以對其進行解釋,新的數據分析范式仍然未有較為統一及有效的標準,數據分析更多的停留在平面,可利用價值較差,而更多的“數據寶藏”則深埋其中,未被發掘。

其次,數據存儲面臨能力薄弱、安全隱患等問題。許多學者習慣上認為,與傳統數據相比,大數據具有以下四個鮮明的特點:規模性(Volume)、高速性(Velocity)、多樣性(Variety)和價值稀疏性(Value),其中規模性是大數據區別于小數據的重要特征。海量的數據要求數據庫存儲能力的提升,而數據來源的豐富性、數據類型的多樣性以及歷史數據的再利用性又進一步對數據庫的存儲能力有了更高的要求。目前我國大數據的存儲能力比較有限,許多傳統的數據庫仍然難以存儲、整合如此龐大的信息量,數據庫、數據倉庫等領域的技術均落后于美國等國。在信息的大傳播時代,有效的數據得不到儲存,則數據處理過程中斷,意味著無法進一步發掘數據的價值,也就喪失了數據的產能優勢。在數據存儲這一環節,還面臨著安全隱患的問題。政府、金融、醫療等特定領域對數據信息的安全性有較高的要求,但目前由于整個行業正處于初始發展階段,對此類數據的保護能力以及保護意識都比較弱,數據泄露事件時有發生,國家安全與用戶隱私時刻面臨風險。例如,2016年4月,土耳其國家數據庫爆發重大數據泄露事件,約有5000萬土耳其公民受到波及,占其國家總人口的7成左右。攻擊土耳其國家數據庫的黑客獲得了這些土耳其公民的姓名、身份證號碼、父母姓名、出生地址及年月日等隱私信息,并指出了該數據庫的三大漏洞,這說明土耳其政府對國家數據庫的保護及安全防范意識都是非常薄弱的。又如,2015年10月,國家互聯網應急中心發布信息,網易郵箱的用戶數據庫遭到泄露,這導致許多用該郵箱進行支付寶注冊或蘋果ID注冊的用戶面臨著用戶密碼被重置的風險。在數據存儲環節,無論是技術公司,又或是從“大數據+”概念中衍生出來的其他行業,都不僅應在安全意識上有所防范,而且更應在技術上持續提升數據庫的存儲能力和安保能力。

最后,數據分析存在邏輯不統一、輕易歸因、機械性等問題。盡管在過去的幾十年間,科學技術的發展實現了對海量數據的收集、整合和儲存,但大數據也不是萬能的。其中,數據分析環節是整個大數據處理過程中受到爭議最大的一個環節。首先,由于數據采集過程是不斷進行的,但是大數據服務的主營業務的架構可能總是在變,收集數據的標準也可能隨著時間總是在改變,這就容易在數據分析過程中出現前后邏輯不統一的問題。相比之下,傳統的科研范式要嚴謹得多,歷史數據和新數據的采集標準有何異同,一目了然。其次,采集的大數據是客觀存在的,無法進行自我處理和分析,需要編寫一定的算法,或者人腦直接對其進行進一步解釋和分析。在這個過程中,人為主觀性將可能導致事實客觀性的偏頗,進而產生對新聞客觀性的挑戰。人們在翻譯數據信息時存有偏見……記者群體容易濫用因果推理邏輯或相關性分析。記者群體的輕易歸因,容易導致許多“假規律”的產生,反而讓人難以發現事件背后的真正規律和問題。此外,大數據分析更多的不在于對事情因果關系的分析,而是對其相關性的體現,進而對未來發展趨勢做出預測,并最終進行決策判斷。比如:通過用戶數據的反饋,程序化廣告系統發現某用戶近來多次瀏覽某一品牌廠商的廣告,因此判斷他有可能購買該產品,并進而對該用戶進行更大力度的宣傳。這種“人工智能”看似神奇,但也可能會導致許多機械性結果和決策的產生。在進行某項決策時,人類會綜合多種因素,包括聯系前后情景,感性、理性雙重的作用等,最終形成判斷,這是人腦如此發達的原因。然而,沒有情感的機器卻無法做到這一點,許多通過算法自動生成的預測和決策都具有一定的機械性。紐約大學的兩位教授加里·馬庫斯(Gary Marcus)和歐尼斯特戴維斯(Ernest Davis)曾經指出,沒有經過因果關系邏輯判別的相關關系很可能處處是陷阱(Marcus &Davis,2016)。比如:2006年至2011年之間,美國的謀殺率與微軟自帶瀏覽器Internet Explorer的市場份額成正相關關系:兩者都呈現極速下滑的趨勢,但是讓人頭疼的是,它們兩者之間究竟存在怎樣的因果關系呢?再比如:1998年至2007年之間,新診斷的孤獨癥患者人數與有機食物的銷量呈非常良好的相關關系:兩者都急劇上增,但是獲得這樣的相關關系并不會告訴我們,健康飲食與孤獨癥之間有什么必然關系。因此,在統計學中,這種沒有因果關系支撐的假性相關關系被稱為“相關不蘊含因果”(Correlation does not imply causation)。

(三)傳統調研方法具有不可替代的價值

如今的數據科學家們認為,傳統科研方法最明顯的劣勢在于對精確性的追求。在傳統科研領域,為了提升一項調查的精確性,調查者通常需要增加樣本,而這會耗費大量的成本。相比之下,大數據能讓調查者在短期內獲得龐大的數據量,這增加了調查的容錯率,精確性便不再如此重要了?!洞髷祿r代》一書的作者維克托·邁爾—舍恩伯格(Viktor Mayer-Schnberger)提到:“有時候,當我們掌握了大量新型數據時,精確性就不那么重要了,我們同樣可以掌握事情的發展趨勢。”然而,事實真的如此嗎?“谷歌流感趨勢”一直被視為大數據應用的典范之一。2008年,谷歌推出一個名為“谷歌流感趨勢”的系統,能夠根據用戶在谷歌上搜索流感的行為和數量預測美國不同地區的流感疫情?!蹲匀弧冯s志記者德克蘭·巴特勒(Butler,2013)撰文指出,該系統對2012年年底美國流感疫情患者數目的分析,大大高估了美國疾病控制與預防中心給出的實際數據的峰值水平。而且,這已經不是這個系統第一次出現預估錯誤了。雖然大數據帶來的優勢遠遠超過了它因為不精確而產生錯誤導致的代價,但數據錯誤帶來的代價不容小覷。

大數據的處理過程中存在種種問題,一是由于這項技術尚未成熟,人才也不足夠,可以發展和完善的空間仍然很大;二是由于人們過高地估計了大數據的作用,認為這項技術具有顛覆性意義,能夠直接取代傳統科研方法,從而走上了“大數據自大”的道路。傳統科研方法經歷了長時間的學術沉淀,具有較強的邏輯性、科學性和規范性,這是新誕生的大數據研究方法難以相比的。2014年,大衛·拉澤(David Lazer)等學者在《科學》雜志發表文章,報告谷歌流感趨勢預測系統近年來的不佳表現,指出:“龐大的數據量不代表我們能夠忽視研究中測量的基本問題、結構效度、可靠性以及數據之間的依賴關系”(Lazer,Kennedy,King &Vespignani,2014)。關于谷歌流感趨勢系統在2012年年底出錯的問題,包括拉澤(Lazer)、巴特勒(Butler)等學者指出,該系統之所以高估流感的峰值,是因為政府部門以及媒體對流感出現的預警及廣泛報道。這種歸因思路的運用,正是基于傳統科研方法而來。此外,大數據應用還存在許多其他問題,需要依靠傳統科研方法進行甄別。例如:雖然大數據可以極其全面、細致地描繪其所抓取數據的信息圖景,但是這些數據——也即是樣本,對總體而言是否具有代表性并不可知,數據所能反映的,僅僅是所有信息中的一部分。在瞬息萬變的信息環境下,樣本總體總是處于動態變化之中。拉澤(Lazer)提出了“算法動力學”的概念,認為如谷歌這樣的搜索引擎不斷更新的算法可能致使系統無法穩定的反映流感趨勢。如果沒有傳統調研方法、思維和經驗的基礎,這些問題都不可能被提出。可見,大數據并不能完全替代傳統調查研究方法。

在筆者看來,大數據應用與傳統科研方法是否互為替代關系,這是一個偽命題。龐大的數據量是新興的大數據技術賦予人類認知世界的又一手段:傳統的抽樣調查方法能幫助人們更全面、高效地了解樣本總體的大致面貌,而作為對傳統科研方法的補充,大數據能幫助人們放大其中某一部分信息的詳細內容,更為細致地觀察個體的所有情況。因此,對于某一項調查而言,數據量并非越大越好,而應視情況而定;相比龐大的數據量,數據質量更為重要。在保證數據質量的基礎上,采用既規范又創新的分析方法能挖掘出數據本身的價值,幫助人們更好地認識世界——這才是大數據時代數據分析的核心所在。

值得注意的是,大數據是絕大多數媒體人的弱項。今年5月,筆者在北京做了一個針對媒體從業人員及高校新聞傳播院系的教師,進行了500人規模的問卷調查,有效回收問卷353份。數據表明,高達85.55%的被訪者只是知道大數據這個名詞,只有7.08%的被訪者知道大數據的概念和特征,1.98%的被訪者知道大數據技術所涉及的軟件;5.39%的被訪者完全不知道大數據,包括不知道這個名詞。究其原因:(1)與我國的新聞傳播學教育有關,在我國幾乎所有的高校的新聞傳播院系,都是所謂的文科,開設的技術課程是十分有限。(2)中國的傳統媒體從業人員,技術出身的人所占比例偏低,絕大多數是所謂的文科出身。

對于新聞傳播學的研究者而言,存在同樣的問題。邏輯性、科學性和規范性,這是新誕生的大數據研究方法難以相比的。

二、用戶隱私安全成為最大的問題與挑戰

在大數據時代,用戶隱私安全面臨巨大的挑戰。一方面,大數據應用不僅為企業帶來收益,而且也為用戶帶來好處。例如:程序化廣告能夠更好地實現廣告主與目標用戶的對接,既增加了廣告的投放效果,也讓用戶更方便地找到所需要的產品。另一方面,數據的采集、存儲、分析、交易和棄用環節都存在一定的風險,這讓個人用戶數據隨時隨地可能暴露于極不安全的網絡空間之中,致使用戶面臨前所未有的隱私與安全威脅。這個問題的解決牽涉許多利益集團。宏觀來看,需要權衡新經濟的發展與個人隱私安全之間的關系;微觀來看,這個問題需要依靠政府、立法機關、互聯網行業、傳媒行業等多個機構和行業共同解決,涉及面非常廣。用戶隱私安全成為大數據時代最大的問題與挑戰。

(一)多數用戶對數據收集不知情

2013年的“3·15”晚會,央視爆出高德地圖、愛聊、公信衛士等軟件竊取用戶隱私信息,并且,多家互聯網廣告公司涉嫌借助Cookie等技術侵犯用戶的個人隱私。一時間,技術詞匯“Cookie”成為當時的熱詞。Cookie是每一個網站存儲在用戶瀏覽器中的小文本數據包,每當用戶訪問網站時,這些數據便會傳送至該網站,幫助網站識別使用者的身份,以方便推送與使用者用戶相關的信息。一些網站,如電子郵箱的個人可識別信息,也被包含在這個數據包中。對于普通人而言,日新月異的互聯網技術一直都是相對復雜的技術,在媒體曝光之前,許多人甚至不知道Cookie及其他相關技術的存在,通常在不知情的情況下被各大互聯網企業收集了數據。

“2912189271158★★★★★★★★★★,這是位于山東煙臺的一個女性互聯網用戶“冰”的cookie代碼……2月份,冰總共有42次點擊百度上京東的廣告,而且點擊幾乎都是在早上或晚上10到12點發生,1、2、3日她每天都到達“我的購物車”,但沒有下單,2月4日她下了第一個訂單1403983,8日16點下訂單1515991,17點下訂單1516321,10日0點下定單1554465。之后只是張望。”這個案例清晰的顯示出Cookie代碼記錄用戶行為信息的詳細程度。

如今,互聯網企業能通過包括Cookie、郵箱、賬戶、快遞、定位等方法工具掌握個人用戶的行為與愛好,用戶只要在網絡世界中有所行為,便會在不知不覺中暴露了自己的相關信息。雖然目前絕大部分數據收集技術都經過了匿名化處理,但是人們仍然有機會通過信息中的蛛絲馬跡追溯到現實中具體的個人,更不必說網絡上各種惡意程序和黑客對個人數據的蓄意收集。用戶對數據收集行為知情權的缺失,致使維護用戶隱私安全的第一道防線被攻破,所有與用戶行為、喜好相關的數據因而流向各大企業的數據庫,等待被進一步分析、處理或交易。

(二)多數用戶沒有對自身數據被處置說“不”的機會

伴隨著大數據技術的興起,數據成為所有行業和公司的重要資源,催生了大數據交易市場的出現和發展。如今,用戶的數據都能得到永久保存,用戶的數據甚至能夠比用戶的生命留存得更為長久。當用戶的數據被企業數據庫存儲起來后,互聯網企業將進一步最大化利用、處置這些用戶數據,以達到為自身盈利的目的。不可否認,數據的“二次利用”是極具積極意義的,許多富含創意性的產業因而誕生。

但多數用戶對自身數據的保存、分析、處理、交易、丟棄都不具有決定權。用戶自身的數據流向何方,自己并不清楚。在用戶個人承擔隱私安全風險的時候,互聯網企業卻從一次次的交易和挖掘中創造了巨大的經濟財富,用戶卻沒有在這個過程中獲取任何利益。首先,通過對所有用戶數據的保存,互聯網企業能了解這些用戶的整體狀況、發展態勢和其他人口統計學的信息。其次,通過數據分析,互聯網企業能重點關注目標用戶的信息,并進一步進行跟蹤或利用,從中挖掘價值。最后,為了實現企業數據庫的擴大,許多互聯網企業會通過交換、交易等方式獲得更多的用戶數據,用戶的數據因此流向更多不同的數據庫之中,這增加了用戶數據被泄露的風險。總之,由于用戶對自身數據沒有處置知情權和決定權,相應地也就沒有拒絕被處置的權利。

(三)用戶數據泄露的風險無處不在

在大數據時代,網絡用戶的行為暴露在“第三只眼”底下,幾乎沒有任何隱私可言。在大數據應用為人們帶來巨大的經濟效益,方便人們日常生活的同時,它卻是以用戶承擔數據泄漏風險為代價的,隱藏著“定時炸彈”一般的隱私安全問題。

首先,大數據時代存在存儲風險,海量數據的急速傳播和增長無疑為硬件存儲和處理數據帶來一定風險。而且,如果一個數據庫的安防設置不強,便很有可能導致類似土耳其國家數據庫泄漏事件的發生。其次,黑客和病毒的攻擊,不僅可能影響用戶的財產安全,更有可能在未來威脅生命。許多惡意程序偽裝成殺毒軟件進入用戶電腦,掃描用戶電腦中的程序,并佯裝詢問用戶是否需要支付費用購買正版的殺毒軟件。一旦用戶點擊確認,用戶便會直接將錢財送入網絡犯罪分子的口袋。第三,非法的、未經許可的商業利用和交易都會導致個人信息被犯罪分子掌握。2015年7月,中國香港地區高發電信詐騙案,涉款高達1.2億港幣,該案件的主要源頭便是個人信息泄露。最后,許多用戶對互聯網隱私的自我保護力度不強,例如:過度暴露自身信息,設置的密碼過于簡單等,都會加大這個問題帶來的風險。2014年年底,黑客瑞恩·科林斯(Ryan Collins)制造了震驚世界的好萊塢艷照門事件。起初,人們以為黑客是借助蘋果iCloud的系統漏洞對iCloud用戶進行攻擊,調查后發現,真正的原因是這些好萊塢影星設置的密碼過于簡單易猜,導致了黑客對她們的賬號發起定向攻擊。而將過于私密的照片上傳至云儲存平臺,本身也有一定的風險性。

大數據的發展態勢已經不可逆轉,用戶在網絡中的一言一行都將被記錄,用戶隱私安全將是一項長期而又重要的研究課題。為了信息不被泄露而停止使用網絡,無疑是因噎廢食的行為。國家和社會在鼓勵大力發展大數據產業的同時,也不應將隱私安全的風險最后全部落在個人用戶身上。如何權衡產業發展與用戶隱私之間的關系,如何創新用戶隱私保護的技術和機制,將是大數據產業可持續發展中不可回避的問題。

三、基于大數據技術的機器人容易產生“冰冷的”新聞

(一)“冰冷的”新聞

機器人寫新聞的技術基礎是大數據技術。

2015年年末,許多媒體機構傳出機器人代替記者寫稿的消息,例如:新華社迎來一位“機器人記者”——“快筆小新”,騰訊財經使用“Dreamwriter”寫稿,能在第一時間運用算法生成新聞稿件,這些都讓人感嘆“記者即將下崗”。美國西北大學研發了新一代智能寫作軟件Narrative Science,宣稱將新聞報道和大數據技術進行了一次新時代的結合,這款軟件通過對給定主題的數據分析,能夠自動地選擇合適的寫作角度,快速完成一篇具有標準新聞報道結構的文章。雖然在新聞報道中自動增加了一些形容詞以提高可讀性,但寫出來的文章依然明顯缺乏新聞溫度,這是因為機器本身沒有辦法判斷情緒,它們只是單純地從數據庫中抽取形容詞,用法正確與否暫且不論,但與“手工打造”的飽含情感、責任和人文諸因素的新聞稿相比,從機器人手中傳遞出來的新聞雖然是新鮮的卻是冰涼的。技術的進步加快了生產力的發展,“機器人寫稿”雖好,但卻缺少“溫度”。雖然大數據看似解決了新聞客觀性問題,但新聞的角度同樣重要。新聞是“有溫度”的,它嵌入記者的思考,倡導一種理念,體現人文關懷。然而,機器人“記者”卻只能“冷冰冰”地將數據中反映的事實全盤托出,難以體現人文精神。而且,機器人難以做到歸因、舉證,無法引導人們對某一則新聞的深入思考。由于機器人是根據特定算法生成稿件的,沒有加入記者的個性,千篇一律,長此以往,容易令人厭倦。

當前新聞寫作軟件只能生成特定類型的報道,且只能采用單一來源的數據,遵循這類報道常用的固定模式,大批量“生產”出有限類別的短新聞。具體的生產過程是機器人中固化的軟件事先被設定了算法,通過軟件整理數據事實,并與歷史數據和其他背景信息相結合,再遣詞造句呈現出描述性的新聞。機器人撰寫報道就如同做完型填空題一樣,只需要在設定好的語境中進行簡單的填充即可。雖然現今這類寫作軟件變得更加“聰明”,算法更加先進,如將讀者喜好的語氣、角度甚至幽默融入一篇報道之中,以機器人報道籃球賽事為例,可能機器人會用同樣的數據生成兩個版本的新聞:一個版本為獲勝球隊的粉絲所寫,充滿歡天喜地的氣氛;另一個版本則是為失敗的球隊準備的,讀起來讓粉絲沮喪低落。但無論如何,機器人無法理解兩個球隊所有粉絲的感受。讀者并不是因為獲勝就完全滿足,可能球隊通過比賽還是反映出存在的一些問題;而失敗一方也不一定完全是失落的,因為他們也許看到了同強隊交手中顯示出來的球隊進步。因此,機器人是無法同創造力旺盛、想象力豐富的人類作者相比擬的。

作為面向普羅大眾的新聞媒體,要增強新聞宣傳和輿論引導的吸引力、感染力、親和力和影響力,就必須采制出有現場溫度及人情溫度的報道內容。評判一條新聞的質量好壞有多重標準,但真正能打動受眾的往往是有溫度的新聞。新聞的溫度源于媒體人的社會責任感,源于媒體人對普通受眾的感情積累。做新聞不能只站在媒體的角度來反映民眾的生活,更重要的是在情感上實現與受眾的相互交融。

(二)依賴大數據技術還容易使人缺失新聞敏感度

通過新聞敏感度,不但能夠對新聞從業者的采寫能力進行判定,同時也能對新聞價值進行判定。新聞實踐是新聞從業者職業新鮮感、新聞寫作創新感的體現,在新聞實踐過程中,如新聞敏感度缺失,則直接降低了新聞價值。一個具備很強新聞敏感度的新聞從業者,可以從平凡的事件中發現有價值的新聞,從很小的細節中洞見真實和深度,從而挖掘出有價值的新聞;而新聞敏感度較弱的新聞從業者,則會存在漠視現象和反應遲鈍問題,從而與有新聞價值的線索擦肩而過,錯失好的新聞題材。

機器人將數據直接轉化為文章,成本較為低廉,因此機器人可用以提供對不同讀者的新聞定制服務。但是,基于大數據技術的機器人寫新聞,存在新聞敏感度缺失的問題,機器畢竟是機器,盡管美聯社表示機器人寫作軟件按照程序使用不同語氣的能力越來越強,但新聞畢竟出自機器人之手,它不具備對新聞線索進行挖掘的觀察能力,也不具備對新聞事件進行取舍的決斷能力,而這兩種能力是新聞敏感度的重要體現。

就機器人撰寫新聞的過程而言,一些具有固定模式的行業性文章更符合它的本能,因為既不需煉字鍛句,又不需深度分析。如果有一天記者真的被冷冰冰的機器人取代,新聞恐將淪為諸多報道模式的生硬“拼盤”。人們很難期望機器人會像人類一樣,能夠根據不同的采訪對象,變換不同的采訪語氣與被訪者進行觀點和思維的交鋒。我們在認可機器人存在技術上的優勢之外,也承認機器人是無法同人類一樣具有足夠的應變能力和創造能力的。人類的思維至少在短時間內無法被機器人模仿,分析和觀點性的報道需要消息來源、知識積累、邏輯思維等眾多的能力在里面,在這些方面,機器人寫手無法與記者一決高下。通過機器人撰寫的稿件,會因為內容的生硬和重復而影響稿件的質量。“機器人記者”能寫的文章種類有限,無法進行深度分析,更不會煉字鍛句。

記者工作是一種復雜的、高級的腦力勞動。機器人也是人類發明的。機器人的構思再精巧,也無法替代人腦。機器人搶不走記者的飯碗。人們不能指望機器人在鏡頭前隨機應變或深入背街小巷明察暗訪。新聞作為一種文字和圖像的藝術,字里行間與鏡頭之下,都包含著記者的判斷、價值觀與人文關懷。機器人寫手雖有其技術優勢,但卻無法完全具備人的靈活性和創造力。機器人寫手只是一種輔助形式,它可以節省時間,把記者從一堆基礎數據和信息中解放出來。

四、大數據帶來的社會憂慮

大數據技術變革了所有產業,不僅改變了我們的生活、生產等多個領域,而且改變了我們認知世界的方式。在這個過程中,不可否認,大數據的確帶來了許多積極影響,這也是它能夠成為時代焦點的原因之一。但是,不可忽視的是,正如“蝴蝶效應”一般,大數據技術的發展也衍生出一系列新的社會現象,如用戶閱讀行為的改變,人文精神的衰退,社會歧視和個人自由的喪失,引發了人們的思考、爭議和擔憂。大數據正處于初始發展階段,若是對這些現象和影響不加以探討和警惕,便有可能在未來對人類社會造成一定的傷害。

(一)用戶閱讀習慣的改變

在信息過剩的大數據時代,人們每日能夠接觸到海量的信息,加上移動設備的普及,讓人們不再限于一個場景進行閱讀,閱讀習慣也隨之改變。雖然如今手機用戶能夠24小時不斷接收信息,但是也帶來了一系列問題,主要體現在三個方面:淺閱讀、碎片化閱讀和同質化閱讀。

首先,2015年4月,亞馬遜發布“中國2015‘全民閱讀’調查報告”,顯示以社交媒體為主的淺閱讀已經成為很多讀者生活的重要組成部分(亞馬遜中國,2015)。淺閱讀,也就是快速瀏覽內容信息而不加深思,不求甚解,是大數據時代用戶閱讀習慣改變的主要趨勢之一。它可能造成經典著作少人問津,使人們的視野變得狹窄,進而失去獨立和批判思考的能力。第二,用戶碎片化閱讀趨勢也十分明顯。隨著人們的生活節奏逐漸加快,許多人只能利用零散的時間在移動設備上進行閱讀。盡管有不少人認為碎片化閱讀能擴充人的知識面,但它不過是增加一點表面常識,難以讓人形成對某一問題系統化、深層次的理解和看法。最后,個性化新聞推送如今已成為新聞界的一大發展方向,伴隨而來的是對同質化閱讀和群體極化的思考。在互聯網領域,盡管表面上網民用戶能接觸所有信息資源,但事實上,由于信息的海量性和相關個性化推送技術的成熟,用戶只能針對性地選擇與自己相關的內容,人們接觸信息的同質化傾向比傳統媒體時代要高,容易加深群體極化的趨勢。

(二)社會歧視

大數據時代,也可能在社會上導致潛在的“大數據歧視”。2015年初,微信朋友圈出現廣告,引發網友熱議。微信應用特定的大數據算法推送相關廣告信息,致使部分網友刷到可口可樂廣告,部分網友刷到Vivo手機廣告,另有一些網友刷到寶馬廣告。在互聯網企業面前,個體消費者成為一個個“透明人”,所有消費者將不再平等,數據庫顯示下的“窮人”很可能遭遇歧視服務。

消費歧視是大數據時代廣告業個性化推送附帶的弊病之一,更為令人擔憂的是,個人隱私信息的泄露可能會帶來更為嚴重的社會歧視。例如:個人醫療信息的泄露,如:乙肝患者、艾滋病患者等弱勢群體信息的曝光,可能使這些人群的基本人權受到侵犯,造成諸如日常生活受阻、就業困難等問題。大數據歧視也可能加深人們的刻板印象。2016年年初,百度大數據推出中國偏見地圖,這可能加深人們對某一地區、族群的刻板印象。比如:河南人都是騙子,廣東人什么都吃,新疆人多為小偷等。這種刻板印象將造成現實生活中職業歧視、司法歧視、婚姻歧視等一系列歧視問題的發生。

最重要的是,大數據的預測功能還可能造成對人們潛在行為的懲罰和判斷,進而引起社會司法的混亂與不公。通過大數據,警方可以了解一個人的過去和近期行為,進而預測其未來的行為趨勢。這種預測行為看似是為社會公眾安全著想,但事實上卻會帶來許多問題。倘若大數據顯示某人過去有案底,且近期行蹤可疑,便判斷其可能有作案傾向,警方便將其逮捕歸案,這就剝奪了個人最起碼的自由權利。這種技術和思路一旦被擁有公權力的機構和個人掌握,成為統治社會和打擊敵對勢力的工具,便可能導致許多無辜人員無端受害,造成大量社會不公,進而危害人們的自由和生命。

五、結語

在網絡傳播技術高速發展的今天,“大數據”一詞甚囂塵上,在各行各業中都被熱切地討論。傳媒學界和業界對大數據具有各種美好的期待,“數據新聞”的專業實踐正在如火如荼地展開。毫無疑問,大數據應用產業將產生巨大的經濟效益,筆者并非要全盤否定它的先進性,但是大數據發展過程是否也平衡了價值理性,這需要傳媒業的重新估量??v觀社會發展進程,一項新興技術一旦投入使用,便是覆水難收,難以回頭。只有在大數據技術方興未艾的時候,通過對它的理性思考,才能促使政府與立法機關規范大數據的使用,促使企業合理應用大數據,進而才能有效避免大數據的發展對傳媒產業及整個社會帶來的問題與危害。

責任編輯:武曉燕 來源: 國際新聞界
相關推薦

2016-08-31 01:30:18

大數據市場大數據應用

2020-08-03 11:38:08

數據中臺數據平臺互聯網

2018-07-19 06:23:37

物聯網IOT網絡

2017-10-23 12:19:38

2021-11-08 10:24:05

智能自動駕駛汽車

2020-07-03 19:48:24

區塊鏈區塊鏈技術

2015-10-15 16:31:11

物聯網大數據

2024-06-17 08:22:31

GenAI技術人工智能

2016-10-21 14:22:42

2020-05-21 13:24:09

新基建數據中心5G

2023-02-07 21:17:00

ChatGPT人工智能

2020-11-27 09:52:55

人臉識別

2019-04-23 13:43:38

編程PythonJava

2020-11-03 18:44:28

造芯IC芯片企業

2020-05-12 10:01:10

網絡安全新基建安全威脅

2016-12-28 14:24:15

互聯網金融

2022-12-05 11:29:14

2012-05-14 10:23:25

IDC云計算

2016-04-11 15:49:40

人工智能大數據應用IBM

2013-09-12 09:54:44

云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕一区二区三区日韩精品 | 日本中文字幕视频 | 粉嫩av | 美女视频一区 | 日韩午夜在线观看 | 九九综合 | 中文字幕国产视频 | 成人av在线播放 | 国产成人精品在线 | 国产欧美精品一区二区三区 | 亚洲成人一二区 | 国产亚洲网站 | 国产亚洲一区二区三区在线观看 | 欧美激情国产日韩精品一区18 | 成人精品区 | 精精国产xxxx视频在线播放 | 欧美人妇做爰xxxⅹ性高电影 | 91在线一区 | 欧美日韩国产精品 | 欧美日韩一区二区在线播放 | 日本三级全黄三级三级三级口周 | 中文字幕日韩在线 | 亚洲精品一区二区网址 | 国产精品久久久久久久久久妞妞 | 一区二区三区四区av | 成人黄色av网址 | 国产精品不卡一区二区三区 | 一区二区三区四区不卡视频 | 成人久久久 | 在线视频国产一区 | 日日摸日日碰夜夜爽亚洲精品蜜乳 | www.yw193.com| av超碰 | 在线观看中文字幕亚洲 | 免费日韩av| 国产精品二区三区在线观看 | 国产日韩欧美二区 | 97色在线观看免费视频 | 精品久久久久久久久久久院品网 | 欧美性极品xxxx做受 | 亚洲国产精品精华素 |