成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

合理規制、加強規范 不讓網絡爬蟲變“害蟲”

安全 應用安全
近年來,隨著移動互聯、人工智能、大數據、云計算等新技術的迅速發展與普及應用,人們的工作、交往和生活方式都發生了深刻變化,數據成為驅動社會發展的新型生產要素、各行各業增強競爭力的重要源泉。

 [[388977]]

近年來,隨著移動互聯、人工智能、大數據、云計算等新技術的迅速發展與普及應用,人們的工作、交往和生活方式都發生了深刻變化,數據成為驅動社會發展的新型生產要素、各行各業增強競爭力的重要源泉。但在大數據收集過程中,也存在著各種違法犯罪問題。網絡爬蟲(Web Crawler)作為一種能快速精準地獲取數據信息的基礎性網絡技術,近年來得到了越來越多的青睞和應用。如何對其進行規制,驅動其向好向善,成為當前重要的法治議題。

“小爬蟲”的“大角色”

網絡爬蟲,又稱為“網頁蜘蛛”“網絡機器人”,是一種按照一定的規則,自動抓取網絡信息的程序或者腳本。它能在特定程序的驅動下,模仿人工點擊從網站、手機應用、小程序或搜索引擎中檢索、提取、存儲數據。我們可以形象地將它們理解為一種爬行在網絡上的蜘蛛,它們根據程序的指令,通常沿著URL(網址)這根蛛絲,在互聯網這張大網上爬來爬去,尋找和帶回所需要的數據資源。我們熟知的百度、搜狗、谷歌等搜索引擎,其技術核心元素之一就是“網絡爬蟲”。例如百度蜘蛛,它通過互聯網入口爬取網頁,實時存儲并更新索引,然后為用戶提供檢索服務。

自從1993年第一個網絡爬蟲程序——“互聯網漫游者”被開發出來,網絡爬蟲這種便捷高效的搜索技術便得到了業界關注。特別是隨著數據資源的爆炸式增長,網絡爬蟲的應用場景也變得越發廣泛與多元,長期活躍于市場調查、產品研發、金融分析、輿情監控、風險預測等領域。近年來,一些運用爬蟲技術為客戶提供數據服務的互聯網企業,也獲得了快速發展。對個人而言,我們可以利用爬蟲軟件等計算機編程語言,讓網絡爬蟲為自己服務。例如想買到理想的房子,就可爬取房產中介的公開信息,分析房源數據與趨勢以輔助決策。

網絡的本質與價值在于連接,核心是實現數據的流動與分享。網絡爬蟲作為數據抓取的技術工具,通過爬行增強了網絡節點間的聯絡,提升了網絡的整體價值,是構建互聯網開放與共享理念的重要技術基石。但網絡爬蟲所行之處,并非總是鮮花和掌聲,特別是涉及隱私領地和網絡安全之時。因此,為了規范爬蟲,維護網絡秩序,1994年誕生了“robots.txt協議”,該協議雖然只是一個“君子協議”,但它逐漸被視為網絡空間爬蟲技術應用公認的行業準則,也成為判定爬取行為是否獲得網站許可的主要依據。在2014年百度公司訴奇虎360違反robots協議案中,法院在判決時就認為,被告沒有遵守原告網站的robots協議,其行為明顯不當,應當承擔相應的不利后果。

科技異化:“好爬蟲”和“壞爬蟲”

科技本身是一種中立性工具,向善向惡、合法與非法,關鍵在于使用者的選擇。原本通過robots協議,一方獲得了數據與信息,一方增加了流量與關注,皆大歡喜。但robots協議能防“君子”卻難防“小人”,有些爬蟲程序不遵守規則,隨心所欲地爬取別人不愿意分享的數據信息,并大量擠占服務器資源,變成了“網絡害蟲”。例如近年來一些大數據風控公司利用爬蟲技術,在網絡上非法收集用戶個人信息并轉賣給第三方,借以謀取經濟利益。

網絡爬蟲設計的初衷是通過計算機技術,自動為網站編纂索引,更新信息,為用戶提供高效的檢索服務。具有訪問、下載和解析(對數據進行分析與篩選)三種基本功能。目前,爬蟲作惡主要是對前兩種功能的異化,體現為三類作惡方式。

一是惡意抓取非授權數據。訪問數據是“網絡爬蟲”的行為起點,也是其價值本源,一些企業或個人為了經濟利益或其他特殊目的,想方設法讓網絡爬蟲突破道德規則與技術障礙(網站“反爬蟲”措施),爬取未經授權或超過授權范圍的數據。例如2018年2月至4月間,馬某通過編寫“爬蟲”程序,竊取手機應用及網站的用戶信息約20萬條,然后通過微信出售給他人,非法獲利共計2.4萬元,這種行為就構成了侵犯公民個人信息罪。

二是惡意侵犯知識產權。一些網絡爬蟲在數據爬取過程中,未經版權方的許可,就下載、復制或傳播文字、圖片和視頻等內容,并以此獲利。通常形式是,爬蟲對具有版權歸屬的文學或影視作品等設置加框鏈接,吸引用戶點擊,然后通過售賣廣告等形式牟利。例如段某建立的“窩窩電影”網站,利用爬蟲技術對多家視頻網站的500余部影視作品設置了加框鏈接,吸引用戶點擊播放,并賺取廣告費100余萬元,這種行為就觸犯了著作權法。

三是惡意擾亂系統運行。網絡爬蟲訪問系統時,跟人工點擊原理一樣,因此當巨量爬蟲同時訪問某一網站時,就會占用大量的帶寬資源,造成服務器不堪重負甚至崩潰。業內專家表示,2019年有近40%的網絡流量來自爬蟲,其中20%來自惡意爬蟲,而且比例還將不斷上升。出行行業即是重災區。以中國鐵路“12306網站”為例,自2011年上線運營以來,春運期間多次出現因爬蟲(主要是搶票軟件)攻擊而無法訪問的情況。據統計,2018年春運期間,網站最高峰時1天內頁面瀏覽量達813.4億次,其中近90%是“爬蟲”所為。

合理規制,讓“爬蟲”向善向上

據統計,截至2020年12月,我國網民規模達9.89億。增強網絡空間治理,保障個人信息和數據安全,已成為重大的時代命題。

目前我國對網絡爬蟲的規制還沒有專門的法律法規,主要依靠民法典、反不正當競爭法、著作權法、網絡安全法以及刑法中的相關法律條款。但從法律規制效果來看,情況不容樂觀。一方面是由于互聯網技術的快速發展,以及網絡所具有的開放性、虛擬性和流動性等特征,讓對違法犯罪行為的監管和證據提取較為困難,特別是隨著數據抓取從網頁拓展至手機應用程序、小程序等移動端平臺,抓取手段就更加復雜與隱蔽;另一方面是網絡世界和數字服務發展迅猛,法律法規還具有較大的滯后性,司法實踐對網絡爬蟲技術濫用引發的法律問題缺乏足夠的司法經驗,而相關的司法解釋亦未能予以足夠關注,難以形成有效規制。例如2017年今日頭條與新浪微博之間因“微頭條”業務同步“微博”發言內容的糾紛案例,其實質是數據權屬難以確定的問題。但由于缺乏明確的司法解釋指引,引發了實踐中的普遍爭議。

2019年5月,國家互聯網信息辦公室公布了《數據安全管理辦法(征求意見稿)》,該辦法專門針對利用網絡開展數據收集、存儲、傳輸、處理、使用等活動進行了規制,有望對網絡爬蟲等技術行為進行有效治理。該辦法強調,國家堅持保障數據安全與發展并重,鼓勵研發數據安全保護技術,積極推進數據資源開發利用,保障數據依法有序自由流動。這也提醒我們,網絡爬蟲等本質上是順應數字經濟發展需求而生,既要從法律層面高度重視,也要把握好法律規制的邊界,力求達到數據利用與合理規制之間的良性平衡,以便讓網絡技術更好地服務經濟社會與人民生活,助推數字中國建設。

責任編輯:張燕妮 來源: 光明日報
相關推薦

2021-10-29 15:05:57

網絡安全爬蟲技術

2014-08-12 09:47:04

開源軟件軟件安全OSS組件

2014-08-13 13:31:27

網絡·安全技術周刊

2020-12-29 11:18:50

人工智能安全人臉識別

2011-03-24 10:39:04

2009-07-15 15:47:45

綜合布線驗收規范

2021-10-25 22:42:47

人工智能網絡安全工具

2023-09-29 08:53:30

線程池java函數

2018-02-23 14:30:13

2010-07-05 16:15:41

流量控制

2009-11-04 10:30:48

接入網市場

2020-12-22 21:57:39

人臉識別AI人工智能

2020-03-27 15:44:19

人臉識別技術網絡

2013-05-21 09:09:49

服務器虛擬化網卡

2013-05-21 09:08:24

服務器虛擬化網卡

2018-05-14 15:27:06

Python網絡爬蟲爬蟲架構

2023-07-05 00:11:20

2019-07-22 10:20:06

2018-11-01 10:10:35

網絡安全網絡攻擊網絡威脅

2023-06-01 13:15:23

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲综合在线一区二区 | 成人在线小视频 | 亚洲精品视频免费 | 欧美xxxⅹ性欧美大片 | 欧美一区二区三区视频在线观看 | 国产91在线播放 | 亚洲欧美视频一区 | 伊人影院在线观看 | 国产精品99久久久久久宅男 | 成人性生交大片免费看中文带字幕 | 国产一级片免费看 | 日本aa毛片a级毛片免费观看 | 在线欧美一区二区 | 中文字幕一区二区在线观看 | 亚洲一区二区三区在线 | 羞羞视频在线观看网站 | 国产亚洲精品久久yy50 | 蜜桃视频在线观看免费视频网站www | 中文字幕一区在线观看视频 | 国产精品1区 | 九九国产| 美女在线观看国产 | 国产一级一级国产 | 91麻豆精品国产91久久久久久 | 欧美在线一区视频 | 国产一区视频在线 | 亚洲一区二区三区四区五区午夜 | 欧美日韩精品一区二区天天拍 | 青青久在线视频 | 国产一区二区在线免费观看 | 午夜久久久久久久久久一区二区 | 国产永久免费 | 天天操一操 | 天天夜碰日日摸日日澡 | 一区二区手机在线 | 草比网站 | 日本天堂视频在线观看 | 在线亚洲免费 | 国产传媒毛片精品视频第一次 | 欧美精品久久久 | 国产精品久久久久久 |