成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

網絡爬蟲的前生今世

系統 其他OS
網絡檢索功能起于互聯網內容爆炸性發展所帶來的對內容檢索的需求。最初的檢索功能通過索引站的方式實現,而有了網絡機器人,即網絡爬蟲這個技術之后,搜索引擎的時代便開始一發不可收拾了。

在互聯網發展初期,網站相對較少,信息查找比較容易。然而伴隨互聯網爆炸性的發展,普通網絡用戶想找到所需的資料簡直如同大海撈針,這時為滿足大眾信息檢索需求的專業搜索網站便應運而生了。

現代意義上的搜索引擎的祖先,是1990年由蒙特利爾大學學生Alan Emtage發明的Archie。雖然當時World Wide Web還未出現,但網絡中文件傳輸還是相當頻繁的,而且由于大量的文件散布在各個分散的FTP主機中,查詢起來非常不便,因此Alan Archie工作原理與現在的搜索引擎已經很接近,它依靠腳本程序自動搜索網上的文件,然后對有關信息進行索引,供使用者以一定的表達式查詢。由于Archie深受用戶歡迎,受其啟發,美國內華達System Computing Services大學于1993年開發了另一個與之非常相似的搜索工具,不過此時的搜索工具除了索引文件外,已能檢索網頁。

當時,“機器人”一詞在編程者中十分流行。電腦“機器人”(Computer Robot)是指某個能以人類無法達到的速度不間斷地執行某項任務的軟件程序。由于專門用于檢索信息的“機器人”程序象蜘蛛一樣在網絡間爬來爬去,因此,搜索引擎的“機器人”程序就被稱為“蜘蛛”程序。世界上***個用于監測互聯網發展規模的“機器人”程序是Matthew Gray開發的World wide Web Wanderer。剛開始它只用來統計互聯網上的服務器數量,后來則發展為能夠檢索網站域名。與Wanderer相對應,Martin Koster于1993年10月創建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“機器人”程序,而是靠網站主動提交信息來建立自己的鏈接索引,類似于現在我們熟知的Yahoo。

隨著互聯網的迅速發展,使得檢索所有新出現的網頁變得越來越困難,因此,在Matthew Gray的Wanderer基礎上,一些編程者將傳統的“蜘蛛”程序工作原理作了些改進。其設想是,既然所有網頁都可能有連向其他網站的鏈接,那么從跟蹤一個網站的鏈接開始,就有可能檢索整個互聯網。到1993年底,一些基于此原理的搜索引擎開始紛紛涌現,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最負盛名。

然而JumpStation和WWW Worm只是以搜索工具在數據庫中找到匹配信息的先后次序排列搜索結果,因此毫無信息關聯度可言。而RBSE是***個在搜索結果排列中引入關鍵字串匹配程度概念的引擎 最早現代意義上的搜索引擎出現于1994年7月。當時Michael Mauldin將John Leavitt的蜘蛛程序接入到其索引程序中,創建了大家現在熟知的Lycos。同年4月,斯坦福(Stanford)大學的兩名博士生,David Filo和美籍華人楊致遠(Gerry Yang)共同創辦了超級目錄索引Yahoo,并成功地使搜索引擎的概念深入人心。從此搜索引擎進入了高速發展時期。目前,互聯網上有名有姓的搜索引擎已達數百家,其檢索的信息量也與從前不可同日而語。比如最近風頭正勁的Google,其數據庫中存放的網頁已達30億之巨!(51CTO編輯注:當然,現在已遠不止這個數量級)

隨著互聯網規模的急劇膨脹,一家搜索引擎光靠自己單打獨斗已無法適應目前的市場狀況,因此現在搜索引擎之間開始出現了分工協作,并有了專業的搜索引擎技術和搜索數據庫服務提供商。象國外的Inktomi,它本身并不是直接面向用戶的搜索引擎,但向包括Overture(原GoTo)、LookSmart、MSN、HotBot等在內的其他搜索引擎提供全文網頁搜索服務。國內的百度也屬于這一類(注),搜狐和新浪用的就是它的技術。因此從這個意義上說,它們是搜索引擎的搜索引擎。

責任編輯:yangsai 來源: 網絡轉載
相關推薦

2016-11-24 22:30:17

DeepLink移動App開發

2010-08-27 14:04:47

2025-03-05 11:03:36

2018-03-05 11:29:17

云計算云服務服務器

2015-03-09 15:26:36

2018-05-31 12:12:12

頁面可視化工具

2019-01-04 10:41:07

系統內存SRAM

2019-08-15 10:56:10

WebServletSpring mvc

2018-09-26 16:04:04

NVMe主機控制器

2018-10-18 10:52:35

路由器無線路由器wifi

2018-02-23 14:30:13

2011-03-09 10:07:56

網絡爬蟲Java

2011-08-17 11:04:17

摩托羅拉Linux手機

2012-05-10 13:42:26

Java網絡爬蟲

2018-05-14 15:27:06

Python網絡爬蟲爬蟲架構

2022-10-12 09:40:51

開源代碼

2017-07-17 09:04:09

2023-06-01 13:15:23

2022-09-20 07:02:20

網絡爬蟲反爬蟲

2023-08-03 16:04:49

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本中文字幕一区 | 国产91视频播放 | av一二三四 | 伊人网综合在线 | 男女羞羞的网站 | 超碰8 | 中文字幕一区二区三区乱码在线 | 国产一级在线 | 涩涩操| 欧美视频福利 | 国产精品美女www爽爽爽 | 亚洲午夜久久久 | 成人免费高清 | 欧美福利视频 | 亚洲精品久久久久久国产精华液 | 欧美国产日韩在线观看 | 亚洲欧洲色视频 | 久久久毛片 | 狠狠干天天干 | 91精品国产乱码久久蜜臀 | 国产乱码精品一区二区三区忘忧草 | 99精品视频一区二区三区 | 精品日韩一区二区 | 罗宾被扒开腿做同人网站 | 国产精品久久国产精品久久 | 国产99久久久国产精品 | 亚洲在线一区 | 成年人网站在线观看视频 | 国产 日韩 欧美 在线 | 亚洲h色| 久久国产精品视频免费看 | 中文字幕视频在线看5 | 免费观看国产视频在线 | 黄瓜av| 亚洲乱码国产乱码精品精98午夜 | 国产一级一片免费播放 | 男人天堂手机在线视频 | 日本午夜免费福利视频 | 精品美女视频在线观看免费软件 | 久久国产精品网站 | 国产精品高潮呻吟久久av黑人 |