成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

用Python標準庫修改搜索引擎獲取結(jié)果

作者：佚名 2010-03-10 09:28:41

開發(fā) 后端

Python標準庫使用的過程中有不少的問題影響著我們的使用。下面我們就向大家介紹下簡單的Python標準庫詳細使用方案。

Python標準庫在長時間的使用中需要不斷的學(xué)習(xí)。下面我們就看看如何才能更好的掌握相關(guān)的技術(shù)信息。希望對大家之后的使用和學(xué)習(xí)有所幫助。下面的就是想大家介紹下相關(guān)的使用方法。

我輸入的關(guān)鍵字作為地址參數(shù)傳遞給某個程序，這個程序就會返回一個頁面，上面包括頂部（logo和搜索UI）／結(jié)果部分／底部（版權(quán)信息部分），我們要得到的就是中間結(jié)果部分，這個可以用Python標準庫的urllib中的urlopen方法得到整個頁面的字符串，然后再解析這些字符串，完全有辦法把中間結(jié)果部分抽取出來，抽出著串字符串，加上自己的頭部和頂部和底部，那樣搜索小偷的雛形就大概完成了，下面先寫個測試代碼。

[code]   
# Search Thief   
# creator: Singo   
# date: 2007-8-24   
import urllib   
import re   
class SearchThief:   
" " "the google thief " " "   
global path,targetURL   
path = "pages\\ "   
# targetURL = "http://www.google.cn/search?complete=1&hl=zh-CN&q= "   
targetURL = "http://www.baidu.com/s?wd= "   
def __init__(self,key):   
self.key = key   
def getPage(self):   
webStr = urllib.urlopen(targetURL+self.key).read() # get the page string form the url   
self.setPageToFile(webStr)   
def setPageToFile(self,webStr):   
rereSetStr = re.compile( "\r ")   
self.key = reSetStr.sub( " ",self.key) # replace the string "\r "   
targetFile = file(path+self.key+ ".html ", "w ") # open the file for "w "rite   
targetFile.write(webStr)   
targetFile.close()   
print "done "   
inputKey = raw_input( "Enter you want to search --> ")   
obj = SearchThief(inputKey)   
obj.getPage()   
[/code]

這里只是要求用戶輸入一個關(guān)鍵字，然后向搜索引擎提交請求，把返回的頁面保存到一個目錄下，這只是一個測試的例子，如果要做真正的搜索小偷，完全可以不保存這個頁面，把抽取出來的字符串加入到我們預(yù)先設(shè)計好的模板里面，直接以web的形式顯示在客戶端，那樣就可以實現(xiàn)利用盜取某些搜索引擎的結(jié)果并構(gòu)造新的頁面呈現(xiàn)。

看一下百度搜索結(jié)果頁的源碼，在搜索結(jié)構(gòu)的那個table標簽前面有個 <DIV id=Div> </DIV> 的標簽，我們可以根據(jù)這個標簽得到下移兩行的結(jié)果集，于是增加一個方法。

getResultStr()   
[code]   
def getResultStr(self,webStr):   
webStrwebStrList = webStr.read().split( "\r\n ")   
line = webStrList.index( " <DIV id=Div> </DIV> ")+2 # get the line from " <DIV id=Div> </DIV> " move 2 line   
resultStr = webStrList[line]   
return resultStr   
[/code]

既然得到結(jié)果列表，那么我們要把這個結(jié)果列表放到自己定義的頁面里面，我們可以說這個頁面叫模板：

[code]   
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN " "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">   
<html xmlns= "http://www.w3.org/1999/xhtml ">   
<head>   
< http-equivhttp-equiv= "Content-Type " content= "text/html; charset=gb2312 " />   
<title> SuperSingo搜索-%title% </title>   
<link href= "default/css/global.css " type=text/css rel=stylesheet>   
</head>   
<body>   
<div id= "top ">   
<div id= "logo "> <img src= "default/images/logo.jpg " /> </div>   
<div id= "searchUI ">   
<input type= "text " style= "width:300px; " />   
<input type= "submit " value= "Search " />   
</div>   
<div class= "clear "/>   
</div>   
<div id= "result_info ">   
工找到：×××條記錄，耗時×××秒   
</div>   
<div id= "result "> %result% </div>   
<div id= "foot ">

這里搜索的結(jié)構(gòu)全都是百度那里過來的哦！其中%title%和%result%是等待替換的字符，為了替換這些字符，我們再增加一個方法， #p#

[b]reCreatePage()：[/b]   
[code]   
def reCreatePage(self,resultStr):   
demoStr = urllib.urlopen(demoPage).read() # get the demo page string   
rereTitle = re.compile( "%title% ")   
demoStr = reTitle.sub(self.key,demoStr) # re set the page title   
rereResult = re.compile( "%result% ")   
demoStr = reResult.sub(resultStr,demoStr) # re set the page result   
return demoStr   
[/code]

這樣就可以把模板中的%title%和%result%替換成我們想要的標簽了。

[code]   
# the main programme   
# creator: Singo   
# date: 2007-8-24   
import urllib   
import re   
class SearchThief:   
" " "the google thief " " "   
global path,targetURL,demoPage   
path = "pages\\ "   
# targetURL = "http://www.google.cn/search?complete=1&hl=zh-CN&q= "   
targetURL = "http://www.baidu.com/s?wd= "   
demoPage = path+ "__demo__.html "   
def __init__(self,key):   
self.key = key   
def getPage(self):   
webStr = urllib.urlopen(targetURL+self.key) # get the page string form the url   
webStr = self.getResultStr(webStr) # get the result part   
webStr = self.reCreatePage(webStr) # re create a new page   
self.setPageToFile(webStr)   
def getResultStr(self,webStr):   
webStrwebStrList = webStr.read().split( "\r\n ")   
line = webStrList.index( " <DIV id=Div> </DIV> ")+2 # get the line from " <DIV id=Div> </DIV> " move 2 line   
resultStr = webStrList[line]   
return resultStr   
def reCreatePage(self,resultStr):   
demoStr = urllib.urlopen(demoPage).read() # get the demo page string   
rereTitle = re.compile( "%title% ")   
demoStr = reTitle.sub(self.key,demoStr) # re set the page title   
rereResult = re.compile( "%result% ")   
demoStr = reResult.sub(resultStr,demoStr) # re set the page result   
return demoStr   
def setPageToFile(self,webStr):   
rereSetStr = re.compile( "\r ")   
self.key = reSetStr.sub( " ",self.key) # replace the string "\r "   
targetFile = file(path+self.key+ ".html ", "w ") # open the file for "w "rite   
targetFile.write(webStr)   
targetFile.close()   
print "done "   
inputKey = raw_input( "Enter you want to search --> ")   
obj = SearchThief(inputKey)   
obj.getPage()   
[/code]

這樣我們就可以得到一個自己定義的風(fēng)格而含有百度搜索出來的結(jié)果的頁面，這里只做了標題和結(jié)果及的替換，同樣道理，我們還可以把“百度快照”替換掉，我們還可以重新生成翻頁控件,這樣一個搜索小偷就基本完成啦。

用Python標準庫向Google請求時，Google會返回一個不是我們希望得到的頁面，上面的內(nèi)容是提示無權(quán)訪問，Google很聰明，這步已經(jīng)被他們想到了，但百度沒做這樣的限制哦，于是成功截取百度的數(shù)據(jù)。同樣道理，還可以嘗試其他搜索引擎，比如yisou和soso。

做個自己的頁面風(fēng)格，盜取baidu的搜索結(jié)果，打造自己的品牌而利用別人的數(shù)據(jù)，甚至去掉baidu的廣告加上自己的廣告，這種做法實在是太不厚道了，哈哈哈。該程序只為學(xué)習(xí)python標準庫用，具體來說沒什么意義。

【編輯推薦】

Python列表與C#語言的相似度介紹
Python字符串的廣泛應(yīng)用
Python抓取的具體應(yīng)用解答
Python字符串類型的詳細介紹
Python列表內(nèi)涵實際中的使用介紹

責(zé)任編輯：張浩來源：人民郵電出版社

Python標準庫

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

主站蜘蛛池模板：在线看91 | 久久久精品影院 | 中文字幕国产高清 | 精品视频网 | 在线综合视频 | 精品久久国产 | 精品欧美一区二区三区久久久小说 | 91视视频在线观看入口直接观看 | 欧美一区二区三区在线观看视频 | 一区二区在线看 | 国产精品久久久久无码av | 丁香婷婷久久久综合精品国产 | 亚洲免费在线 | 欧美精品一区二区免费 | 国产精品一区二区视频 | 男女羞羞视频在线观看 | 欧美一区视频在线 | 色欧美片视频在线观看 | 精品1区2区| 日本不卡一区 | 久久影院一区 | 亚洲欧美日韩电影 | 久久久性色精品国产免费观看 | 一级女毛片| 久久国产一区二区三区 | 国产精品久久久亚洲 | 一区二区日韩 | 综合激情久久 | 免费观看一级毛片 | 国产乱码精品一区二区三区忘忧草 | 91免费观看国产 | 热re99久久精品国99热观看 | 日本精品一区二区在线观看 | av黄色在线 | 欧美精品第三页 | 尤物在线 | 精品一区二区三区四区五区 | 在线看黄免费 | 亚洲精品一区二区网址 | 成人在线免费视频 | 国产乱码精品一区二区三区五月婷 |