python寫的web路徑掃描工具
現成的WEB路徑掃描工具頗多,但都不盡如人意,主要是它是根據返回的狀態碼來判斷頁面是否存在的,比如返回200,就認為找到頁面,404則認為頁面不存在。但這里有個問題,返回的狀態碼是服務端可控的,而工具對于狀態碼的判斷規則大都是定死了的,這就使得掃描結果沒有多大價值。
所以抽空寫了個web掃描工具,它的原理是先探測一個肯定不存在的路徑和頁面,/mustnotexistspath/和/mustnotexistspath+ext ,將他兩的返回碼作為頁面不存在的標志,如果與之不同,則頁面可能存在,原理相當簡單,起到了動態判斷的效果。
代碼為:
#!/usr/bin/python
import httplib2import sys
if len(sys.argv) < 3:
print(“written by lanz….”)
print( “Usage: ” + sys.argv[0] + ” host ” + ” .ext”)
print (“Eg: ” + sys.argv[0] + ” http://www.baidu.com .php”)
sys.exit(0)host = sys.argv[1]
ext = sys.argv[2]print(host)
http = httplib2.Http(“.cache”)
response,content = http.request(host)response,content=http.request(host+”/mustnotexistspath/”)
nonpathstatus = response.statusresponse,content=http.request(host+”/mustnotexistspath”+ext)
nonpathextstatus = response.status
print(“NoneExistPathStatus:”,nonpathstatus)
print(“NoneExistFileStatus:”,nonpathextstatus)
f = open ( ‘WebPath.txt’, ‘r’ )
fileList = f.readlines()def subscan(subpath):
for fileLine in fileList:
newline = fileLine.strip()
path = subpath+”/”+newline
response,content= http.request(path,”GET”)
if response.status!=nonpathstatus:
st = str(response.status)
print(st+” : “+path)
subscan(path)
pathext=path + ext
response,content= http.request(pathext,”GET”)
if response.status!=nonpathextstatus:
st = str(response.status)
print(st+” : “+pathext)
subscan(host)
f.close()
效果對比:
使用webtools掃描目錄的結果圖:
使用新代碼得到的效果: