成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

爬蟲新利器:揭秘 Github 火爆的開源 IP 代理池秘密!

開源 網絡
如果你的IP被攔截,別急,可以隨機換成另一個代理IP地址,輕松繼續完成訪問請求。今天,就讓我們一起來簡單了解一下IP代理池的安裝與使用,掌握隱藏IP的小技巧。

遇到網頁爬取、漏洞挖掘或滲透測試時,常常碰到請求被攔截的煩惱,導致任務中斷。而為了繼續發送請求數據,代理池技術應運而生。它就像一個神奇的「池子」,只需請求代理池,就能得到一個代理IP地址。如果你的IP被攔截,別急,可以隨機換成另一個代理IP地址,輕松繼續完成訪問請求。今天,就讓我們一起來簡單了解一下IP代理池的安裝與使用,掌握隱藏IP的小技巧!

最近在GitHub上發現了一個十分優秀的項目,名為proxy_pool[1]的免費代理池工具。該項目完全開源,一直有著積極的開發者維護,活躍度也相當高。

項目介紹

proxy_pool項目采用Python語言開發,主要實現了以下功能:

  • 定時抓取免費代理網站,具有簡易可擴展性。
  • 使用Redis對代理進行存儲,并對代理的可用性進行排序。
  • 定時進行測試和篩選,清除不可用的代理,保留可用的代理。
  • 提供代理API,可以隨機獲取經過測試的可用代理。

目前,該項目已經斬獲了5.3K顆星(GitHub Star),受到廣泛關注和認可。

部署方式

您可以通過兩種方式來運行代理池。一種方式是使用Docker(推薦),另一種方式是通過常規方式運行。具體要求如下:

1.Docker

如果使用 Docker,則需要安裝如下環境:

  • Docker
  • Docker-Compose

安裝方法自行搜索即可。 官方 Docker Hub 鏡像:germey/proxypool[2]

2.常規方式

常規方式要求有 Python 環境、Redis 環境,具體要求如下:

  • Python>=3.6
  • Redis

Docker 運行

如果已經安裝好了Docker和Docker-Compose,只需一條命令即可輕松運行。

docker-compose up

運行結果類似如下:

redis        | 1:M 19 Feb 2020 17:09:43.940 * DB loaded from disk: 0.000 seconds
redis        | 1:M 19 Feb 2020 17:09:43.940 * Ready to accept connections
proxypool    | 2020-02-19 17:09:44,200 CRIT Supervisor is running as root.  Privileges were not dropped because no user is specified in the config file.  If you intend to run as root, you can set user=root in the config file to avoid this message.
proxypool    | 2020-02-19 17:09:44,203 INFO supervisord started with pid 1
proxypool    | 2020-02-19 17:09:45,209 INFO spawned: 'getter' with pid 10
proxypool    | 2020-02-19 17:09:45,212 INFO spawned: 'server' with pid 11
proxypool    | 2020-02-19 17:09:45,216 INFO spawned: 'tester' with pid 12
proxypool    | 2020-02-19 17:09:46,596 INFO success: getter entered RUNNING state, process has stayed up for > than 1 seconds (startsecs)
proxypool    | 2020-02-19 17:09:46,596 INFO success: server entered RUNNING state, process has stayed up for > than 1 seconds (startsecs)
proxypool    | 2020-02-19 17:09:46,596 INFO success: tester entered RUNNING state, process has stayed up for > than 1 seconds (startsecs)

可以看到 Redis、Getter、Server、Tester 都已經啟動成功。 這時候訪問http://localhost:5555/random 即可獲取一個隨機可用代理。

當然你也可以選擇自己 Build,直接運行如下命令即可:

docker-compose -f build.yaml up

使用

成功運行之后可以通過http://localhost:5555/random 獲取一個隨機可用代理。

可以用程序對接實現,下面的示例展示了獲取代理并爬取網頁的過程:

import requests

proxypool_url = 'http://127.0.0.1:5555/random'
target_url = 'http://httpbin.org/get'

def get_random_proxy():
    """
    get random proxy from proxypool
    :return: proxy
    """
    return requests.get(proxypool_url).text.strip()

def crawl(url, proxy):
    """
    use proxy to crawl page
    :param url: page url
    :param proxy: proxy, such as 8.8.8.8:8888
    :return: html
    """
    proxies = {'http': 'http://' + proxy}
    return requests.get(url, proxies=proxies).text


def main():
    """
    main method, entry point
    :return: none
    """
    proxy = get_random_proxy()
    print('get random proxy', proxy)
    html = crawl(target_url, proxy)
    print(html)

if __name__ == '__main__':
    main()

運行結果如下:

get random proxy 116.196.115.209:8080
{
  "args": {},
  "headers": {
    "Accept": "*/*",
    "Accept-Encoding": "gzip, deflate",
    "Host": "httpbin.org",
    "User-Agent": "python-requests/2.22.0",
    "X-Amzn-Trace-Id": "Root=1-5e4d7140-662d9053c0a2e513c7278364"
  },
  "origin": "116.196.115.209",
  "url": "https://httpbin.org/get"
}

可以看到成功獲取了代理,并請求 httpbin.org 驗證了代理的可用性。

寫到最后

在網絡數據獲取和安全測試中,代理池是一個非常有用的工具,能夠幫助用戶有效地管理和利用代理資源,提高工作效率。通過本文的介紹,希望您對代理池的原理和使用有了更深入的了解。無論是對于開發者還是安全工程師來說,掌握代理池的使用技巧都將成為您工作中的利器。

Reference:

  • [1]proxy_pool:https://github.com/Python3WebSpider/ProxyPool
  • [2]germey/proxypool:https://hub.docker.com/r/germey/proxypool
責任編輯:趙寧寧 來源: 攻城獅成長日記
相關推薦

2019-06-18 08:27:37

Squid代理服務器IP代理池

2015-01-22 16:34:54

Github國產開源項目

2009-11-06 12:29:23

2011-03-02 16:04:16

2016-06-30 16:52:23

開源

2019-06-14 10:30:18

程序員項目開源

2013-07-02 09:58:04

2017-05-16 09:56:44

2021-03-29 12:51:04

GitHub秘密掃描計劃PyPl

2012-02-22 22:21:15

nagios開源

2020-02-27 16:17:31

代碼規范codegithub

2021-09-15 10:43:08

Python程序開源工具

2018-01-30 10:34:24

爬蟲HTTP過程

2015-11-24 16:59:13

2019-06-12 10:18:03

GitHub代碼開發者

2011-07-29 12:25:36

2013-08-09 10:41:58

2025-01-14 14:54:57

2017-09-08 15:04:10

jQuery爬蟲PyQuery

2022-06-27 09:23:14

爬蟲frida rpc加密
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中国一级特黄真人毛片免费观看 | 九九色综合 | 91在线电影| 91久久精品一区二区二区 | 色资源在线观看 | 成人高潮片免费视频欧美 | 国产欧美精品 | 超碰在线97国产 | 午夜视频免费在线观看 | 精品久久久久久亚洲精品 | 国产电影一区 | 国产情侣久久 | 日韩在线中文 | 国产精品免费一区二区三区四区 | 亚洲协和影视 | 久久久91精品国产一区二区三区 | 伊人伊成久久人综合网站 | 国产精品高潮呻吟久久av野狼 | 欧美一级免费 | 欧美日韩精品久久久免费观看 | 日本超碰| 国产成人在线观看免费 | 日本不卡免费新一二三区 | 自拍视频一区二区三区 | av性色全交蜜桃成熟时 | 欧产日产国产精品v | 亚洲精品一区在线观看 | 欧美性猛交一区二区三区精品 | 国产精品jizz在线观看老狼 | 99热这里 | 精品视频一区二区 | 国产日韩一区二区三免费 | 久久久av中文字幕 | 国产高潮好爽受不了了夜夜做 | 一区二区三区日 | 欧美精品国产精品 | 毛片免费观看 | 国产色婷婷精品综合在线播放 | 成人国产在线视频 | 色狠狠一区| 国产一级一级 |