成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

手把手教你如何使用Python執行js代碼

開發 后端
各位小伙伴,大家好,這次咱們來說一下關于爬蟲方向的一個知識,Python如何執行js,快來看看吧!!!

 前言

各位小伙伴,大家好,這次咱們來說一下關于爬蟲方向的一個知識,Python如何執行js,快來看看吧!!!

[[337385]]

為什么要引出Python執行js這個問題?

都說術業有專攻,每個語言也都有自己的長處和短處。在爬蟲方向,Python絕對是扛把子,近幾年隨著AI的火爆,需要各種各樣的數據,所以,爬蟲需求也跟著水漲船高起來。

我們做爬蟲的當然是爬的爽,但是估計人家后臺在罵街,畢竟誰都不希望自己的數據被弄走,所以后臺反爬技術也在快速提升,一攻一防就這么在拉鋸著。

現在為了防止反爬,前端使用的反爬技術比較多的是js代碼混淆。

什么是js代碼混淆?

正常代碼

我們現在看一段js代碼,代碼邏輯很簡單,就是拼接時間返回。

 

  1. function formatDate(now) { 
  2.     var now = new Date(1230999938); 
  3.     var year=now.getFullYear(); 
  4.     var month=now.getMonth()+1; 
  5.     var date=now.getDate(); 
  6.     var hour=now.getHours(); 
  7.     var minute=now.getMinutes(); 
  8.     var second=now.getSeconds(); 
  9.     return year+"-"+month+"-"+date+" "+hour+":"+minute+":"+second

運行一下這段代碼,如下圖所示。

 

 

 

 

混淆代碼

我隨便找了個在線的js代碼混淆網站。

js代碼

 

  1. function formatDate(mz1){var KkkGDiH2=new window["\x44\x61\x74\x65"](1230999938);var tsk3=KkkGDiH2['\x67\x65\x74\x46\x75\x6c\x6c\x59\x65\x61\x72']();var YMreyP4=KkkGDiH2['\x67\x65\x74\x4d\x6f\x6e\x74\x68']()+1;var Ozo5=KkkGDiH2['\x67\x65\x74\x44\x61\x74\x65']();var QMYEc$eD6=KkkGDiH2['\x67\x65\x74\x48\x6f\x75\x72\x73']();var JfXVV_Akq7=KkkGDiH2['\x67\x65\x74\x4d\x69\x6e\x75\x74\x65\x73']();var $mP8=KkkGDiH2['\x67\x65\x74\x53\x65\x63\x6f\x6e\x64\x73']();return tsk3+"\x2d"+YMreyP4+"\x2d"+Ozo5+" "+QMYEc$eD6+"\x3a"+JfXVV_Akq7+"\x3a"+$mP8 

上面這個真的不是我瞎寫的,混淆之后就是這樣子的,不信看圖片。

 

 

 

 

可能我們會有個疑問,js代碼都成這玩意了,還能執行嗎? 答案是肯定的。即使js代碼非常亂,但還是可以執行的,結果跟上面的是一樣的。

這就造成了一個問題,我們在做爬蟲時,如果需要,多多少少可能都要研究一下js代碼,然后進行js解密一下,但是,但是,要是代碼都混淆成了這了,還怎么解?

一點邏輯都看不通了,基本上不可用Python按照js邏輯重寫出來了...

很巧,小編也是卡在這里...后來我就想,要是Python能執行js代碼就好了,不用管函數里面的邏輯了,只拿函數返回值就好了。

Python第三方包Execjs

可能是吧,不止我一個人遇到了這種情況,所以大佬們就開發出來這種工具包,用于執行js代碼。

安裝

在安裝之前,需要有node環境,這里就不舉栗子了,下一步下一步就好了。

 

  1. pip3 install PyExecJS 

Execjs用法超級簡單的,幾行代碼。

執行js

注:由于上述js代碼會生成window對象,并不能直接執行成功,需要額外的其他輔助,這里簡單的舉一下其他例子。

正常js代碼

 

  1. function add(x, y) { 
  2.    return x + y; 

Python執行js代碼

 

  1. import execjs 
  2.  
  3. ctx = execjs.compile(""
  4. function add(x, y) { 
  5.   return x + y; 
  6. """) 
  7. print(ctx.call("add", 1, 2)) 

執行結果如下圖所示:

 

混淆js代碼

 

  1. function add(bi1,Pl$2){return bi1+Pl$2} 

Python執行混淆js代碼

 

  1. import execjs 
  2.  
  3. ctx = execjs.compile(""
  4. function add(bi1,Pl$2){return bi1+Pl$2} 
  5. """) 
  6. print(ctx.call("add", 1, 2)) 

執行結果如下圖所示:

 

可以看到,即使再混淆,只要執行的是js代碼,都是沒啥問題的。

上述拼接時間返回的js混淆代碼也是可以執行的,但是它多了一個window對象,需要node安裝jsdom才行,由于網絡設置有問題,實在是下載不了舉例子,實在是抱歉。

或者使用selenium打開游覽器執行再返回也行,當然,速度更慢。

結尾

反爬和爬蟲一直都是一攻一防,以后可能這種情況會更嚴重,但是在Python龐大的生態中總能找到不錯的方案。人生苦短,Python當歌。

責任編輯:華軒 來源: Python爬蟲與數據挖掘
相關推薦

2022-12-07 08:42:35

2021-07-14 09:00:00

JavaFX開發應用

2025-05-07 00:31:30

2021-01-19 09:06:21

MysqlDjango數據庫

2022-07-27 08:16:22

搜索引擎Lucene

2021-09-26 16:08:23

CC++clang_forma

2019-05-05 11:47:09

TypeScript開發Node.js

2021-08-02 07:35:19

Nacos配置中心namespace

2011-01-10 14:41:26

2011-05-03 15:59:00

黑盒打印機

2020-12-08 10:32:15

Python郵件tcp

2024-01-26 08:16:48

Exporter開源cprobe

2023-09-16 18:48:28

代碼邏輯

2020-03-04 09:25:39

Python網絡安全WiFi

2021-02-04 09:00:57

SQLDjango原生

2022-07-22 12:45:39

GNU

2020-05-15 08:07:33

JWT登錄單點

2022-10-30 10:31:42

i2ccpuftrace

2021-03-12 10:01:24

JavaScript 前端表單驗證

2021-12-15 08:49:21

gpio 子系統pinctrl 子系統API
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产不卡在线 | 国产亚洲欧美在线 | 亚洲精品免费观看 | 日本一区二区三区四区 | 天堂一区 | 狠狠干天天干 | 毛片网站在线观看 | www.中文字幕.com | 黄网站在线播放 | 九九热在线视频免费观看 | 一级美国黄色片 | 精品一区二区三区不卡 | 国产免费一区二区三区 | 韩日一区 | 最新中文字幕在线播放 | 午夜视频一区二区 | 日韩欧美精品一区 | 麻豆精品国产91久久久久久 | 免费一区二区三区 | 中文字幕在线视频精品 | 亚洲久久在线 | a黄在线观看| 一区二区日本 | 古装三级在线播放 | 亚洲成人免费 | 欧美性受xxxx白人性爽 | 国产原创视频 | 欧美一二三四成人免费视频 | 日韩欧美大片在线观看 | 欧美一级二级三级视频 | 久久精品一区二区三区四区 | a级在线 | 欧美综合在线观看 | 毛片久久久 | 日韩在线免费电影 | 欧美精品一二区 | 久久精品久久久久久 | 一区二区三区成人 | 色综合久久久久 | 91精品国产一区 | 亚洲国产成人久久综合一区,久久久国产99 |