成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

《前端算法實戰》使用解釋器模式實現Xpath路徑的算法

開發 前端
對于一種語言,我們給出其文法表示形式(一種語言中的語法描述工具,用來定義語言的規則),并定義一種解釋器,通過這種解釋器來解釋語言中定義的句子。

前端領域里基于javascript的設計模式和算法有很多,在很多復雜應用中也扮演著很重要的角色,接下來就介紹一下javascript設計模式中的解釋器模式,并用它來實現一個獲取元素Xpath路徑的算法。??

正文

1、解釋器模式

對于一種語言,我們給出其文法表示形式(一種語言中的語法描述工具,用來定義語言的規則),并定義一種解釋器,通過這種解釋器來解釋語言中定義的句子。

 定義聽起來可能比較抽象,舉個例子比如我們常見的網站多語言,要實現多語言我們首先要預定語言的類型,提前設計不同語言的語料庫,然后我們會根據配置和統一的變量規則來映射到不同語言。

2、元素的Xpath路徑

XPath 用于在 XML 文檔中通過元素和屬性進行導航。雖然XPath 是用來查找XML節點,但同樣可以用來查找HTML文檔中的節點,因為HTML和XML結構類似。這里我們只考慮html,即元素在html頁面中所處的路徑。

那么如何快速獲取元素的Xpath路徑呢?其實也很簡單,我們打開谷歌調試工具:

圖片

選中Copy XPath即可復制元素的Xpath路徑。格式可能長這樣:

//*[@id="juejin"]/div[2]/main/div/div[1]/article/div[1]

獲取元素Xpath路徑的應用場景很多,比如我們經常使用的python爬蟲,利用爬蟲框架可以通過Xpath路徑很方便額控制頁面中的某個dom節點,進而獲取想要的數據和元素;又比如我們通過發送元素的Xpath路徑給后端,后端可以統計某一功能的使用情況和交互數據;又比如分析用戶在網站中瀏覽的熱力分布圖,路徑畫像等等。

3、js實現獲取元素的Xpath路徑

在實現之前,首先我們分析一下Xpath路徑的結構,比如我們有一個頁面,元素span的結構如下:

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<meta http-equiv="X-UA-Compatible" content="ie=edge">
<title>Document</title>
</head>
<body>
<div>
<span>我是徐小夕</span>
</div>
</body>
</html>

那么我們的Xpath路徑可能長這樣:

HTML/BODY|HEAD/DIV/SPAN

 從上面可以看出,我們的最右邊一個元素都是目標元素,而最左邊第一個元素都是最外層容器。要完成這個過程首先我們要通過元素的parentNode來獲取當前元素的父元素,直到找到最頂層位置。但我們還需要注意的一點是,每找到上一層我們還要遍歷該元素前面的兄弟元素previousSibling,如果這個兄弟元素名字和它后面的元素名字相同,則在元素名上+1.

 第一步我們先實現一個遍歷同級兄弟元素的方法getSameLevelName:

// 獲取兄弟元素名稱
function getSameLevelName(node){
// 如果存在兄弟元素
if(node.previousSibling) {
let name = '', // 返回的兄弟元素名稱字符串
count = 1, // 緊鄰兄弟元素中相同名稱元素個數
nodeName = node.nodeName,
sibling = node.previousSibling;
while(sibling){
if(sibling.nodeType == 1 && sibling.nodeType === node.nodeType && sibling.nodeName){
if(nodeName == sibling.nodeName){
name += ++count;
}else {
// 重制相同緊鄰節點名稱節點個數
count = 1;
// 追加新的節點名稱
name += '|' + sibling.nodeName.toUpperCase()
}
}
sibling = sibling.previousSibling;
}
return name
}else {
// 不存在兄弟元素返回''
return ''
}
}

第二步,遍歷文檔樹。

// XPath解釋器
let Interpreter = (function(){
return function(node, wrap){
// 路徑數組
let path = [],
// 如果不存在容器節點,默認為document
wrap = wrap || document;
// 如果當前節點等于容器節點
if(node === wrap) {
if(wrap.nodeType == 1) {
path.push(wrap.nodeName.toUpperCase())
}
return path
}
// 如果當前節點的父節點不等于容器節點
if(node.parentNode !== wrap){
// 對當前節點的父節點執行遍歷操作
path = arguments.callee(node.parentNode, wrap)
}
// 如果當前節點的父元素節點與容器節點相同
else {
wrap.nodeType == 1 && path.push(wrap.nodeName.toUpperCase())
}
// 獲取元素的兄弟元素的名稱統計
let siblingsNames = getSameLevelName(node)
if(node.nodeType == 1){
path.push(node.nodeName.toUpperCase() + sublingsNames)
}
// 返回最終的路徑數組結果
return path
}
})()

有了這兩個方法,我們就可以輕松獲取元素的XPath路徑啦,比如:

let path = Interpreter(document.querySelector('span'))
console.log(path.join('/'))

這樣會返回開篇的一樣的數據結構了.如:HTML/BODY|HEAD/DIV/SPAN。

本文轉載自微信公眾號「趣談前端」,可以通過以下二維碼關注。轉載本文請聯系趣談前端公眾號。

責任編輯:姜華 來源: 趣談前端
相關推薦

2021-10-30 20:49:24

算法 Xpath路徑

2024-06-05 09:41:41

2014-11-11 15:46:54

MapReduce算法

2020-11-09 08:20:33

解釋器模式

2023-05-15 08:51:46

解釋器模式定義

2013-04-23 09:31:52

SQL Server

2021-07-07 10:31:19

對象池模式解釋器模式設計模式

2020-12-22 08:56:51

JavaScript數據結構前端

2010-04-21 08:38:18

解釋器模式PHP設計模式

2017-01-05 15:13:03

Java數組算法解釋

2020-10-13 14:27:11

算法可視化路線

2022-01-19 08:21:12

設計裝飾器模式

2017-05-26 11:00:38

Python算法

2023-04-11 08:00:00

PythonOtsu閾值算法圖像背景分割

2020-09-16 12:23:37

TypeScript

2023-08-01 07:24:05

2023-04-11 08:54:57

字符串匹配算法

2021-09-30 09:58:14

路徑總和二叉樹

2011-05-17 13:58:37

最短路徑

2023-03-07 16:48:54

算法可解釋性
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲三区视频 | av 一区二区三区 | 在线免费观看毛片 | 两性午夜视频 | 色综合99 | 国产欧美精品一区二区色综合朱莉 | 久久精品国产一区 | 99久久婷婷国产精品综合 | 精品国产伦一区二区三区观看说明 | 麻豆av在线 | 中文字幕 国产 | 激情毛片| 欧美久久国产精品 | 一区二区欧美在线 | av综合站 | av二区三区| 老司机67194精品线观看 | 精品一区久久 | 亚洲精品99999 | 欧美一区二区三区,视频 | 九九热精| 欧美激情一区二区三区 | 狠狠狠色丁香婷婷综合久久五月 | 毛片一区 | 91精品成人久久 | 国产黄色一级片 | 精品日韩一区 | 亚洲午夜小视频 | 成人一区二区三区 | 91亚洲国产成人久久精品网站 | 色综合久久久久 | 精品亚洲二区 | 免费艹逼视频 | 国产精品一区二 | 亚洲欧美另类在线观看 | 国产黄色精品在线观看 | av在线电影网站 | www亚洲精品 | 日韩福利 | 国产精品国产三级国产aⅴ入口 | 国产一区免费 |