成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="2swsu"><tr id="2swsu"></tr></li>

<optgroup id="2swsu"></optgroup>

<fieldset id="2swsu"><strong id="2swsu"></strong></fieldset>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

徹底理解字符串匹配KMP算法

作者：碼農的荒島求生 2024-07-03 11:23:14

如果下一個字符相同，那么當前位置next數組的值就是n+1。而如果下一個字符不相同，我們繼續查找next[n-1]，然后前一個指針回退，繼續比較下一個位置即可。

大家好，我是小風哥，今天簡單聊聊字符串匹配kmp算法。

字符串匹配是計算機科學中非常基礎的操作，給定兩個字符串a和b，我們需要判斷字符串a是否包含字符串b。

圖片

像你我這樣的普通程序員能想到的最簡單方法是這樣的，用字符串b不斷去匹配每個主串中的子串。

假設給定這樣兩個字符串：

圖片

首先從主串的第一個位置和子串的第一個位置去匹配，我們發現A和B不相同：

圖片

因此主串指針后移一位，子串重新從最第一個字符開始匹配。

圖片

這時我們發現A和C不同，因此匹配失敗。

圖片

主串指針回退到第三個字符，子串重新從第一個字符開始匹配。

圖片

此時B和A又不同，重復上述過程。

這次成功找到多個相同的字符，但最后一個字符匹配失敗：

圖片

按照我們的算法，主串指針需要回退到第5個字符重新匹配。

圖片

這就是你我這種肉體凡胎能想到的算法，時間復雜度是O(mn)，效率低下的原因當然是主串指針需要回退。

然而有三位大神不是這么想的，它們跳出來凡人的思考方式發明了一種極具創意的算法，由于是三個人同時發現，因此這個算法取了三人名字的首字母，這就是著名的kmp算法。

圖片

看到這里相信你就能明白為什么這個算法很難掌握了吧，難是正常的，覺得不難才不正常，如果你能無師自通搞定kmp算法，那么早出生幾十年你也能和大師們并駕齊驅供我等凡夫俗子瞻仰。

廢話不多說，接下來就讓我們領略一下大師的非凡境界。

注意看這個主串指針，大師們思考的第一個問題就是，主串指針是否有必要回退，這是最關鍵最核心的問題。

圖片

讓我們回到剛才部分匹配的示例。

主串指針是否需要需要回退呢？我們思考兩種可能。

第一種可能，即使能匹配成功，匹配成功的起始位置也在主串指針H及以后，在這種情況下主串指針不需要回退。

圖片

第二種可能，匹配成功的起始位置經過主串指針H：

圖片

在這種情況下，主串指針之前的兩個字符A和B一定是成功匹配了的：此時我們只需要比較主串指針H及以后的位置即可。

圖片

只有這么兩種可能。

因此可以看到，主串指針根本就沒有必要回退。

現在我們知道了主串指針不需要回退，那么子串指針該從哪里開始匹配呢？從頭開始嗎？

圖片

注意看我們剛才提到的第二種可能，匹配成功的起始位置經過主串指針H，在這種情況下，主串指針之前的兩個字符A和B一定是成功匹配了的，這意味著什么呢？

圖片

這意味著AB是這個字符串的后綴：

圖片

AB是這個字符串的前綴：

圖片

不要忘了這兩個字符串是成功匹配了的：

圖片

也就是說這是兩個完全相同的字符串，這就意味著AB是成功匹配字符串的相同前后綴。

圖片

這樣子符串指針也不需要回退到起始位置，而是從共同前后綴的下一個位置開始匹配即可。

圖片

而對于部分匹配的子串根本不存在共同前后綴的情況，

圖片

我們直接從子串起始位置進行匹配。

圖片

可以看到，由于主串指針不回退，這大幅提高了算法的效率。

想要實現這樣的算法，關鍵是怎樣計算出部分匹配子串的共同前后綴。

因此我們來到了第二個核心問題。

我們以ABCDAB為例來講解。

這是長度為1的前后綴，這是長度為2的前后綴，以此類推。

圖片

可以看到，在所有的前后綴中，相同前后綴的最大長度是2。

圖片

我們記下來。

實際上我們需要把所有子串的相同前后綴都計算出來。

對于ABCDA這個子串來說，相同前后綴長度是1，因為兩個A是相同前后綴。

圖片

而對于ABCD這個子串來說，相同前后綴的長度是0，也就是沒有相同的前后綴。

其它也一樣。

這樣我們就到了一個數組，通過查找這個數組我們能知道任意子串的共同前后綴長度。

圖片

這個數組在很多資料中被稱之為next數組。

有了next數組就簡單了。

假設此時我們發現兩個指針指向的字符不同，接下來只需要簡單查找next數組：

圖片

發現已匹配部分的相同前后綴長度是2：

圖片

因此主指針不動，子串指針移動到相同前后綴的下一個位置繼續去匹配即可。

圖片

可以看到，只要我們能得到next數組，就可以在線性時間復雜度內解決問題。

這里，我們來到了第三個核心問題，那就是該怎樣高效計算出next數組。

假設此時我們已經計算出了這個子串的共同前后綴，也就是長度為n的這兩個部分。

圖片

接下來計算下一個位置的最長前后綴，我們只需要分別后移兩個指針，然后比較字符是否相等，這里有兩種可能。

第一種可能是接下來的字符相同，那么這個子串的最長相同前后綴的長度就是n+1。

圖片

然后寫到next數組即可，這很好理解。

圖片

但是如果下一個位置的字符不相等該怎么辦呢？

注意接下來是整個算法最核心的，也是最具技巧的地方。

如果接下來的兩個字符不相等，那么前面的這部分絕無可能形成最長前后綴。

圖片

因此我們只能找一個更短的。

圖片

如果能找到一個更短的，這就意味著這兩部分會形成一個共同前后綴。

圖片

然后我們繼續比較下一個字符就可以了，這就回到最初的問題。

那么這兩部分相同意味著什么呢？

不要忘了紅色部分是我們之前找到一個共同前后綴，也就是說紅色部分的子串完全相同。

圖片

而現在這兩個子串也相同，這就意味著這兩個更小的子串其實是紅色部分子串的最長前后綴。

圖片

不要忘了，此時我們的指針已經來到了這里，前面這部分的next數組已經計算出來了。

圖片

通過查next數組，我們可以快速得到更短前后綴的長度。

既然紅色部分的長度是n，那么更短前后綴的長度其實就是next[n-1]。

圖片

再來看下，紅色部分的長度是n，那么更短前后綴的長度是next[n-1]。

也就是這個位置。

圖片

這就是計算next數組源代碼中n=next[n-1]這句話的含義。

圖片

現在我們再來看一遍整個過程。

此時兩個字符的長度不等，那么我們只需要簡單查一下next[n-1]：

圖片

這就是更短的前后綴長度，假設是4。

圖片

此時前一個指針回退到位置4，繼續比較下一個字符即可。

圖片

如果下一個字符相同，那么當前位置next數組的值就是n+1。

而如果下一個字符不相同，我們繼續查找next[n-1]，然后前一個指針回退，繼續比較下一個位置即可。

圖片

這就是完整的kmp算法實現，可以看到整個代碼實際上只有30多行。

如果你能在50多年前寫出這幾行代碼，你也能和它們并列，在計算機科學史上會留下你的一筆。

圖片

好啦，以上就是本期全部內容。

責任編輯：武曉燕來源：碼農的荒島求生

KMP 算法字符串

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：一区二区三区在线观看免费视频 | 国产精品久久国产愉拍 | 自拍偷拍小视频 | 亚洲午夜在线 | 五月激情综合 | www312aⅴ欧美在线看 | 免费在线观看一区二区 | 欧美福利在线 | 天天操天天天干 | 久久久久久国产免费视网址 | 亚洲欧美中文字幕 | 欧美中文视频 | 国产精品3区 | 欧洲成人免费视频 | 亚洲精品女人久久久 | 中文字幕综合 | 国产一级在线视频 | 在线看无码的免费网站 | 九七午夜剧场福利写真 | 中文字幕日韩一区二区 | 黄色大片免费看 | 免费麻豆视频 | 日本久久黄色 | 国产2区 | 亚洲日韩第一页 | www.久久艹 | 中文字幕在线一区二区三区 | 一区二区三区四区日韩 | 男人天堂视频在线观看 | 欧美一区二区三区视频 | 国产日韩欧美一区 | 91p在线观看 | 日韩欧美在线观看 | 免费一二区 | 日本午夜一区二区三区 | 无码日韩精品一区二区免费 | 欧美日韩成人在线 | 538在线精品 | 国产一区视频在线 | 一级黄色影片在线观看 | 亚洲一区精品在线 |

<ul id="gq0a2"><tr id="gq0a2"></tr></ul>

<fieldset id="gq0a2"><optgroup id="gq0a2"></optgroup></fieldset>

<s id="gq0a2"><input id="gq0a2"></input></s>