成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

詳談如何實現PHP HTML截取代碼

開發 后端
PHP HTML截取代碼的方法并不是很難,只要我們了解了其中的含義,就能靈活運用這一方法在其他地方。希望本文涉及的內容對又需要的朋友有所幫助。

我們今天將為大家帶來的是關于PHP HTML截取代碼的主要實現方式,希望初學者能通過本文介紹的內容對這方面有一個深刻的認識。

#t#需求:將一段文字截取一定的物理長度顯示,注意,要截取的不是字符串的字節數,UFT-8 的編碼中文字符是3個字節或者4個字節的,而顯示的時候中文會占兩個字符的長度,英文字符只占一個,全角的時候又有不同。

而且給的數據是HTML代碼串,比如這樣:

  1. < div class=”aaa”>
  2. < a href=”/aaa.php?id=1>
  3. 張三
  4. < /a> 
  5. 評論了 
  6. < a href=”/aaa.php?id=444>
  7. 李四
  8. < /a> 
  9. 分享的 
  10. < a href=”bbb.html”>
  11. 一篇文章文章一長串的東西
  12. < /a>
  13. < /div> 

PHP HTML截取代碼的時候是要截取 div 標簽內部的東西,而且要保留HTML標簽,只是對其中的文字做處理。比如我可能只是截取到“李四”的“李”字,但是如果就這樣放到前端的話,“李四”前面的 a 標簽是沒有閉合的,所以截取之后要保證HTML的語法正確。
這個問題確實不太好搞,讓我郁悶了兩天。請注意,這只是一個字符串,只不過內容是HTML代碼,是沒有什么DOM的。如果是在前端處理就好辦了,直接DOM獲取,然后對里面的節點進行處理,***把innerHTML 之類的東西輸出就搞定了。現在可不行了,得換個思路。同事的思路是這樣的:

遍歷字符串的每一個字符。設置一個標記,碰到標簽開始的標記< 就置為1,接下來的字符都不記數,然后碰到>之后再開始計數。對標簽內部的字符串處理的時候,還要先判斷當前字符的編碼是不是可能是中文,一般來說PHP中 UTF-8 編碼的中文字符的長度都是3,所以如果碰到是中文字符編碼,就要跳過兩個不記數……說到這里我自己頭已經開始大了。個人認為這種方法很不爽,首先這種精致的邏輯不太容易控制,而且 UFT-8 編碼下中文產生的長度有可能是3個或4個 所以代碼的嚴密性值得懷疑。

我個人的思路是,用 Tidy 來搞(具體用法請看PHP手冊吧)。昨天研究了一下那個 Tidy ,發現這個東西還是挺好用的。首先,把這個字符串轉換成 Tidy 對象,這樣:

  1. $tidy = tidy_parse_string
    ($str, array(), ‘utf8′);   
  2. // ***一個是設置編碼的,注意,
    這里是utf8 ,不是utf-8,沒有中間那個連線。 

然后獲取$tidy中的 body(因為轉換之后$tidy會自動加上<head><body>等標簽):
$body = tidy_get_body($tidy);
這個時候你可以用 var_dump 看一些 $body 的結構,會發現它把每個標簽都變成了一個對應的對象,里面有相應的屬性。舉例來說,比如 <a href=”#”>sdf</a> ,這么一條語句對應的一些屬性有:

name=>”a”
value => “<a href=”#”>sdf</a>”
child=> array{[0]=>一個文本節點對象,value是 sdf}
attribute=array{”href”=>”#”}
…..其他屬性

可以看到,我們其實是可以單獨去處理 a 標簽對應節點下面的文字節點的值的,那樣PHP HTML截取代碼就不會破壞任何HTML完整性。原來我以為改變 a 標簽中文字節點的值之后, a 標簽的value也會跟著改變,那樣我直接返回a標簽對應節點的value就OK了,沒想到不是那個樣子,哎,所以處理過其中的文字之后還是要自己拼出新的HTML。
知道了Tidy對象的結構之后,一切就好辦了,只要遍歷所有的節點,對于本需求來說,就是找到那個 div 標簽,然后開始處理里面的節點。代碼如下:

  1. if(mb_strwidth($subchild->value, 
    ‘utf-8′) 
    >= $len)   
  2. {   
  3. $subchild->value = mb_strimwidth
    ($subchild->value, 0, $len, ‘…', ‘utf-8′);   
  4. $trimed_str .= $subchild->value;   
  5. break;   
  6. }   
  7. else   
  8. {   
  9. $trimed_str .= $subchild->value;   
  10. $len = $len - mb_strwidth($subchild->
    value, ‘utf-8′);   
  11. }  


里面的$subchild 就是一個子節點。注意,這里使用了 mb_strwidth 來獲取字符串長度。嚴重推薦一下這個 mb_strwidth,很好用,它會把中文當作兩個字符長度處理,正好符合這里的需求!而且PHP HTML截取代碼的時候用到了 mb_strimwidth,這個函數也會把中文當作兩個字符長度處理,mb_ 開頭的函數真是好用啊。

具體的PHP HTML截取代碼代碼我就不寫出來了,因為是針對一個需求寫的,沒做成通用的形式。哪天我有時間做成通用的再發布一下。
另外,可惜FireFox不支持 text-overflow 屬性,不然也不用后臺那么辛苦地去截斷了。如果大家有更好的方法,歡迎提出!不勝感激。

責任編輯:曹凱 來源: jb51.net
相關推薦

2009-11-17 15:13:28

PHP數組

2009-11-18 14:11:10

PHP數組變量

2009-05-26 08:51:38

HTML 5FlashOpera

2009-11-16 17:07:58

PHP二維數組

2009-11-26 16:43:11

PHP截取中文字符串

2010-07-27 15:09:31

2009-11-18 11:10:16

PHP WEB服務器

2010-04-06 09:44:40

CentOS系統

2009-11-16 16:17:45

PHP數組排序

2009-11-16 10:40:02

PHP上傳文件代碼

2010-08-04 11:37:44

PHP NFS

2023-03-13 09:22:28

WEB 集群共享靜態資源

2009-12-01 14:33:06

PHP生成html文件

2017-08-16 16:00:05

PHPcontainer依賴注入

2009-02-23 09:11:21

2009-12-02 19:08:19

PHP跳轉代碼

2011-05-17 14:29:29

Dijkstra

2009-11-23 10:31:25

PHP使用JSON

2009-11-30 18:59:52

PHP數組排序

2015-09-21 15:31:05

php實現驗證碼
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费国产一区二区 | 二区av| 国产精品日韩在线观看一区二区 | 欧美精品一区二区在线观看 | 观看毛片 | 欧美video| 日韩精品一区二区三区中文字幕 | 亚洲精品久久久久久久久久久久久 | 欧美日韩在线一区二区 | 国产精品成人av | 精品在线一区 | www.亚洲| 中文日韩在线视频 | 91精品国产综合久久香蕉922 | 日韩a视频 | 琪琪午夜伦伦电影福利片 | 日韩a | 中文字幕成人网 | 欧美成人激情视频 | 黄色免费在线网址 | 日韩av黄色| 五月婷婷在线视频 | 亚洲成人久久久 | 日韩成人在线网站 | 韩国电影久久 | 黑人久久 | 鸳鸯谱在线观看高清 | 日韩av成人 | 国产精品美女久久久 | 在线成人免费观看 | 亚洲一区视频在线播放 | 亚洲精品麻豆 | 看片91 | 日日操视频 | 人人干在线视频 | 欧美一区二区三区在线观看视频 | 日韩精品在线一区 | 欧美国产日韩在线观看成人 | 99久久精品国产一区二区三区 | 久久免费高清 | 日韩和的一区二区 |