成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺析基于ASP.NET網頁的C#數據采集

開發 后端
在好奇的動力下,開始瘋狂的查閱以及學習關于網頁采集,數據采集等相關信息。不過網上大部都是ASP的和PHP的,關于.NET的很少。無奈之下只要硬著頭皮學習。這里簡單介紹下基于ASP.NET網頁的C#數據采集。

經過幾天的努力,最終還是給我研究出來了。心里還是挺高興的襖。其實網頁采集也沒有用到什么高深的技術,都是些普普通通的技術,只不過效果比較神奇,就會讓人感覺到整個都比較深奧,如果你想學習.NET的數據采集,以及思路,那么請看完。

C#數據采集大體可以分為兩部曲:

一部曲:

因為要采集別人網頁上的內容,所有我們先要得到要采集網頁上的html代碼,獲取html代碼還是比較簡單。利用WebClient的DownloadData(url)得帶byte數組,然后在轉換成string字符串。

具體代碼如下:

  1. ///<summary>  
  2. ///獲取網頁源代碼  
  3. ///</summary>  
  4. ///<paramname="url">URL路徑</param>  
  5. ///<paramname="encoding">編碼方式</param>  
  6. publicstringGetHTML(stringurl,stringencoding)  
  7. {  
  8. WebClientweb=newWebClient();  
  9. byte[]buffer=web.DownloadData(url);  
  10. returnEncoding.GetEncoding(encoding).GetString(buffer);  

二部曲:

現在我們得到了目標網頁的html代碼,那么我們就開始時得扣取我們想要的數據。扣取數據無疑就要用到強大的正則表達式了。利用正則表達式的匹配來獲取我們要的內容,這里可以過濾掉制定的html代碼,剩下的就是內容了。

C#數據采集具體代碼如下:

  1. Htmlhtml=newHtml();  
  2. //得到指定頁面的html代碼,***個參數為url(貌似都知道),第二個是目標網頁的編碼集  
  3. stringhtmlCode=html.GetHTML("http://gvod.tom59.cn/List.asp?ClassId=3","gb2312");  
  4. //正則表達式  
  5. Regexregexarticles=newRegex("<td\\s+height=\"\\d+\"><a\\s+href=\".+DataId=(?<id>\\d+)\"\\s+target=\"_blank\">(?<title>.+)</a>.*</td>");  
  6. //所有匹配表達式的內容  
  7. MatchCollectionmarticles=regexarticles.Matches(htmlCode);  
  8. ///遍歷匹配內容  
  9. foreach(Matchminmarticles)  
  10. {  
  11. Console.Write("標題:"+m.Groups["title"].Value+"\n");  
  12. Console.Write("id:"+m.Groups["id"].Value+"\n");  
  13. Console.Write("\n");  

以上就是C#數據采集的核心代碼,關于正則表達式我在這里就不詳細講解了(其實正則表達式我也是菜鳥哈)。

C#數據采集結語:

大部分看似很神奇的功能,都是我們平常所用的功能拼加起來的,其實仔細分析起來也沒有多大的難度,只要能夠認真研究。

本文來自畫上句號新浪博客文章《asp.net/C#網頁數據采集

【編輯推薦】

  1. C#反射方法學習總結
  2. 淺談C#測量cpu性能
  3. C#遠程計算機的一些理論知識
  4. 淺析C# Static修飾
  5. C#轉換農歷的簡單方法
責任編輯:彭凡 來源: 新浪博客
相關推薦

2009-08-04 10:02:36

中國站長站

2009-07-29 10:52:09

數據采集程序ASP.NET技巧

2009-07-27 15:34:11

MembershipASP.NET

2009-07-27 10:18:12

TypeResolveASP.NET

2009-08-05 18:36:12

ASP.NET Che

2009-07-24 13:41:15

ASP.NET AJA

2009-08-03 18:35:51

ASP.NET數據緩存

2009-07-31 12:43:59

ASP.NET MVC

2009-08-05 15:50:13

ASP.NET優點

2009-07-22 18:03:00

ASP.NET ASP

2009-08-20 10:13:49

ASP.NET和C#的

2009-08-10 13:32:15

ASP.NET TimASP.NET組件設計

2009-08-03 14:33:02

.NET平臺c#ASP.NET

2009-07-31 18:12:58

ASP.NET數據綁定

2009-07-29 14:12:45

ASP.NET tra

2009-07-28 17:36:21

ASP.NET數據庫連

2009-08-04 14:56:34

ASP.NET數據類型

2009-07-28 10:59:13

ASP.NET IIS

2009-07-31 09:57:47

ASP.NET數據庫緩

2009-08-07 15:34:15

ASP.NET數據綁定
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜看电影在线观看 | 欧美电影网| 久久久九九九九 | 亚洲444eee在线观看 | 日韩精品一区二区三区视频播放 | 久久人体视频 | 精品福利一区 | 精品人伦一区二区三区蜜桃网站 | 久久专区 | 精品欧美一区免费观看α√ | 欧美性久久 | 欧美一区二区三区在线观看 | 精品亚洲视频在线 | 成人三级视频 | 久久精品国产一区二区三区不卡 | 亚洲a级| 精品入口麻豆88视频 | 日韩欧美在线精品 | 久久国内精品 | 五月婷婷视频 | 久久成人人人人精品欧 | 精品日韩一区二区 | 美女午夜影院 | 亚洲国产福利视频 | 中文字幕一区二区在线观看 | 三级视频国产 | 国产精品高潮呻吟久久久久 | 国产日韩一区二区三区 | 欧美激情在线播放 | 亚洲一区二区三区免费在线观看 | 国产精品久久毛片av大全日韩 | 99免费精品视频 | 日韩欧美国产一区二区 | 91免费在线 | 日本二区 | 国产精品一区二区在线 | 中文字幕在线视频免费视频 | 国产精品久久久久久久久免费高清 | 亚洲成人精品在线 | 午夜av成人| 久久久免费电影 |