成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Java獲取URL鏈接的文件類型

開發 后端
在寫網絡爬蟲的時候,需要根據鏈接來獲取文件類型,將內容正確存儲。之前我都是根據鏈接的后綴來判斷的。URLConnection提供了兩種方法可以猜測數據的MIME類型。詳細請看下文

在寫網絡爬蟲的時候,需要根據鏈接來獲取文件類型,將內容正確存儲。之前我都是根據鏈接的后綴來判斷的,比如:

http://img12.360buyimg.com/da/20120330/88_31_ZySDre.jpg

這個鏈接指向的文件就是個jpg文件。但是后來發現有諸如

http://jprice.360buyimg.com/getSkuPriceImgService.action?skuId=1850001109&origin=1&webSite=1&type=1的鏈接,這招就不靈了。后來谷歌百度了一下也沒發現解決辦法。后來機緣巧合在Java Network Programming上找到了一個辦法:

URLConnection class provides two static methods to help programs figure out the MIME type of some data; you can use these if the content type just isn't available or if you have reason to believe that the content type you're given isn't correct。

就是說URLConnection提供了兩種方法可以猜測(根據實測結果,這個猜測是相當的準)數據的MIME類型。

第一個是:

  1. public static String guessContentTypeFromName(String name) 

這個方法根據URL文件部分的后綴名來判斷類型,跟之前我的方法一樣。這個不能解決上面那個問題。

第二個是:

  1. public static String guessContentTypeFromStream(InputStream in)  

這個方法是根據流的前面幾個字節來判斷類型,這個就不需要文件后綴名了,完全可以解決上面那個問題。

測試代碼如下:

  1. BufferedInputStream bis = null;  
  2. HttpURLConnection urlconnection = null;  
  3. URL url = null;          
  4.         url = new URL(strUrl);  
  5.     urlconnection = (HttpURLConnection) url.openConnection();  
  6.     urlconnection.connect();  
  7. bis = new BufferedInputStream(urlconnection.getInputStream());  
  8.     System.out.println("file type:"+HttpURLConnection.guessContentTypeFromStream(bis)); 

原文鏈接:http://www.cnblogs.com/lisperl/archive/2012/05/21/2511224.html

責任編輯:林師授 來源: lisperl的博客
相關推薦

2010-03-10 09:27:36

Linux鏈接文件類型

2021-02-05 08:03:52

Java

2010-01-05 15:32:33

2010-03-01 15:34:38

Linux文件類型

2010-01-12 11:37:06

Linux常見文件

2009-10-21 10:50:59

Linux文件類型

2017-06-09 06:14:41

2019-04-12 14:26:17

Linux命令文件

2009-11-16 12:17:46

PHP上傳文件類型

2010-05-21 10:02:56

2011-06-01 10:48:28

Android系統

2010-04-02 13:15:01

Oracle跟蹤

2019-01-14 09:20:35

Linux類型文件

2010-05-25 17:01:44

2009-08-12 16:44:13

.NET文件類型

2023-12-04 15:42:10

類型Linux

2009-07-20 18:06:26

ASP.NET限制上傳

2024-08-26 12:18:07

Python代碼存根

2019-08-25 23:57:00

命令行Linux移動文件

2013-05-31 10:36:56

ASP.net文件上傳
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 蜜桃免费一区二区三区 | 日本涩涩视频 | 久草免费在线视频 | 欧美日韩三级 | 夜夜草视频 | 能看的av | 天天干视频网 | 亚洲在线电影 | 免费在线视频一区二区 | 久久免费视频在线 | 久久久av| 亚洲国产成人精品女人久久久 | 日韩av在线中文字幕 | 久久精品视频一区二区三区 | 精品国产免费一区二区三区五区 | 91国产在线视频在线 | 亚洲一区二区在线免费观看 | 在线一区二区三区 | 一区二区中文 | 国产中文字幕av | 精品久久久久久久久久久久久久 | 日日av | 成年免费大片黄在线观看岛国 | 日本中文字幕一区 | 精品国产鲁一鲁一区二区张丽 | 亚洲高清一区二区三区 | 亚洲成人免费视频在线观看 | 国产精品99久久久久久宅男 | 日韩a v在线免费观看 | 在线一区视频 | 蜜桃av鲁一鲁一鲁一鲁 | 亚洲一区二区免费 | 看黄在线| 日韩精品一区二区三区在线观看 | 国产一级视屏 | 欧美一区在线视频 | 国产精品国产三级国产aⅴ原创 | 狠狠色综合久久丁香婷婷 | 97精品一区二区 | 久久狠狠 | 久草热在线|