成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

nutch+hadoop配置步驟及問(wèn)題解決方法深入剖析

開(kāi)發(fā) 架構(gòu) Hadoop
Hadoop相信大家有所了解了,這里向大家介紹一下nutch+hadoop配置使用問(wèn)題,主要包括nutch+hadoop配置以及配置過(guò)程匯總遇到的問(wèn)題,相信通過(guò)本文的介紹大家對(duì)nutch+hadoop配置有一定的認(rèn)識(shí)。

本節(jié)向大家介紹nutch+hadoop配置方面的內(nèi)容,主要有nutch+hadoop配置的步驟和配置時(shí)出現(xiàn)的問(wèn)題及解決辦法,歡迎大家一起來(lái)學(xué)習(xí),相信通過(guò)本節(jié)的介紹你會(huì)越到不少有關(guān)Hadoop的知識(shí)。

nutch+hadoop配置使用

配置nutch+hadoop

1,下載nutch。如果不需要特別開(kāi)發(fā)hadoop,則不需要下載hadoop。因?yàn)閚utch里面帶了hadoopcore包以及相關(guān)配置

2,建立目錄(根據(jù)自己喜好)
/nutch
/search(nutchinstallationgoeshere)nutch安裝到這里,也就是解壓到這里
/filesystemhadoop的文件系統(tǒng)存放點(diǎn)
/local/crawl后放置索引用來(lái)search用的
/home(nutchuser'shomedirectory)如果你用系統(tǒng)用戶(hù),這個(gè)基本沒(méi)用
/tomcat啟動(dòng)nutch.war用來(lái)search索引的app

3,conf/hadoop-env.sh一定要配置JAVA_HOME,否則系統(tǒng)起不來(lái)

4,配置master和slave的ssh,否則每次都要輸入passwd
ssh-keygen-trsa
然后回車(chē)即可
cpid_rsa.pubauthorized_keys
(copy到其它的slave上)scp/nutch/home/.ssh/authorized_keysnutch@devcluster02:/nutch/home/.ssh/authorized_keys

5,將bin和conf下所有的.sh、nuch、hadoop文件dos2unix
dos2unix/nutch/search/bin/*.sh/nutch/search/bin/hadoop

配置hadoop-size.xml

6,記住要把master文件從nutch/hadoopcopy到這個(gè)nutch中,應(yīng)該是bug。也就是說(shuō)啟動(dòng)需要這個(gè)文件,文件內(nèi)容為默認(rèn)的localhost即可(如果是分布式,可能需要配置)

7,nutch+hadoop配置過(guò)程中需要格式化namenode
bin/hadoopnamenode-format #p#

8,啟動(dòng):bin/start-all.sh

9,配置crawl(以配置一個(gè)網(wǎng)址lucene.apache.org為例)
 

  1. cd/nutch/search  
  2. mkdirurls  
  3. viurls/urllist.txthttp://lucene.apache.org  
  4. cd/nutch/search  
  5. bin/hadoopdfs-puturlsurls  
  6. cd/nutch/search  
  7. viconf/crawl-urlfilter.txt  
  8. changethelinethatreads:+^http://([a-z0-9]*\.)*MY.DOMAIN.NAME/  
  9. toread:+^http://([a-z0-9]*\.)*apache.org/  
  10.  

 

10,啟動(dòng)crawl
bin/nutchcrawlurls-dircrawled-depth3

11,查詢(xún)
bin/hadoopdfs-copyToLocalcrawled/media/do/nutch/local/(crawled)將index的東西copy到以上配置的local中,因?yàn)閟earch不能用dfs中搜索(從文檔看是這樣)

12,啟動(dòng)nutch.war,測(cè)試
vinutch-site.xmlnutch.war中classes下
starttomcat

注意點(diǎn):
1,masters文件nutch原來(lái)沒(méi)有,需要copy到conf下
2,crawl的log4j配置默認(rèn)有問(wèn)題,需要增加:
hadoop.log.dir=.
hadoop.log.file=hadoop.log
3,nutch1.0一定要配置nutch-site.xml。重新配置http.agent。default.xml里面已經(jīng)存在。


nutch+hadoop配置使用時(shí)的問(wèn)題:
1,運(yùn)行hadoop程序時(shí),中途我把它終止了,然后再向hdfs加文件或刪除文件時(shí),出現(xiàn)Namenodeisinsafemode錯(cuò)誤:
rmr:org.apache.hadoop.dfs.SafeModeException:Cannotdelete/user/hadoop/input.Namenodeisinsafemode
解決的命令:
bin/hadoopdfsadmin-safemodeleave#關(guān)閉safemode
索引命令:
bin/nutchindexplainindex/paodingindexesplainindex/crawldbplainindex/linkdbplainindex/

segments/20090528132511plainindex/segments/20090528132525plainindex/segments/20090528132602
eg:
index:
bin/nutchindexcrawled/indexes_newcrawled/crawldbcrawled/linkdbcrawled/segments/20100313132517
merge:
bin/nutchmergecrawled/index_newcrawled/indexes_new
去重dedup:
bin/nutchdedupcrawled/index_new。本節(jié)關(guān)于nutch+hadoop配置使用介紹到這里。

【編輯推薦】

  1. Hadoop配置注意事項(xiàng)及命令使用經(jīng)驗(yàn)總結(jié)
  2. Hadoop配置和啟動(dòng)Hadoop方法詳解
  3. Hadoop文件系統(tǒng)如何快速安裝?
  4. Hadoop配置指導(dǎo)手冊(cè)
  5. Hadoop完全分布模式安裝實(shí)現(xiàn)詳解
責(zé)任編輯:佚名 來(lái)源: csdn.net
相關(guān)推薦

2010-06-07 15:07:24

nutch+hadoo

2010-05-24 18:46:50

SVN圖標(biāo)

2009-12-28 10:56:45

WPF Image

2009-02-26 11:13:41

Weblogic中間件JSP

2009-07-17 14:33:05

Jython中文問(wèn)題

2010-07-29 15:28:47

Flex安全沙箱

2009-02-18 14:28:23

編碼亂碼JSP

2010-08-03 09:12:52

Flex安全沙箱

2010-05-26 11:08:33

SVN管理

2009-06-09 15:51:07

Java ee中文問(wèn)題解決方法

2009-11-17 10:43:59

ubuntu 9.10輸入法解決方法

2009-08-14 13:49:58

Rails中文問(wèn)題

2009-10-29 10:04:57

VB.NET Read

2010-05-11 15:09:51

Unix系統(tǒng)

2010-01-13 21:06:37

雙絞線

2011-05-18 14:00:30

在線備份

2011-06-14 13:41:27

muleWSDL

2011-04-25 15:15:00

C#

2009-12-21 18:39:24

WCF字符串過(guò)長(zhǎng)問(wèn)題

2010-12-31 16:31:08

服務(wù)器常見(jiàn)問(wèn)題
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 午夜网| 成人欧美一区二区三区 | 国产精品视频 | 国产精品乱码一区二三区小蝌蚪 | 色屁屁在线观看 | 99精品视频免费在线观看 | 免费成年网站 | 国产欧美日韩精品一区 | 国产精品综合色区在线观看 | 国内精品成人 | 日韩精品专区在线影院重磅 | 欧美一区二区黄 | 亚洲国产欧美日韩 | 久久国产精品视频 | 亚洲一区二区免费 | 国产在线一区二区三区 | 中文字幕观看 | 黄色在线网站 | 亚洲视频区 | 在线色网| 91免费福利在线 | 色综合天天综合网国产成人网 | 精品国产一区二区三区免费 | 亚洲国产成人精品久久久国产成人一区 | 人人做人人澡人人爽欧美 | 国产精品久久久av | 欧美福利在线 | 久久高清免费视频 | 国产成人久久精品一区二区三区 | 精品国产乱码久久久久久88av | 国产成人精品一区二区三区视频 | 欧美日韩在线一区 | 毛片在线免费播放 | 国产日韩欧美一区二区在线播放 | 成人亚洲网 | 视频一区二区在线 | jdav视频在线观看免费 | 欧美中文一区 | 精品欧美一区二区中文字幕视频 | 欧美99久久精品乱码影视 | 人人看人人草 |