成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

幾種常見的基于Lucene的開源搜索解決方案對比

開發 后端
本文主要介紹了幾種常見的基于Lucene的開源搜索解決方案對比。

一、直接使用 Lucene ( http://lucene.apache.org )

說明:Lucene 是一個 JAVA 搜索類庫,它本身并不是一個完整的解決方案,需要額外的開發工作。

優點:成熟的解決方案,有很多的成功案例。apache 頂級項目,正在持續快速的進步。龐大而活躍的開發社區,大量的開發人員。它只是一個類庫,有足夠的定制和優化空間:經過簡單定制,就可以滿足絕大部分常見的需求;經過優化,可以支持 10億+ 量級的搜索。

缺點:需要額外的開發工作。所有的擴展,分布式,可靠性等都需要自己實現;非實時,從建索引到可以搜索中間有一個時間延遲,而當前的“近實時”(Lucene Near Real Time search)搜索方案的可擴展性有待進一步完善。

二、Solr ( http://lucene.apache.org/solr/ )

說明:基于 Lucene 的企業級搜索的開箱即用的解決方案。

優點:比較成熟的解決方案,也有很多的成功案例。Lucene 子項目,實現了大部分常見的搜索功能需求,包括 facet 搜索(搜索結果分類過濾)等。

缺點:可定制性比 Lucene 要差,一些不常見的需求,定制的難度比直接在 Lucene 上做要大的多。性能上,由于 Solr 的建索引和搜索是同一個進程,耦合度比較高,對于性能調優有一定的影響。

三、Katta ( http://katta.sourceforge.net/ )

說明:基于 Lucene 的,支持分布式,可擴展,具有容錯功能,準實時的搜索方案。

優點:開箱即用,可以與 Hadoop 配合實現分布式。具備擴展和容錯機制。

缺點:只是搜索方案,建索引部分還是需要自己實現。在搜索功能上,只實現了最基本的需求。成功案例較少,項目的成熟度稍微差一些。因為需要支持分布式,對于一些復雜的查詢需求,定制的難度會比較大。

四、Hadoop contrib/index (http://svn.apache.org/repos/asf/hadoop/mapreduce/trunk/src/contrib/index/README )

說明:Map/Reduce 模式的,分布式建索引方案,可以跟 Katta 配合使用。

優點:分布式建索引,具備可擴展性。

缺點:只是建索引方案,不包括搜索實現。工作在批處理模式,對實時搜索的支持不佳。

五、LinkedIn 的開源方案 ( http://sna-projects.com/ )

說明:基于 Lucene 的一系列解決方案,包括 準實時搜索 zoie ,facet 搜索實現 bobo,機器學習算法 decomposer ,摘要存儲庫 krati ,數據庫模式包裝 sensei 等等。

優點:經過驗證的解決方案,支持分布式,可擴展,豐富的功能實現。

缺點:與 linkedin 公司的聯系太緊密,可定制性比較差。

六、ElasticSearch ( http://www.elasticsearch.com/ )

說明:基于 Lucene 的,分布式,云端,提供 rest 接口的搜索解決方案。

優點:開箱即用,分布式,rest 接口,支持云端調用。

缺點:一個新的項目,沒有經過很多的驗證。(只有一個人在開發?)分片的數目不能動態調整,只能在初始化索引的時候指定(跟 HBase 不一樣的地方)。

七、Lucandra ( https://github.com/tjake/Lucandra )

說明:基于 Lucene,索引存在 cassandra 數據庫中。

優點:參考 cassandra 的優點。

缺點:參考 cassandra 的缺點。另外,這只是一個 demo,沒有經過大量驗證。

八、HBasene ( https://github.com/akkumar/hbasene )

說明:基于 Lucene,索引存在 HBase 數據庫中。

優點:參考 HBase 的優點。

缺點:參考 HBase 的缺點。另外,在實現中,lucene terms 是存成行,但每個 term 對應的 posting lists 是以列的方式存儲的。隨著單個 term 的 posting lists 的增大,查詢時的速度受到的影響會非常大。

原文鏈接:http://www.cnblogs.com/ibook360/archive/2011/12/05/2277054.html

【編輯推薦】

  1. 在Java中使用NIO進行網絡編程
  2. Java漏洞影響國內千萬電腦 360升級防護
  3. 從思路開始 Java如何實現條件編譯
  4. Java七步創建以JDBC連接數據庫的程序
  5. 面試Java前必須了解的10個概念

 

責任編輯:林師授 來源: 愛開卷360的博客
相關推薦

2014-09-01 09:51:15

lBS

2023-05-06 15:32:04

2018-10-10 10:23:53

數據庫RedisNoSQL

2022-02-10 08:57:45

分布式線程鎖

2023-06-21 11:27:53

2009-09-24 15:45:23

2015-07-31 10:30:47

IBM Cloudan開源搜索

2024-06-24 00:30:00

2009-04-02 08:23:24

ARM上網本移動OS

2011-04-29 14:53:56

SimpleFrame

2020-12-18 17:27:20

物聯網資產跟蹤IOT

2015-09-06 10:34:47

2020-12-09 09:30:57

前端開發技術

2023-11-06 08:00:38

接口高可用機制

2019-03-26 19:30:47

開源備份解決方案

2010-05-12 14:18:58

Linux引導

2014-03-06 10:52:57

Windows Ser重復數據

2024-07-08 08:45:41

2025-01-07 16:00:00

Kubernetes云原生Pod

2009-12-11 15:41:18

華為路由器接入
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区二区三区久久 | 久久av网站| 在线成人一区 | 男女羞羞视频在线看 | 欧美第一页 | av黄色片 | 欧美日韩国产一区二区三区不卡 | 在线91| 国产在线一区二区三区 | 97色在线观看免费视频 | 日韩综合在线 | 国内精品一区二区三区 | 国产成人精品999在线观看 | 最新中文字幕久久 | 欧美日韩一区二区三区四区五区 | 成人在线观看免费 | 国产成人a亚洲精品 | 91精品国产91久久久久久最新 | 99免费精品视频 | xxx视频| 韩日在线 | 国产精品精品视频一区二区三区 | 亚洲天堂一区二区 | 亚洲欧美成人影院 | 色爽女| av中文字幕在线 | 密桃av| 国产成人精品视频在线观看 | 成人欧美一区二区三区在线播放 | 久草资源| 一区二区免费看 | 国产亚洲一区二区精品 | 尤物在线 | 国产高清精品一区二区三区 | 成人精品一区 | 91精品国产综合久久久久蜜臀 | av毛片 | 精品久久久久久 | 精品在线一区 | 精品国产欧美一区二区三区不卡 | 国产精品久久久乱弄 |