成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Lucene中對document的CURD操作:為分布式全文檢索設計

開發 架構 分布式
Lucene.net是.net環境中比較強的全文檢索工具,它是從JAVA中轉過來的,.net版本的lucene在功能上也豪不遜色于java版的lucene。今天主要來說一下lucene索引文件在更新時的一些方式。

Lucene.net是.net環境中比較強的全文檢索工具,它是從JAVA中轉過來的,.net版本的lucene在功能上也豪不遜色于java版的lucene。今天主要來說一下lucene索引文件在更新時的一些方式。

一、整個索引文件 (cfs文件)覆蓋更新;優點:簡單,缺點:與服務器沒有交互,但在生成索引文件時對IO影響比較大,前臺lucene信息顯示與數據庫不同步。

二、索引文件按需要更新(對document記錄進行curd操作),優點:與數據庫同步,缺點:與服務器交互多,對于curd的安全性要重視起來,但這樣做是必須的。

下面主要說一下第二種索引文件按需要更新的情況:

追加document(記錄):當數據庫表中有insert操作時,這時lucene也應該進行相應的insert操作,這就是追加,在IndexWriter中有AddDocument方法,它沒什么好說的,按著方法簽名轉值即可,注意操作完成后要對IndexWriter進行Optimize和Close

  1. [WebMethod]  
  2.          public int AppendLuceneDocument(string primaryKey, string id, string name, string info, string categoryName, string propertyName, string module, string passKey)  
  3.          {  
  4.              int flag = 0;  
  5.              try 
  6.              {  
  7.                  dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));  
  8.                  directory = LuceneIO.FSDirectory.Open(dirInfo);  
  9.                  IndexWriter writer = new IndexWriter(directory, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29), false, IndexWriter.MaxFieldLength.UNLIMITED);  
  10.                  Document doc = new Document();  
  11.                  doc.Add(new Field("PrimaryKey", primaryKey, Field.Store.YES, Field.Index.ANALYZED));  
  12.                  doc.Add(new Field("ID", id, Field.Store.YES, Field.Index.NO));  
  13.                  doc.Add(new Field("Name", name, Field.Store.YES, Field.Index.ANALYZED));  
  14.                  doc.Add(new Field("Info", info, Field.Store.YES, Field.Index.ANALYZED));  
  15.                  doc.Add(new Field("CategoryName", categoryName, Field.Store.YES, Field.Index.ANALYZED));  
  16.                  doc.Add(new Field("PropertyName", propertyName, Field.Store.YES, Field.Index.ANALYZED));  
  17.                  writer.AddDocument(doc);  
  18.                  writer.Optimize();  
  19.                  writer.Close();  
  20.                  flag = 1;  
  21.              }  
  22.              catch (Exception)  
  23.              {  
  24.    
  25.                  throw;  
  26.              }  
  27.              return flag;  
  28.          } 

刪除記錄(document):這個操作需要我們注意幾點:

1、要刪除的記錄的依據應該具有唯一性,這樣刪除才有意義,并且這個字段在lucene存儲時需要是ANALYZED,即可以被檢索到

2、刪除時的條件***使用Query,而不要使用Term,我做過很多測試,結果證明Term條件總是不要使。

對于刪除的代碼如下:

  1. [WebMethod]  
  2.          public int DeleteLuceneDocument(string primaryKey, string module, string passKey)  
  3.          {  
  4.              int flag = 0;  
  5.              try 
  6.              {  
  7.                  dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));  
  8.                  directory = LuceneIO.FSDirectory.Open(dirInfo);  
  9.                  IndexWriter writer = new IndexWriter(directory, standardAnalyzer, false, IndexWriter.MaxFieldLength.UNLIMITED);  
  10.                  QueryParser parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_29, "PrimaryKey"new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29));  
  11.                  Query query = parser.Parse(primaryKey);  
  12.                  writer.DeleteDocuments(query);  
  13.                  writer.Commit();  
  14.                  writer.Optimize();  
  15.                  writer.Close();  
  16.                  flag = 1;  
  17.              }  
  18.              catch (Exception)  
  19.              {  
  20.    
  21.                  throw;  
  22.              }  
  23.              return flag;  
  24.          } 

而更新操作事實上就是先把記錄刪除,再追加一條新的記錄即可,而IndexWriter為我們提供的UpdateDocuments感覺更向是在復制一個,所以不建議使用它,

而是手動刪除和追加來完成這個update操作。

  1. [WebMethod]  
  2.          public int UpdateLuceneDocument(string primaryKey, string id, string name, string info, string categoryName, string propertyName, string module, string passKey)  
  3.          {  
  4.              int flag = 0;  
  5.              try 
  6.              {  
  7.                  dirInfo = Directory.CreateDirectory(this.GetIndexPath(ConfigurationManager.AppSettings[module]));  
  8.                  directory = LuceneIO.FSDirectory.Open(dirInfo);  
  9.                  IndexWriter writer = new IndexWriter(directory, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29), false, IndexWriter.MaxFieldLength.UNLIMITED);  
  10.                  Document doc = new Document();  
  11.                  doc.Add(new Field("PrimaryKey", primaryKey, Field.Store.YES, Field.Index.ANALYZED));  
  12.                  doc.Add(new Field("ID", id, Field.Store.YES, Field.Index.NO));  
  13.                  doc.Add(new Field("Name", name, Field.Store.YES, Field.Index.ANALYZED));  
  14.                  doc.Add(new Field("Info", info, Field.Store.YES, Field.Index.ANALYZED));  
  15.                  doc.Add(new Field("CategoryName", categoryName, Field.Store.YES, Field.Index.ANALYZED));  
  16.                  doc.Add(new Field("PropertyName", propertyName, Field.Store.YES, Field.Index.ANALYZED));  
  17.                  QueryParser parser = new QueryParser(Lucene.Net.Util.Version.LUCENE_29, "PrimaryKey"new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29));  
  18.                  Query query = parser.Parse(primaryKey);  
  19.                  writer.DeleteDocuments(query);  
  20.                  writer.Commit();  
  21.                  writer.AddDocument(doc);  
  22.                  writer.Optimize();  
  23.                  writer.Close();  
  24.                  flag = 1;  
  25.              }  
  26.              catch (Exception)  
  27.              {  
  28.    
  29.                  throw;  
  30.              }  
  31.    
  32.              return flag;  
  33.          } 

OK,這就是對索引文件進行按需的操作,以后我會把我的lucene架構整理成文章,供大家討論。

原文鏈接:http://www.cnblogs.com/lori/archive/2012/08/24/2654275.html

責任編輯:林師授 來源: 博客園
相關推薦

2022-04-14 10:24:27

分布式系統性能

2023-10-08 10:49:16

搜索系統分布式系統

2023-11-07 12:00:05

分布式系統數據訪問

2023-11-29 10:26:52

分布式數據

2019-06-19 15:40:06

分布式鎖RedisJava

2024-01-10 08:02:03

分布式技術令牌,

2018-10-29 12:51:35

分布式存儲元數據

2019-09-05 09:02:45

消息系統緩存高可用

2022-04-07 17:13:09

緩存算法服務端

2012-07-31 10:37:31

Lucene.net

2012-11-06 13:58:26

分布式云計算分布式協同

2013-05-13 10:30:26

分布式架構架構設計網站架構

2018-12-14 10:06:22

緩存分布式系統

2023-02-20 15:38:38

2023-05-18 14:02:00

分布式系統冪等性

2022-03-21 19:44:30

CitusPostgreSQ執行器

2018-10-16 14:26:22

分布式塊存儲引擎

2015-05-26 11:18:06

分布式系統可擴展性

2009-02-10 08:57:01

分布式緩存.Net開發

2024-10-18 08:00:00

分布式系統背壓數據庫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品视频免费看 | 激情国产 | 天天天天操 | 国产成人久久精品一区二区三区 | 午夜视频一区 | 天天影视亚洲综合网 | 天天拍天天插 | 三级欧美 | 国产高清免费视频 | 中文字幕一区二区三区四区五区 | 在线观看国产视频 | 成人在线免费观看av | 狠狠躁天天躁夜夜躁婷婷老牛影视 | 成人性视频免费网站 | 国产高清在线精品一区二区三区 | 一区二区精品在线 | 国产福利资源在线 | 黄色一级视频 | 精品国产一级 | 久久日韩精品一区二区三区 | 91精品中文字幕一区二区三区 | 1区2区3区视频 | av无遮挡 | 成人国产精品视频 | 国产乱性| 亚洲啊v| 西西裸体做爰视频 | 免费精品久久久久久中文字幕 | 在线观看视频你懂得 | 国产精品中文字幕在线 | 久久综合久久综合久久综合 | 高清成人免费视频 | www日韩| 成人h视频 | 精品网| 99国内精品久久久久久久 | 成人在线一区二区 | 国产精品自拍一区 | 天天射天天干 | 久久网国产 | 99热热热热 |