成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用CloudSearch 五步搞定云中文檔搜索

云計算
在本文中, Judith Myerson介紹了使用亞馬遜CloudSearch來創建搜索索引的五個必須步驟,而CloudSearch正是這樣一個為云計算中文檔創建搜索索引的有用工具。

亞馬遜CloudSearch是一個為云計算中文檔創建搜索索引的有用工具。這項服務是基于使用文檔現有屬性項的,它可允許開發人員新增新的屬性項以便于對搜索索引進行微調。

這里,我選擇了一個LibreOffice Writer文檔以用于說明如何使用CloudSearch來創建搜索索引和修復問題。出于演示的目的,我所選的文檔較小,這樣就可確保創建索引成本更低。

創建搜索索引共需五個步驟:準備文檔、啟動亞馬遜CloudSearch、定位索引字段源、增加索引字段以及運行測試搜索。如果測試結果是成功的,那么你就可以使用相同的索引來搜索其他的LibreOffice文檔。

步驟1:準備一個樣本文檔

  • 選中File標簽,選擇Properties。
  •  在General Properties標簽中,確保選中Apply the user data多選框。
  • 在Tools標簽下的Options,在LibreOffice User Data文本框中輸入你的名字。
  • 選中Use Data for document properties多選框。
  • 點擊OK。
  • 在Edit標簽下,打開Record Changes。
  • 進行必要的編輯。
  •  以LibreOffice Writer的格式(.odt)保存文檔文件,然后以微軟的Word格式(.doc 或 .docx)保存。因為CloudSearch并不會接受LibreOffice Writer (.odt)格式的文檔文件。

步驟2:啟動CloudSearch

  • 登錄到AWS的管理控制臺。
  • 選擇CloudSearch。 在相關區域選擇激活域。
  • 點擊Upload Documents。
  • 選擇 File(s) on my local disk并點擊 Browse 選中你需要上傳的樣本文件。
  • 點擊Continue。

在CloudSearch分析樣本文檔之后,相關界面會顯示索引字段的一個列表:

  • application_name
  • author
  • content
  • content_type
  • creation_date
  • creator
  • date
  • language
  • last_author
  • last_modified
  • last_printed
  • resourcename
  • revision_number
  • total_time

上述列表中的斜體標記表示并沒有針對域進行配置。只有解決了這一問題,你才能繼續下一步。

點擊Cancel。

步驟3:定位正確配置的索引字段源

  • 在Help標簽下選擇About LibreOffice以獲得application_name 字段的源。
  • 在Tools標簽的Options中選擇Language Settings以獲得Language字段的源。英語(美國)是默認選項。
  • 在File標簽的Properties中選擇General Properties以獲得以下表格中字段的源。

在向域配置新增索引字段之前,你可以確定是刪除還是保留這些字段。

步驟4:新增索引字段

  • 登錄CloudSearch,打開相關界面。
  • 選擇一個激活域名。
  • 選擇Indexing Options。
  • 每次對下述每一個字段點擊Add Index Field。

注:在默認情況下,CloudSearch將把每個字段自動設置為可搜索。

  • 點擊Submit。
  • 點擊Run indexing,重新編制索引。
  • 點擊OK開始編制索引。一般來說,編制和部署小型索引文件只需花費數分鐘時間,而編制和部署大型索引文件則可能需要花費數個小時之久。索引文件越小,重建搜索索引文件的成本就越低。

步驟5:提交搜索請求

  • 選擇Dashboard。
  • 從S3 buckets或你的本地文件系統中選擇待上傳文件,并點擊Upload Documents。
  • 點擊Run a Test Search。
  • 在Search框內輸入一個單詞。例如,“vulnerability”。
  • 點擊Go,CloudSearch就會以文檔相關度分數降序的次序列出索引字段。

注:文檔相關度得分是根據文檔中搜索詞出現次數與整個域中所有文檔中搜索詞出現次數的比值而得到的。在本文的示例中,我們使用了一個文檔。

以下是一個文檔的結果:

該文檔相關度得分為0.5532488。搜索詞被發現一次。

創建者和作者是Judith。

***的作者是Judith。

該文檔被修改過六次。

語言默認為美國英語(en-US)。

創建者和作者是Judith。

創建時間為2014年6月20日10:08:15。

內容是:生物漏洞評估變更。

修改日期為12:57:38。

內容類型為application/vnd.openxmlformats(Word docx)。

資源名稱Biometric vulnerability assessment.docx。

總之,對一個小文件運行測試搜索可確保處理成本較低。如果測試結果是成功的,那么你就可以使用相同的索引來對大量的文檔進行搜索。

原文鏈接:http://www.searchcloudcomputing.com.cn/showcontent_88060.htm

責任編輯:Ophira 來源: TechTarget中國
相關推薦

2009-08-11 09:47:01

Spring整合Str

2017-08-22 18:34:24

WinLicense軟件授權

2012-04-13 16:21:47

亞馬遜云計算CloudSerach

2025-05-14 07:06:36

2025-01-07 08:55:54

2009-08-18 14:15:12

2016-09-09 01:07:06

數據中心容量規劃數據中心

2014-08-11 10:10:39

linux

2021-07-26 09:35:26

SQL數據庫優化

2023-09-18 14:39:02

2017-06-01 12:30:59

SQL云計算云端

2022-02-12 11:00:33

FTP網絡協議文件傳輸

2017-01-06 08:47:53

2011-07-26 10:18:53

2017-09-27 11:00:50

LinuxBash使用技巧

2009-12-11 13:31:31

策略路由配置

2021-09-14 10:25:12

云計算云計算環境云安全

2009-11-05 10:01:26

Visual Stud

2016-08-10 09:29:11

云計算

2010-09-07 09:42:23

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久一区二区三区四区 | 精品国产一区二区三区性色av | 欧美精产国品一二三区 | 国内精品久久影院 | 一区二区三区在线电影 | 精品一区在线看 | 国产成人免费视频网站视频社区 | 成人一级毛片 | 国产一区二区三区在线 | 国产精品夜夜春夜夜爽久久电影 | 青草福利| 亚洲国产成人精品久久久国产成人一区 | 天堂一区 | 日韩久久中文字幕 | 天天干精品 | 欧美一区日韩一区 | 国产高清一区二区 | 欧美在线一区视频 | 久久精品视频在线观看 | 日韩在线播放视频 | av免费网站在线观看 | 日日夜夜草| av黄色在线 | 日本不卡高字幕在线2019 | 精品无码久久久久久国产 | 日韩av在线一区 | 国产在线播 | 亚洲毛片 | 一区二区三区国产 | 欧美精品在线免费 | 日韩在线成人 | 日本成人综合 | 欧美成人精品一区二区三区 | 成人精品一区二区三区中文字幕 | 国产精品精品久久久 | 蜜桃毛片| 欧美一级片在线观看 | 中文字幕 在线观看 | 久久久99国产精品免费 | 欧美成人一区二免费视频软件 | 成人3d动漫一区二区三区91 |