新聞中心
隨著 Web 應(yīng)用和移動(dòng)應(yīng)用的快速發(fā)展,數(shù)據(jù)量和用戶端的需求也相應(yīng)地增長。針對復(fù)雜的數(shù)據(jù)處理和查詢請求,傳統(tǒng)的服務(wù)器端數(shù)據(jù)庫已經(jīng)無法滿足需求,而在客戶端使用 js 數(shù)據(jù)庫成為了一種可行的解決方案。本文將介紹如何使用 js 數(shù)據(jù)庫來優(yōu)化搜索功能,提升用戶體驗(yàn)。

創(chuàng)新互聯(lián)公司是專業(yè)的六合網(wǎng)站建設(shè)公司,六合接單;提供成都做網(wǎng)站、網(wǎng)站設(shè)計(jì),網(wǎng)頁設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行六合網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來合作!
一、為什么需要使用 js 數(shù)據(jù)庫
在進(jìn)行 Web 應(yīng)用或移動(dòng)應(yīng)用的開發(fā)時(shí),許多數(shù)據(jù)處理往往在客戶端進(jìn)行,比如前端搜索、數(shù)據(jù)加工等。使用傳統(tǒng)的服務(wù)器端數(shù)據(jù)庫會(huì)存在以下問題:
(1)服務(wù)器端響應(yīng)時(shí)間過長
如果需要進(jìn)行搜索等數(shù)據(jù)處理,客戶端將向服務(wù)器發(fā)送請求,服務(wù)器從數(shù)據(jù)庫中查找、計(jì)算數(shù)據(jù),再將結(jié)果返回給客戶端。這種處理方式就需要考慮客戶端與服務(wù)器的網(wǎng)絡(luò)延遲問題,響應(yīng)時(shí)間可能會(huì)很長。
(2)數(shù)據(jù)傳輸量大
服務(wù)器將原始數(shù)據(jù)返回給客戶端,客戶端再進(jìn)行搜索等操作。如果數(shù)據(jù)量很大,相應(yīng)的傳輸數(shù)據(jù)量也會(huì)很大,延長響應(yīng)時(shí)間。此時(shí),使用客戶端進(jìn)行數(shù)據(jù)處理和查詢較為合適。
(3)服務(wù)器端資源成本高
服務(wù)器端的數(shù)據(jù)處理和查詢需要占用服務(wù)器的 CPU、內(nèi)存等資源,增加服務(wù)器壓力。此時(shí),將一些數(shù)據(jù)處理和查詢?nèi)蝿?wù)轉(zhuǎn)移到客戶端,可以減少服務(wù)器端的運(yùn)算壓力,提升應(yīng)用性能。
二、如何使用 js 數(shù)據(jù)庫進(jìn)行搜索功能
在客戶端使用 js 數(shù)據(jù)庫進(jìn)行搜索功能,需要首先將數(shù)據(jù)加載到客戶端中,并進(jìn)行索引。建立索引,是為了優(yōu)化搜索性能,在搜索時(shí)可以通過索引快速定位數(shù)據(jù),減少搜索時(shí)間。目前,比較常用的客戶端 js 數(shù)據(jù)庫有以下幾種:
(1)IndexedDB
IndexedDB 是 W3C 標(biāo)準(zhǔn)的客戶端 js 數(shù)據(jù)庫,可以對客戶端數(shù)據(jù)進(jìn)行增、刪、改、查。 IndexedDB 可以在大多數(shù)現(xiàn)代瀏覽器中使用,但需要注意的是,IE 瀏覽器不支持 IndexedDB。
使用 IndexedDB 進(jìn)行搜索的流程如下:
1. 打開或創(chuàng)建數(shù)據(jù)庫
var request = window.indexedDB.open(“databaseName”, version);
2. 創(chuàng)建存儲對象
var objectStore = db.createObjectStore(“objectStoreName”, { keyPath: “id”});
3. 添加數(shù)據(jù)
objectStore.add({ id: 1, name: “apple”});
4. 索引數(shù)據(jù)
var index = objectStore.createIndex(“name”, “name”);
5. 查詢數(shù)據(jù)
var request = index.getAll(“apple”);
(2)LocalForage
LocalForage 是一個(gè)優(yōu)秀的客戶端 js 數(shù)據(jù)庫,它使用了各種瀏覽器存儲能力并進(jìn)行了優(yōu)化,可以支持離線應(yīng)用等場景,使用簡單。但與 IndexedDB 相比,LocalForage 不支持索引,查詢數(shù)據(jù)時(shí)需要遍歷所有數(shù)據(jù)進(jìn)行匹配,查詢性能較低。
使用 LocalForage 進(jìn)行搜索的流程如下:
1. 引入庫文件
2. 添加數(shù)據(jù)
localforage.setItem(“key”, “value”);
3. 查詢數(shù)據(jù)
localforage.getItem(“key”).then(function(value) {
// 處理查詢結(jié)果
});
(3)PouchDB
PouchDB 是一個(gè)支持離線應(yīng)用的客戶端 js 數(shù)據(jù)庫,它可以同步到服務(wù)器端的 CouchDB 數(shù)據(jù)庫中,使得客戶端和服務(wù)器端之間的數(shù)據(jù)同步更加方便。PouchDB 支持自定義索引,使用方便,它的性能也要優(yōu)于 LocalForage。
使用 PouchDB 進(jìn)行搜索的流程如下:
1. 引入庫文件
2. 打開或創(chuàng)建數(shù)據(jù)庫
var db = new PouchDB(‘databaseName’);
3. 添加數(shù)據(jù)
db.put({
_id: ‘mydoc’,
title: ‘a(chǎn)pple’
});
4. 索引數(shù)據(jù)
db.createIndex({
index: {fields: [‘title’]}
});
5. 查詢數(shù)據(jù)
db.find({
selector: {title: {$eq: ‘a(chǎn)pple’}}
}).then(function(result) {
// 處理查詢結(jié)果
});
三、常見問題及解決方案
(1)js 數(shù)據(jù)庫存儲量限制
客戶端 js 數(shù)據(jù)庫的存儲量是受限制的,因此需要注意數(shù)據(jù)的選擇和管理??梢允褂脭?shù)據(jù)緩存、數(shù)據(jù)分頁等方式進(jìn)行管理,減少數(shù)據(jù)量,優(yōu)化搜索性能。
(2)js 數(shù)據(jù)庫兼容性問題
不同的瀏覽器對客戶端 js 數(shù)據(jù)庫的支持度不同,需要針對不同的瀏覽器進(jìn)行兼容性處理??梢允褂玫谌綆烊?Dexie.js、localForage.js 等簡化兼容性處理。
(3)查詢結(jié)果的排序問題
在進(jìn)行搜索查詢時(shí),可能需要對查詢結(jié)果進(jìn)行排序。排序的方式往往需要將所有數(shù)據(jù)加載到客戶端后進(jìn)行排序,這會(huì)耗費(fèi)較多的時(shí)間和資源??梢試L試使用數(shù)據(jù)緩存及數(shù)據(jù)分頁等方式優(yōu)化排序性能。
四、結(jié)論
客戶端 js 數(shù)據(jù)庫可以有效地進(jìn)行數(shù)據(jù)處理和查詢,優(yōu)化搜索性能,提升用戶體驗(yàn),但也需要注意管理數(shù)據(jù)量及兼容性問題。在選擇 js 數(shù)據(jù)庫時(shí),需要根據(jù)應(yīng)用的特點(diǎn)和要求,選擇合適的 js 數(shù)據(jù)庫及查詢方式,以達(dá)到更佳的性能和用戶體驗(yàn)。
相關(guān)問題拓展閱讀:
- 關(guān)于js讀取數(shù)據(jù)庫
- 如何用 Node.js 和 Elasticsearch 構(gòu)建搜索引擎
關(guān)于js讀取數(shù)據(jù)庫
是客戶端腳本語言,是絕對沒有辦法讀取數(shù)據(jù)庫的,必須借助后臺程序!
這段代碼是 讀取服務(wù)器日期時(shí)間并顯示的程序(中韓)
可能對你有所啟發(fā)
var zxq=”日,一,二,三扒悄,四,五,六,日”.split(“,”);
var hxq=”?,?,?,?,?,?,?,?”.split(“,”);
var serverdate=Date(, , , , , ,500) ;
var zhdate = new Date(serverdate);
var handate=new Date(serverdate);
handate.setHours(handate.getHours()+1);
//alert(zhdate+”|”+handate);
/**/
function getDstr(){
return “(中)”+ zhdate.getFullYear()+”年”+(zhdate.getMonth()+1)+”月”+zhdate.getDate()+”日悉吵 “
+zhdate.getHours()+”:”+zhdate.getMinutes()+”:”+zhdate.getSeconds()+” 星期”+zxq
+”
(韓)”+ handate.getFullYear()+”?”+(handate.getMonth()+1)+”?”+handate.getDate()+”? “
+handate.getHours()+”:”+handate.getMinutes()+”睜此侍:”+handate.getSeconds()+” “+hxq+”??”
;
}
//alert(getDstr());
times.innerHTML=getDstr();
function dateadd(){
zhdate.setSeconds(zhdate.getSeconds()+1);
handate.setSeconds(handate.getSeconds()+1);
times.innerHTML=getDstr();
}
如何用 Node.js 和 Elasticsearch 構(gòu)建搜索引擎
安裝 Elasticsearch
Elasticsearch 受Apache 2許可證保護(hù),可以被下載,使用,免費(fèi)修改。安裝Elasticsearch 之前你需要先確保在你的電腦上安裝了Java Runtime Environment (JRE) ,Elasticsearch 是使用java實(shí)現(xiàn)的并且依賴java庫運(yùn)行。你可以使用下面的命令行來檢測你是否安裝了java
推薦使用java最新的穩(wěn)定版本(寫這篇文章的時(shí)候是1.8)。你可以在找到在你系統(tǒng)上安裝java的指導(dǎo)手冊。
接下來是下載最新版本的Elasticsearch (寫這篇文章的時(shí)候是2.3.5),去下載ZIP 文件。Elasticsearch 不需要安裝,一個(gè)zip文件就包含了可在所有支持的系統(tǒng)上運(yùn)行的文件。解壓下載的文件,就完成了。有幾種其他的方式運(yùn)行Elasticsearch ,比如:獲得TAR 文件或者為不同Linux發(fā)行版本的包。
如果你使用的是Mac操作系統(tǒng)并且安裝了 ,你就可以使用這行命令安裝Elasticsearch brew install elasticsearch.Homebrew 會(huì)自動(dòng)添加executables 到你的系統(tǒng)并且安裝所需的服務(wù)。它也可以使用一行命令幫你更新應(yīng)用:brew upgrade elasticsearch.
想在Windows上運(yùn)行Elasticsearch ,可以在解壓的文件夾里,通過命令行運(yùn)行bin\elasticsearch.bat 。對于其他系統(tǒng),可以從終端運(yùn)行 ./bin/elasticsearch.這時(shí)候,Elasticsearch 就應(yīng)該可以在你的系統(tǒng)上運(yùn)行了。
就像我之前提到的,你可以使用Elasticsearch的幾乎所有的操作,都可以通過RESTful APIs完成。Elasticsearch 默認(rèn)使用9200 端口。為了確保你正確的運(yùn)行了Elasticsearch。在你的瀏覽器中打開 ,將會(huì)顯示一些關(guān)于你運(yùn)行的實(shí)例的基本信息。
圖形用戶界面
Elasticsearch不須圖形用戶界面,只通過REST APIs就提供了幾乎所有的功能。然而如果我不介紹怎么通過APIs和悉派輪 Node.js執(zhí)行所有所需的操作,你可以通過幾個(gè)提供了索引和數(shù)據(jù)的可視化信息GUI工具來完成,這些工具甚至含有一些高水平的分析。
, 是同一家公司開發(fā)的工具, 它提供了數(shù)據(jù)的實(shí)時(shí)概要,并提供了一些可視化定制和分析選項(xiàng)。Kibana 是免費(fèi)的。
還有一些是社區(qū)開發(fā)的工具,如 , , 甚至谷歌瀏覽器的擴(kuò)展組件.這些工具可以幫你在瀏覽器中查看你的索引和數(shù)據(jù),甚至可以試運(yùn)行不同的搜索和匯總查詢。所有這些工具提供了安裝和使用的攻略。
創(chuàng)建一個(gè)Node.js環(huán)境
彈性搜索為Node.js提供一個(gè)官方模塊,稱為elasticsearch。首先,你需要添加模塊到你的工程目錄下,并且保存依賴以備以后使用。
然后,你可以在腳本里導(dǎo)入模塊,如下所示:
最終,你需要?jiǎng)?chuàng)建客戶端來處理與彈性搜索的通訊。在這種情況下,我假設(shè)你正在運(yùn)行彈性搜索的本地機(jī)睜信器IP地址是羨友127.0.0.1,端口是9200(默認(rèn)設(shè)置)。
注意:這篇導(dǎo)讀的所有源代碼都可以在GitHub下載查看。最簡單的查看方式是在你的PC機(jī)上克隆倉庫,并且從那里運(yùn)行示例代碼:
數(shù)據(jù)導(dǎo)入
在本教程中,我將使用 1000 篇學(xué)術(shù)論文里的內(nèi)容,這些內(nèi)容是根據(jù)隨機(jī)算法逐一生成的,并以 ON 格式提供,其中的數(shù)據(jù)格式如下所示:
ON 格式中的每個(gè)字段如字面意思,無需多余解釋,但值得注意的是:由于包含隨機(jī)生成的文章的全部的內(nèi)容(大概有100~200個(gè)段落),所以并未展示。
雖然 Elasticsearch 提供了,、單個(gè)數(shù)據(jù)的方法,但我們采用接口導(dǎo)入數(shù)據(jù),因?yàn)榕拷涌谠诖笮蛿?shù)據(jù)集上執(zhí)行操作的效率更高。
這里,我們調(diào)用函數(shù)bulkIndex建立索引,并傳入 3 個(gè)參數(shù),分別是:索引名 library,類型名library,ON 數(shù)據(jù)格式變量 articles。bulkIndex函數(shù)自身則通過調(diào)用esClient對象的bulk接口實(shí)現(xiàn),bulk 方法包含一個(gè)body屬性的對象參數(shù),并且每個(gè)body屬性值是一個(gè)包含 2 種操作實(shí)體的數(shù)組對象。之一個(gè)實(shí)體是 ON 格式的操作類型對象,該對象中的index屬性決定了操作的類型(本例子是文件索引)、索引名、文件ID。第二個(gè)實(shí)體則是文件對象本身。
注意,后續(xù)可采用同樣的方式,為其他類型文件(如書籍或者報(bào)告)添加索引。我們還可以有選擇的每個(gè)文件分配一個(gè)唯一的ID,如果不體統(tǒng)唯一的ID,Elasticsearch 將主動(dòng)為每個(gè)文件分配一個(gè)隨機(jī)的唯一ID。
假設(shè)你已經(jīng)從代碼庫中下載了 Elasticsearch 項(xiàng)目代碼,在項(xiàng)目根目錄下執(zhí)行如下命令,即可將數(shù)據(jù)導(dǎo)入至Elasticsearch中:
檢查數(shù)據(jù)的索引是否準(zhǔn)確
Elasticsearch 更大的特性是接近實(shí)時(shí)檢索,這意味著,一旦文檔索引建立完成,1 秒內(nèi)就可被檢索(見)。索引一旦建立完成,則可通過運(yùn)行 indice.js 檢查索引信息的準(zhǔn)確性():
client 中的cat 對象方法提供當(dāng)前運(yùn)行實(shí)例的各種信息。其中的 indices 方法列出所有的索引信息,包括每個(gè)索引的健康狀態(tài)、以及占用的磁盤大小。 而其中的 v 選項(xiàng)為 cat方法新增頭部響應(yīng)。
當(dāng)運(yùn)行上面代碼段,您會(huì)發(fā)現(xiàn),集群的健康狀態(tài)被不同的顏色標(biāo)示。其中,紅色表示為正常運(yùn)行的有問題集群;黃色表示集群可運(yùn)行,但存在告警;綠色表示集群正常運(yùn)行。在本地運(yùn)行上面的代碼段,您極有可能(取決于您的配置)看到集群的健康狀態(tài)顏色是黃色,這是因?yàn)槟J(rèn)的集群設(shè)置包含 5 個(gè)節(jié)點(diǎn),但本地運(yùn)行只有 1 個(gè)實(shí)例正常運(yùn)行。鑒于本教程的目的僅局限于 Elasticsearch 指導(dǎo)學(xué)習(xí),黃色即可。但在線上環(huán)境中,你必須確保集群的健康狀態(tài)顏色是綠色的。
動(dòng)態(tài)和自定義映射
如前所述, Elasticsearch 無模式(schema-free),這意味著,在數(shù)據(jù)導(dǎo)入之前,您無需定義數(shù)據(jù)的結(jié)構(gòu)(類似于SQL數(shù)據(jù)庫需要預(yù)先定義表結(jié)構(gòu)),Elasticsearch 會(huì)主動(dòng)檢測。盡管 Elasticsearch 被定義為無模式,但數(shù)據(jù)結(jié)構(gòu)上仍有些限制。
Elasticsearch 以映射的方式引用數(shù)據(jù)結(jié)構(gòu)。當(dāng)數(shù)據(jù)索引建立完成后,如果映射不存在,Elasticsearch 會(huì)依次檢索 ON 數(shù)據(jù)的每個(gè)字段,然后基于被字段的類型(type)自動(dòng)生成映射(mapping)。如果存在該字段的映射,則會(huì)確保按照同樣的映射規(guī)則新增數(shù)據(jù)。否則直接報(bào)錯(cuò)。
比如:如果{“key1”: 12} 已經(jīng)存在,Elasticsearch 自動(dòng)將字段 key1 映射為長整型?,F(xiàn)在如果你嘗試通過{“key1”: “value1”, “key2”: “value2”} 檢索, 則會(huì)直接報(bào)錯(cuò),因?yàn)橄到y(tǒng)預(yù)期字段 key1 為長整型。同時(shí),如果通過 {“key1”: 13, “key2”: “value2”} 檢索則不會(huì)報(bào)錯(cuò),并為字段 key2 新增 string 類型。
映射不能超出文本的范圍,大都數(shù)情況下,系統(tǒng)自動(dòng)生成的映射都可正常運(yùn)行。
構(gòu)建搜索引擎
一旦完成數(shù)據(jù)索引,我們就可以開始實(shí)現(xiàn)搜索引擎。Elasticsearch提供了一個(gè)直觀的基于ON的全搜索查詢的結(jié)構(gòu)-Query DSL,定義查詢。有許多有用的搜索查詢類型,但是在這篇文章中,我們將只看到幾個(gè)通用的類型。關(guān)于Query DSL的完整文章可以在看到。
請記住,我提供了每個(gè)展示例子的源碼的連接。設(shè)置完你的環(huán)境和索引測試數(shù)據(jù)后,你可以下載源碼,然后運(yùn)行在你的機(jī)器上運(yùn)行任何例子??梢酝ㄟ^命令行運(yùn)行節(jié)點(diǎn)filename.js。
返回一個(gè)或多個(gè)索引的所有記錄
為了執(zhí)行我們的搜索,我們將使用客戶端提供的多種搜索方法。最簡單的查詢是match_all,它可以返回一個(gè)或多個(gè)索引的所有的記錄。下面的例子顯示了我們怎么樣獲取在一個(gè)索引中獲取所有存儲的記錄().
主要的搜索查詢包含在Query對象中。就像我們接下來看到的那樣,我們可以添加不同的搜索查詢類型到這個(gè)對象。我們可以為每一個(gè)Query添加一個(gè)查詢類型的關(guān)鍵字(如match_all),讓這個(gè)Query成為一個(gè)包含搜索選項(xiàng)的對象。由于我們想返回索引的所有記錄,所以在這個(gè)例子中沒有查詢選項(xiàng)。
除了Query對象,搜索體中可以包含其他選項(xiàng)的屬性,如 size 和from。size屬性決定了返回記錄的數(shù)量。如果這個(gè)值不存在,默認(rèn)返回10個(gè)記錄。from屬性決定了返回記錄的起始索引,這對分頁有用。
理解查詢API的返回結(jié)果
如果你打印搜索API返回結(jié)果(上面例子的結(jié)果)日志。由于它包含了很多信息,剛開始看起來無所適從。
在更高級別日志輸出里,返回結(jié)果中含有took 屬性,該屬性值表示查找結(jié)果所用的毫秒數(shù),timed_out只有在更大允許時(shí)間內(nèi)沒有找到結(jié)果時(shí)為true,_shards 是不同節(jié)點(diǎn)的狀態(tài)的信息(如果部署的是節(jié)點(diǎn)集群),hits是查詢結(jié)果。
hits的屬性值是一個(gè)含有下列屬性的對象:
total —表示匹配的條目的總數(shù)量
max_score — 找到的條目的更大分?jǐn)?shù)
hits — 找到的條目的數(shù)組,在hits數(shù)組里的每一天記錄,都有索引,類型,文檔,ID,分?jǐn)?shù),和記錄本身(在_source元素內(nèi))。
這十分復(fù)雜,但是好消息是一旦你實(shí)現(xiàn)了一個(gè)提取結(jié)果的方法,不管你的搜索查詢結(jié)果時(shí)什么,你都可以使用相同的格式獲取結(jié)果。
還需要注意的是Elasticsearch 有一個(gè)好處是它自動(dòng)地給每一個(gè)匹配記錄分配分?jǐn)?shù),這個(gè)分?jǐn)?shù)用來量化文件的關(guān)聯(lián)性,返回結(jié)果的順序默認(rèn)的按鈕分?jǐn)?shù)倒排。在例子中我們使用match_all取回了所有的記錄,分?jǐn)?shù)是沒有意義的,所有的分?jǐn)?shù)都被計(jì)算為1.0。
匹配含指定字段值的文檔
現(xiàn)在我們看幾個(gè)更加有趣的例子. 我們可以通過使用 match 關(guān)鍵字查詢文檔是否與指定的字段值匹配。一個(gè)最簡單的包含 match 關(guān)鍵字的檢索主體代碼如下所示:
如上文所述, 首先通過為查詢對象新增一個(gè)條目,并指定檢索類型,上面示例給的是 match 。然后再檢索類型對象里面,申明待檢索的文檔對象,本例是 title 文檔對象。然后再文檔對象里面,提供相關(guān)檢索數(shù)據(jù),和 query 屬性。我希望你測試過上述示例之后,驚訝于 Elasticsearch 的檢索效率。
上述示例執(zhí)行成功后,將返回title(標(biāo)題)字段與任一 query 屬性詞匹配的所有文檔信息。同時(shí)還可以參考如下示例,為查詢對象附加最小匹配數(shù)量條件:
與該查詢匹配的文檔 title(標(biāo)題)字段至少包含上訴指定的 3 個(gè)關(guān)鍵詞。如果查詢關(guān)鍵詞少于 3個(gè),那么匹配文檔的 title(標(biāo)題)字段必須包含所有的查詢詞。Elasticsearch 的另一個(gè)有用的功能是 fuzziness(模糊匹配).這對于用戶輸入錯(cuò)誤的查詢詞將非常有用,因?yàn)閒uzzy(模糊匹配)將發(fā)現(xiàn)拼寫錯(cuò)誤并給出最接近詞供選擇。對于字符串類型,每個(gè)關(guān)鍵字的模糊匹配值是根據(jù)算法 算出的更大允許值。fuzziness(模糊匹配)示例如下所示:
多個(gè)字段搜索
如果你想在多個(gè)字段中搜索,可以使用multi_match搜索類型。除了Query對象中的fields屬性外,它同match有點(diǎn)類似。fields屬性是需要搜索的字段的。這里我們將在title,authors.firstname, 和authors.lastname 字段中搜索。
multi_match查詢支持其他搜索屬性,如minimum_should_match 和fuzziness。Elasticsearch支持使用通配符(如*)匹配字段,那么我們可以使用把上面的例子變得更短些。
匹配一個(gè)完整的句子
Elasticsearch也支持精確的匹配一個(gè)輸入的句子,而不是在單詞級別。這個(gè)查詢是在普通的match 查詢上擴(kuò)展而來,叫做 match_phrase。下面是一個(gè)match_phrase的例子
聯(lián)合多個(gè)查詢
到目前為止,在例子中我們每次請求只使用了單個(gè)查詢。然而Elasticsearch允許你聯(lián)合多個(gè)查詢。最常用的復(fù)合查詢是bool,bool查詢接受4種關(guān)鍵類型must, should, must_not, 和filter. 像它們的名字表示的那樣,在查詢結(jié)果的數(shù)據(jù)里必須匹配must里的查詢,必須不匹配must_not里的查詢,如果哪個(gè)數(shù)據(jù)匹配should里的查詢,它就會(huì)獲得高分。每一個(gè)提到的元素可以使用查詢數(shù)組格式接受多個(gè)搜索查詢。
下面,我們使用bool查詢及一個(gè)新的叫做query_string的查詢類型。它允許你使用 AND 或 OR寫一些比較高級的查詢。另外,我們使用了 range查詢,它可以讓我們通過給定的范圍的方式去限制一個(gè)字段。
在上面的例子中,查詢返回的數(shù)據(jù),作者的名包含term1 或它們的姓包含term2,并且它們的title含有term3,而且它們不在2023,2023或2023年出版的,還有在body字段里含有給定句子數(shù)據(jù)將獲得高分,并被排列到結(jié)果的前面(由于在should從句中的match 查詢)。
過濾,聚合,和建議
除了它先進(jìn)的搜索功能外,Elasticsearch 還提供了其他的功能。接下來,我們再看看其他三個(gè)比較常用的功能。
過濾
也許,你經(jīng)常想使用特定的條件凝縮查詢結(jié)果。Elasticsearch通過filters 提供了這樣的功能。在我們的文章數(shù)據(jù)里,假設(shè)你的查詢返回了幾個(gè)文章,這些文章是你選擇的在5個(gè)具體年份發(fā)布的文章。你可以簡單的從搜索結(jié)果中過濾出那些不匹配條件的數(shù)據(jù),而不改變查詢結(jié)果的順序。
在bool 查詢的must 從句中,過濾和相同查詢之間的不同之處在于,過濾不會(huì)影響搜索分?jǐn)?shù),而must 查詢會(huì)。當(dāng)查詢結(jié)果返回并且用戶使用給定的條件過濾時(shí),他們不想改變結(jié)果的順序,相反地,他們只想從結(jié)果中移除不相關(guān)的數(shù)據(jù)。過濾與搜索的格式一樣,但在通常情況下,他們在有明確值的字段上定義,而不是文本字符串上。Elasticsearch 推薦通過bool復(fù)合查詢的filter從句添加過濾。
繼續(xù)看上面的例子,假設(shè)我們想把搜索結(jié)果限制在在2023到2023年之間發(fā)布的文章里。這樣做,我們只需要在一般搜索查詢的filter 部分添加range 查詢。這將會(huì)從結(jié)果中移除那些不匹配的數(shù)據(jù)。下面是一個(gè)過濾查詢的例子
聚合
聚合框架會(huì)基于一次搜索查詢,提供各種聚合數(shù)據(jù)和統(tǒng)計(jì)信息。兩個(gè)主要的聚合類型是度量和分塊, 度量聚合會(huì)對一個(gè)文檔的進(jìn)行持續(xù)的跟蹤并計(jì)算度量,而分塊聚合則會(huì)進(jìn)行塊的構(gòu)建,每個(gè)塊都會(huì)跟一個(gè)鍵和一個(gè)文檔查詢條件關(guān)聯(lián)起來。度量聚合的示例有平均值,最小值,更大值,加總值還有計(jì)數(shù)值。分塊聚合的示例有范圍、日期范圍、直方圖以及主題項(xiàng)。對聚合器更加深入的描述可以在 找到。
聚合可以放置在一個(gè) aggregations 對象里面,而對象自己則是被直接放到 search 對象體中。在 aggregations 對象里面,每一個(gè)鍵都是由用戶賦予一個(gè)聚合器的名稱。聚合器的類型和其它選項(xiàng)都應(yīng)該是作為這個(gè)鍵的值而放置的。接下來我們要來看看兩個(gè)不同類型的聚合器,一個(gè)是度量的,一個(gè)塊的。我們會(huì)用度量聚合器來嘗試找出數(shù)據(jù)中最小的年份值(也就是最久遠(yuǎn)的文章),而使用塊器我要做的就是嘗試找出每一個(gè)關(guān)鍵詞各自出現(xiàn)了多少次。
在上述示例中,我們將度量聚合器命名為 min_year (也可以是其它名稱), 也就是 year 這個(gè)域上的 min 類型。塊聚合器責(zé)備命名為 keywords, 就是 keywords 這個(gè)域上的 terms 類型。聚合操作的結(jié)果被裝在了響應(yīng)消息里的 aggregations 元素里面,更深入一點(diǎn)會(huì)發(fā)現(xiàn)里面包含了每一個(gè)聚合器(這里是 min_year 和 keywords)以及它們的聚合操作結(jié)果。 如下是來自這個(gè)示例響應(yīng)消息中的部分內(nèi)容。
響應(yīng)消息中默認(rèn)最多會(huì)有10個(gè)塊返回。你可以在請求中 filed 的邊上加入一個(gè)size鍵來規(guī)定返回的塊的更大數(shù)量。如果你想要接收到所有的塊,可以將這個(gè)值設(shè)置為 0。
建議
Elasticsearch 提供了多種可以對輸入內(nèi)容提供替換和補(bǔ)全的關(guān)聯(lián)項(xiàng)推薦器(見)。下面將介紹術(shù)語和短語推薦器。術(shù)語推薦器為每個(gè)輸入文本中的術(shù)語提供關(guān)聯(lián)推薦(如果有的話),而短語推薦器將整個(gè)輸入文本看做一個(gè)短語(與將其拆分成術(shù)語對比),然后提供其他短語的推薦(如果有的話)。使用推薦API時(shí),需要調(diào)用Node.js client的suggest方法。如下為術(shù)語推薦器的示例。
與其他client的方法相同,在請求體中包含一個(gè)index字段指明采用的索引。在body字段中添加查詢推薦的文本,然后給每個(gè)推薦器一個(gè)(包含了聚合對象的)名稱(本例中的titleSuggester)。其值指明了推薦器的類型和配置。這里,為title字段使用了術(shù)語推薦器,限制更大建議的數(shù)量是每個(gè)token最多5個(gè)(size: 5)。
建議API返回的數(shù)據(jù)中包含了對應(yīng)請求中每一個(gè)建議器的key,其值是一個(gè)與你輸入文本中術(shù)語數(shù)量相同的一個(gè)數(shù)組。對于數(shù)組中的每一個(gè)元素,包含一個(gè)options數(shù)組,其每個(gè)對象的text字段中包含了推薦的文本。如下是上面例子中返回?cái)?shù)據(jù)的一部分。
js數(shù)據(jù)庫 搜索的介紹就聊到這里吧,感謝你花時(shí)間閱讀本站內(nèi)容,更多關(guān)于js數(shù)據(jù)庫 搜索,JavaScript 進(jìn)階之:使用 js 數(shù)據(jù)庫優(yōu)化搜索功能,關(guān)于js讀取數(shù)據(jù)庫,如何用 Node.js 和 Elasticsearch 構(gòu)建搜索引擎的信息別忘了在本站進(jìn)行查找喔。
成都網(wǎng)站營銷推廣找創(chuàng)新互聯(lián),全國分站站群網(wǎng)站搭建更好做SEO營銷。
創(chuàng)新互聯(lián)(www.cdcxhl.com)四川成都IDC基礎(chǔ)服務(wù)商,價(jià)格厚道。提供成都服務(wù)器托管租用、綿陽服務(wù)器租用托管、重慶服務(wù)器托管租用、貴陽服務(wù)器機(jī)房服務(wù)器托管租用。
網(wǎng)站欄目:JavaScript 進(jìn)階之:使用 js 數(shù)據(jù)庫優(yōu)化搜索功能 (js數(shù)據(jù)庫 搜索)
網(wǎng)頁網(wǎng)址:http://m.fisionsoft.com.cn/article/dpisjdd.html


咨詢
建站咨詢
