前几篇文章中,小编给大家介绍了一些es的基本操作,还有常用分词器的搭建,现在给大家来示范一下es的一些常见文档搜索方式。
在学习文档搜索方式前,我们先来创建一个文档,并添加一些文档数据。
tips: 这里的分词器,我们使用的是上篇文章所说的ik分词器
#创建索引
PUT /students
{"mappings":{"properties":{"id": {"type": "integer","index": true},"name": {"type": "text","store": true,"index": true,"analyzer": "ik_smart"},"info": {"type": "text","store": true,"index": true,"analyzer": "ik_smart"}}}
}
# 添加数据
POST /students/_doc/
{"id":1,"name":"小白程序员","info":"I love coding"
}POST /students/_doc/
{"id":2,"name":"美羊羊","info":"美羊羊是羊村最漂亮的人"
}POST /students/_doc/
{"id":3,"name":"懒羊羊","info":"懒羊羊的成绩不是很好"
}POST /students/_doc/
{"id":4,"name":"小灰灰","info":"小灰灰的年纪比较小"
}POST /students/_doc/
{"id":5,"name":"沸羊羊","info":"沸羊羊喜欢美羊羊"
}POST /students/_doc/
{"id":6,"name":"灰太狼","info":"灰太狼是小灰灰的父亲,每次都会说我一定会回来的"
}
match:
1.全文检索字符,将查询条件分词后再进行搜索
2.还支持模糊查询,具有自动纠错功能(最多纠错两个字,超过则报错)
#格式
{"query":{"match_all":{}}
}eg: 查询全部
GET /students/_search
{"query": {"match_all": {}}
}
#eg1:全文检索 match:将查询条件分词后再进行搜索
GET /students/_search
{"query": {"match": {"info": "喜欢"}}
}
#eg2:match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符,超过两个报错)
GET /students/_search
{"query": {"match": {"info": {"query": "lov","fuzziness": 1}}}
}
对数字类型的字符进行范围搜索
,这个和数据库的范围限定符类似。
#格式
{"query":{"range":{搜索字段:{ "gte":最小值,"lte":最大值} }}
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于eg:
GET /students/_search
{"query": {"range": {"id": {"gte": 1,"lte": 3}}}
}
搜索条件不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式
{"query":{"match_phrase":{搜索字段:搜索条件}}
}eg:
GET /students/_search
{"query": {"match_phrase": {"info": "成绩"}}
}
单词或者词组搜索,不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式
{"query":{"term":{ 搜索字段: 搜索条件}}
}{"query":{"terms":{ 搜索字段: [搜索条件1,搜索条件2]}}
}
es也是可以像Java语言那样,可以将多个条件嵌套使用,从而筛选出符合条件的那一个。
#格式
GET /索引/_search
{ "query": { "bool": { // 必须满足的条件 "must": [ 搜索方式:搜索参数,搜索方式:搜索参数],// 多个条件有任意一个满足即可"should": [搜索方式:搜索参数,搜索方式:搜索参数],// 必须不满足的条件"must_not":[搜索方式:搜索参数,搜索方式:搜索参数]} }
}
eg:
GET /students/_search
{"query": {"bool": {"must_not": [{"term": {"info": "成绩"}},{"range": {"id": {"gte": 1,"lte": 3}}}]}}
}
上面就是查询出id在1到3范围内,且info里面含有成绩字样的student
es默认使用相关度分数实现排序,也可以通过搜索语法定制化排序
#格式
GET /索引/_search
{ "query": 搜索条件,"sort": [{"字段1":{"order":"asc"} },{ "字段2":{ "order":"desc" } }]
}
eg:
#1根据匹配度排序,高的在前面
GET /students/_search
{"query": {"match": {"info": "我喜欢成绩好的学生"}}
}#2根据搜索语法定制化排序
GET /students/_search
{"query": {"match": {"info": "我喜欢淑仪"}},"sort": [{"id": {"order": "desc"}}]
}
tips:es默认不会对text类型的字段做排序(因为会分词),如果需要使用text类型的字段做结果排序,可以使用keyword类型的字段作为排序依据(因为keyword类型的字段不会做分词处理)
这个顾名思义就是当查询内容过多的时候,可以将其分成几页,每页限定规定的数量进行查询。
#格式
GET /索引/_search
{ "query": 搜索条件,"from": 起始下标,"size": 查询记录数
}
eg:
GET /students/_search
{"query":{"match_all":{}},"from":0,"size":3
}
在es里面使用sql语句对文档进行查询(没啥用)
#格式
GET /_sql?format=txt
{"query": SQL语句
}
eg:
GET /_sql?format=txt
{"query": "select *from students"
}
介绍了一些elasticsearch的常见文档搜索方式,结合前几篇文章学习,可以很好地入门es,希望你有所收获。