学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第97篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题,欢迎在文章下面点个赞,或者关注威赞。谢谢。威赞文章都是结合官方文档,翻译整理而来,并对每个知识点的描述都认真思考和实践,对难以理解的地方,使用简单容易理解的方式进行阐述。
概述
Mongodb的通配符索引,为灵活可变的Mongodb数据结构提供了高效的查询方法。本文结合Mongodb官方文档,详细介绍在嵌入式文档和数组上,通配符索引的结构。
Mongodb为嵌入式文档和数组字段建立通配符索引时,有特殊的逻辑:
- 当为文档对象建立通配符索引时,Mongodb会扫描文档对象的每一个字段,将文档的每一个字段都加入到该通配符索引中。如果该字段值也是文档对象,则继续向下扫描,将该文档类型的字段添加到通配符索引。
- 当为数组对象建立通配符索引时, Mongodb会扫描数组中的每一个元素,将每一个元素的内容添加到通配符索引。如果该元素是个数组,则将数组整体放入的通配符索引中。当数组元素是对象时,则按照添加对象的方式,将该对象的每一个字段添加到通配符索引。
- 对于其他类型的字段,通配符索引保存基本的数据类型值。即非对象,非数组类型值。
通配符索引会持续转换构建索引时遇到的嵌套文档或数组,直到遇到基本数值为止。Mongodb将基本数值和该字段的路径,都放入到通配符索引当中。
应用
为文档对象建立通配符索引
构建集合users并插入数据
db.users.insertOne({
account: {
user_name: "SuperAdmin01",
contact: {
email: "xyz@example.com",
phone: "1234567890"
},
access: {
group: "admin"
}
}
})
在account字段添加通配符索引
db.users.createIndex({"account.$**": 1})
Mongodb在构建通配符索引时,会解析account对象的每一个字段 ,将每一个字段的值和路径放到索引中
- "account.username": "SuperAdmin01"
- "account.contact.email": "xyz@example.com"
- "account.contact.phone": "1234567890"
- "access.group": "admin"
为数组对象添加通配符索引
创建fleet集合并添加数据
db.fleet.insertOne({
ship: {
coordinates: [
[ 37.786971, -122.399677 ],
[ 37.786971, -122.399677 ]
],
type: "Cargo Ship",
captains: [
{
name: "John Doe",
age: 45,
crew: [ "first mate", "engineer" ]
}
]
}
})
为ship字段添加索引
db.fleet.createIndex({"ship.$**": 1})
ship字段包含一个数组类型的字段coordinates, 字符类型的字段type, 数组类型的字段captains. 其中数组字段coordinates的元素也是数据,在构建通配符索引时,直接将coordinates字段的数组放入索引当中。captains是文档类型的数据,Mongodb构建通配符索引时,会进一步解析到基本元素,将基本元素放入索引当中。按照这样的规则 ,索引当中,存在下面的数据
- "ship.coordinates":[37.786971, -122.399677 ],
- "ship.coordinates":[37.786971, -122.399677 ],
- "ship.type":"Cargo Ship",
- "ship.captains.name":"John Doe",
- "ship.captains.age":45,
- "ship.captains.crew":"first mate",
- "ship.captains.crew":"first engineer"
从上面的例子当中可以看到,在构建索引时,并没有把元素在数组中的位置也添加到索引当中。但mongdb也能够使用通配符索引,支持带有数组元素位置的查询。如
db.fleet.find({"ship.captains.0.age": {$gt: 40}})
查看该查询的执行计划
但通配符索引,不支持下面的查询
db.fleet.find({
"ship.coordinates.0.1": 37.786971
})
查看执行计划,能够看到使用全表扫描,而不是通配符索引。因为通配符索引将整个数组元素作为整体放倒索引数据中。而用户使用数组当中的一个值来查询时,Mongodb选择了全表扫描。
Mongodb在构建通配符索引时,不会限制文档数组类型结构的深度。但查询时,如果路径长度超过8, Mongodb会选择其他更高效的索引或全表扫描的方式。