一、插入集合 comment 的文档的内容
二、题目要求
将集合 comment 中的文档进行聚合操作,即将字段 state为1的文档查询出来,然后按字段 nickname 进行分组,最后计算出每个评论者的评论条数。
三、mapReduce 操作代码
db.comment.mapReduce(
// Map函数:用于遍历集合中的每个文档,并将键值对传给reduce函数
function() {
// 代表每次出现一个评论就计数为1
emit(this.nickname, 1);
},
// Reduce函数:用于聚合Map函数发射的相同键(nickname)的值
function(key, values) {
// 使用Array.sum方法将相同key的所有值相加,得到该评论者的评论总数
return Array.sum(values);
},
{
// Query选项:指定仅对满足条件的文档(state为"1")执行mapReduce操作
query: { state: "1" },
// 输出选项:将mapReduce的结果输出到一个新的集合中,例如'output_collection'
out: "output_collection"
}
);
db.comment.mapReduce(
function() {
// Map函数:筛选state为1的文档,并将nickname作为键,值为1
if (this.state === 1) {
emit(this.nickname, 1);
}
},
function(key, values) {
// Reduce函数:将同一nickname的评论数相加
return Array.sum(values);
},
{
// 输出选项:将结果输出到一个新的集合中,例如output_collection
out: "output_collection"
}
);
上述两种方法效果相同。
1. emit(this.nickname, 1) 的作用
(1) 生成键值对:对于每一个满足条件(state 为 1)的文档,emit 函数会将当前文档的 nickname 字段的值作为键(key),并将 1 作为值(value)。
(2) 用于分组和计数:emit(this.nickname, 1) 生成的键值对会被传递给 reduce 函数。nickname 作为键用于分组,1 作为值用于计数。在 reduce 函数中,会将同一个 nickname 的所有 1 累加起来,得到该 nickname 出现的次数(即每个评论者的评论总数)。
四、聚合管道操作代码
db.comment.aggregate([
// Stage 1: 筛选文档,选择state为1的文档
{
$match: { state: "1" }
},
// Stage 2: 按nickname字段进行分组,并计算每个组的数量
{
$group: {
_id: "$nickname", // 按nickname分组,_id为每个评论者的昵称
count: { $sum: 1 } // 计算每个分组中的文档数量
}
},
// Stage 3: 输出选项(可选),按照需要排序或进一步处理结果
{
$sort: { count: -1 } // 按评论数量降序排序(可选)
}
]);