MongoDB クエリを作成して、年間の各月に格付けされたレストランの数を調べます。
「レストラン」コレクションの構造:
{
"address": {
"building": "1007",
"coord": [ -73.856077, 40.848447 ],
"street": "Morris Park Ave",
"zipcode": "10462"
},
"borough": "Bronx",
"cuisine": "Bakery",
"grades": [
{ "date": { "$date": 1393804800000 }, "grade": "A", "score": 2 },
{ "date": { "$date": 1378857600000 }, "grade": "A", "score": 6 },
{ "date": { "$date": 1358985600000 }, "grade": "A", "score": 10 },
{ "date": { "$date": 1322006400000 }, "grade": "A", "score": 9 },
{ "date": { "$date": 1299715200000 }, "grade": "B", "score": 14 }
],
"name": "Morris Park Bake Shop",
"restaurant_id": "30075445"
}
Query
db.restaurants.aggregate([
{
$unwind: "$grades"
},
{
$project: {
month: { $month: { $toDate: "$grades.date" } },
year: { $year: { $toDate: "$grades.date" } }
}
},
{
$group: {
_id: { month: "$month", year: "$year" },
count: { $sum: 1 }
}
},
{
$sort: {
"_id.year": 1,
"_id.month": 1
}
}
]);
Output
{ _id: { month: 12, year: 2010 }, count: 3 },
{ _id: { month: 1, year: 2011 }, count: 5 },
{ _id: { month: 2, year: 2011 }, count: 20 },
{ _id: { month: 3, year: 2011 }, count: 65 },
{ _id: { month: 4, year: 2011 }, count: 66 },
{ _id: { month: 5, year: 2011 }, count: 132 },
{ _id: { month: 6, year: 2011 }, count: 154 },
{ _id: { month: 7, year: 2011 }, count: 144 },
{ _id: { month: 8, year: 2011 }, count: 179 },
{ _id: { month: 9, year: 2011 }, count: 263 },
{ _id: { month: 10, year: 2011 }, count: 328 },
{ _id: { month: 11, year: 2011 }, count: 378 },
{ _id: { month: 12, year: 2011 }, count: 513 },
{ _id: { month: 1, year: 2012 }, count: 512 },
{ _id: { month: 2, year: 2012 }, count: 502 },
{ _id: { month: 3, year: 2012 }, count: 488 },
{ _id: { month: 4, year: 2012 }, count: 501 },
{ _id: { month: 5, year: 2012 }, count: 551 },
{ _id: { month: 6, year: 2012 }, count: 428 },
{ _id: { month: 7, year: 2012 }, count: 354 }
.....
説明
このMongoDBの集計パイプライン操作は、’restaurants’ コレクション内のデータに対して、以下の手順で集計計算を行います:
$unwind: “$grades”:
このステージでは、配列フィールドである “grades” を展開し、各 “grades” 要素を個別のドキュメントとして分割します。これにより、各 “grades” 要素に対して後続の処理を行うことができるようになります。
$project: { month: { $month: { $toDate: “$grades.date” } }, year: { $year: { $toDate: “$grades.date” } } }:
このステージでは、”grades.date” フィールドの日付情報を抽出して、それを元に月と年の情報を計算します。$toDate 演算子を使用して “grades.date” を日付オブジェクトに変換し、その日付オブジェクトから月と年を抽出します。
$group: { _id: { month: “$month”, year: “$year” }, count: { $sum: 1 } }:
このステージでは、月と年の組み合わせごとにドキュメントをグループ化し、各グループ内のドキュメント数を計算します。”_id” フィールドには月と年の組み合わせが、”count” フィールドには各組み合わせ内のドキュメント数が格納されます。
$sort: { “_id.year”: 1, “_id.month”: 1 }:
このステージでは、結果を年と月の昇順でソートします。”_id.year” フィールドでまず年をソートし、同じ年内であれば “_id.month” フィールドで月をソートします。
要するに、この集計操作の目的は、”grades.date” フィールドから月と年を抽出し、その組み合わせごとにドキュメント数を計算し、結果を年と月の昇順に表示することです。
Previous:料理と地区ごとに「A」評価のレストランの数を調べる
Next:各料理の平均点を求める
コメント