MongoDB クエリを作成して、「A」評価の数が最も多いレストランをすべて検索します。
「レストラン」コレクションの構造:
{
"address": {
"building": "1007",
"coord": [ -73.856077, 40.848447 ],
"street": "Morris Park Ave",
"zipcode": "10462"
},
"borough": "Bronx",
"cuisine": "Bakery",
"grades": [
{ "date": { "$date": 1393804800000 }, "grade": "A", "score": 2 },
{ "date": { "$date": 1378857600000 }, "grade": "A", "score": 6 },
{ "date": { "$date": 1358985600000 }, "grade": "A", "score": 10 },
{ "date": { "$date": 1322006400000 }, "grade": "A", "score": 9 },
{ "date": { "$date": 1299715200000 }, "grade": "B", "score": 14 }
],
"name": "Morris Park Bake Shop",
"restaurant_id": "30075445"
}
Query
db.restaurants.aggregate([
{$unwind: "$grades"},
{$match: {"grades.grade": "A"}},
{$group: {
_id: "$restaurant_id",
count: {$sum: 1}
}},
{$sort: {count: -1}},
{$group: {
_id: "$count",
restaurants: {$push: "$_id"}
}},
{$sort: {_id: -1}},
{$limit: 1},
{$project: {restaurants: 1}}
])
Output
{
_id: 7,
restaurants: [
'40873102', '40752011', '40787054',
'40513021', '40514492', '40720393',
'40399340', '40816235', '40786301',
'40863575', '40831075', '40868810',
'40377294', '40735660', '40362432',
'40798457', '40397159', '40401093',
'40864834', '40393093', '40573964',
'40399986', '40399778', '40761780',
'40401151', '40606772', '40369087',
'40865501'
]
}
説明
このMongoDBの集計(Aggregation)パイプラインは、’restaurants’ コレクション内のデータを処理し、特定の条件に基づいてデータを集計します。具体的な手順は以下の通りです:
{ $unwind: “$grades” }:
このステップでは、“grades” 配列をアンウィンド(展開)して、個別の “grades” ドキュメントとしてデータを分解します。
{ $match: { “grades.grade”: “A” } }:
このステップでは、“grades.grade” フィールドが “A” のものに絞り込みます。
{ $group: { _id: “$restaurant_id”, count: { $sum: 1 } } }:
このステップでは、“restaurant_id” をグループ化キーとして使用し、”grades.grade” フィールドが “A” である各レストランのカウントを計算します。
{ $sort: { count: -1 } }:
このステップでは、カウントに基づいて結果を降順にソートします。
{ $group: { _id: “$count”, restaurants: { $push: “$_id” } } }:
このステップでは、同じカウントを持つレストランをグループ化し、それぞれのカウントに対応する “restaurant_id” の配列を作成します。
{ $sort: { _id: -1 } }:
このステップでは、カウントに基づいて結果を降順にソートします。
{ $limit: 1 }:
このステップでは、ソート済み結果から1つだけを選択します。
{ $project: { restaurants: 1 } }:
このステップでは、結果に含まれるフィールドを制御し、“restaurants” フィールドのみを投影します。
この集計パイプラインの目的は、”grades.grade” フィールドが “A” である各レストランのカウントを計算し、同じカウントを持つレストランをグループ化して、最も多いカウントを持つグループの “restaurant_id” の配列を返すことです。
Previous:最も高い平均スコアを獲得したレストランを見つける
コメント