MongoDB入门与基础操作详解 - 数据库编程

本文将深入解析MongoDB的基本操作，包括数据库切换、集合创建和文档查询，帮助初学者掌握核心技能并理解其背后的机制。

MongoDB是一款广泛使用的NoSQL数据库系统，以其灵活的数据模型和高性能著称。本文将基于MongoDB Shell，从基础操作入手，如数据库切换、集合创建和文档查询，帮助读者快速上手并理解其中的关键概念和实践技巧。

数据库切换

在MongoDB Shell中，db变量用于表示当前数据库。如果尚未选择任何数据库，db将默认为test。要切换数据库，使用use <db-name>命令。例如，切换到名为examples的数据库：

use examples

此命令不会创建数据库，只有在您首次插入数据时，MongoDB才会自动创建该数据库。验证当前数据库是否已切换，可以再次输入db，其输出应为examples。

集合创建与文档插入

MongoDB将数据存储在集合中，类似于关系数据库中的表。如果集合不存在，MongoDB会在您首次插入数据时自动创建它。以下是使用insertMany()方法将文档插入inventory集合的示例：

db.inventory.insertMany([
  { item: "journal", qty: 25, status: "A", size: { h: 14, w: 21, uom: "cm" }, tags: ["blank", "red"] },
  { item: "notebook", qty: 50, status: "A", size: { h: 8.5, w: 11, uom: "in" }, tags: ["red", "blank"] },
  { item: "paper", qty: 10, status: "D", size: { h: 8.5, w: 11, uom: "in" }, tags: ["red", "blank", "plain"] },
  { item: "planner", qty: 0, status: "D", size: { h: 22.85, w: 30, uom: "cm" }, tags: ["blank", "red"] },
  { item: "postcard", qty: 45, status: "A", size: { h: 10, w: 15.25, uom: "cm" }, tags: ["blue"] }
]);

执行此命令后，MongoDB会为每个文档添加一个_id字段，其值为ObjectId类型。insertMany()方法返回一个包含确认指示符和成功插入文档的_id列表的结果。

文档查询

MongoDB提供了丰富的查询方法，其中最常用的是find()。要查询集合中的所有文档，可以使用空文档作为查询过滤器：

db.inventory.find({})

为了使结果更清晰，可以添加.pretty()方法进行格式化：

db.inventory.find({}).pretty()

相等匹配

对于相等匹配，您可以指定字段和值的组合。例如，查询status字段等于"D"的所有文档：

db.inventory.find({ status: "D" });

同样，您可以查询qty字段等于0的文档：

db.inventory.find({ qty: 0 });

若需同时匹配多个字段，可以使用逗号分隔的字段值对：

db.inventory.find({ qty: 0, status: "D" });

嵌套文档匹配

当处理嵌套文档时，MongoDB支持使用点符号进行字段访问。例如，查询size.uom字段等于"in"的文档：

db.inventory.find({ "size.uom": "in" });

完全匹配嵌套文档

对于嵌套文档的完全匹配，所有字段和值必须一致，包括字段顺序。例如，查询size字段等于{ h: 14, w: 21, uom: "cm" }的文档：

db.inventory.find({ size: { h: 14, w: 21, uom: "cm" } });

数组匹配

MongoDB还支持对数组字段的查询。例如，查询tags数组包含"red"的文档：

db.inventory.find({ tags: "red" });

若tags字段是数组类型，且需要完全匹配，可以使用：

db.inventory.find({ tags: [ "red", "blank" ] });

字段投影

在查询文档时，您可以选择返回的字段。通过传递一个投影文档给find()方法，可以控制哪些字段需要显示或隐藏。例如，返回item和status字段：

db.inventory.find({}, { item: 1, status: 1 });

默认情况下，_id字段会自动包含在查询结果中。若要排除_id字段，可以将其设置为0：

db.inventory.find({}, { _id: 0, item: 1, status: 1 });

进一步学习

MongoDB Shell提供了许多功能，包括查询、更新和删除文档。以下是一些进一步学习的建议：

查询操作：了解如何使用find()方法进行复杂查询，包括使用$gt、$lt、$in等查询运算符。
更新操作：熟悉updateOne()和updateMany()方法，以便进行数据更新。
删除操作：掌握deleteOne()和deleteMany()方法，了解如何删除文档。

实战案例：电商数据处理

假设您正在构建一个电商数据库，其中包括商品库存信息。inventory集合中存储了商品的名称、数量、状态、尺寸和标签等信息。以下是几个实际场景中的查询优化策略：

场景一：库存查询

您需要查询所有status为"A"的商品，以确保它们处于可用状态。使用以下命令：

db.inventory.find({ status: "A" });

场景二：特定尺寸商品查询

您需要查询size.uom为"in"的商品，以确定它们是否符合某种规格。使用以下命令：

db.inventory.find({ "size.uom": "in" });

场景三：商品详情查询

您希望获取商品的详细信息，包括item、qty、size和tags，但不希望包含_id字段。使用以下命令：

db.inventory.find({}, { _id: 0, item: 1, qty: 1, size: 1, tags: 1 });

场景四：商品状态与数量查询

您需要查询status为"D"且qty为0的商品，这可能意味着商品已停售。使用以下命令：

db.inventory.find({ status: "D", qty: 0 });

索引与性能优化

为了提升查询性能，您可以为常用字段创建索引。索引可以显著加快查询速度，但也会增加写入操作的开销。以下是一个创建索引的示例：

db.inventory.createIndex({ status: 1, qty: 1 });

该命令为status和qty字段创建了一个升序索引。创建索引后，find()查询将更快地定位到符合条件的文档。

索引选择原则

高选择性字段：优先对高选择性字段（如status）创建索引，以提高查询效率。
避免过度索引：过多索引会影响写入性能，应根据实际需求合理创建索引。
复合索引：对于多条件查询，创建复合索引可以提升性能，但需注意索引顺序。

高可用与分片架构

对于大规模应用，MongoDB提供了高可用和分片集群方案。以下是一些关键概念：

高可用架构

MongoDB支持副本集（Replica Set），它通过多个节点实现数据的自动故障转移和冗余备份。副本集包括一个主节点和多个从节点，主节点负责写入操作，从节点用于读取和备份。以下是创建副本集的简要步骤：

启动多个MongoDB实例。
配置副本集。
将实例加入副本集。
验证副本集状态。

分片集群

当数据量增长到一定规模时，可以使用分片集群来实现水平扩展。分片将数据分布到多个分片节点，每个节点存储数据的一部分。以下是分片集群的关键组成部分：

分片节点（Shard）：存储数据的节点。
配置服务器（Config Server）：管理分片元数据。
路由服务器（MongoS）：处理客户端请求并分发到适当的分片节点。

总结

本文介绍了MongoDB的基本操作，包括数据库切换、集合创建和文档查询。在实际应用中，合理使用索引、优化查询和设计良好的数据模型是提升性能的关键。通过掌握这些基础技能，您可以更好地利用MongoDB进行数据管理和应用开发。

关键字列表：
MongoDB, Shell, 数据库, 集合, 文档, 查询, 索引, 优化, 分片, 高可用