文档数据库 MongoDB

mongodb环境准备与配置指南,适用于windows和ubuntu平台

什么是NoSQL数据库?

NoSQL数据库不同于传统的关系型数据库(如SQLite3、MySQL),它不依赖SQL语言进行操作,而是存储JSON格式的数据。

MongoDB是一款开源、跨平台、分布式的文档数据库,使用C++开发,专注于高效处理大数据。它的性能在数据量超过50GB时,比MySQL快10倍以上。MongoDB通过将数据加载到内存中来提升查询速度,适用于内存资源丰富的环境。

Python开发者通常选择MongoDB作为爬虫数据存储的首选,因为它能直接存储JSON数据,操作简便,学习曲线平缓。

概念对比

MySQL MongoDB 表(Table) 集合(Collection) 行(Row) 文档(Document) 字段(Column) 键值对(Field)

环境准备

MongoDB支持跨平台使用,我们建议从Windows开始学习,Linux上的配置更为简便。

Windows平台安装

从MongoDB官方网站下载适合你电脑系统的版本[^1]。安装过程中,建议不要选择

install MongoDB Compass
,因为它可能会导致安装过程卡顿。建议使用更优质的图形化工具替代。

安装完成后,添加

mongodb\bin
目录到系统PATH环境变量中,以便在命令行中使用MongoDB。

创建数据库文件夹(如d:/mongodb/data/db),并使用命令

mongod --dbpath D:\mongodb\data\db
启动MongoDB。

检查启动情况,通过浏览器访问http://localhost:27017。

配置MongoDB服务

创建配置文件(位于C:\mongodb\mongod.cfg),内容如下:

systemLog:
    destination: file
    path: E:\MongDb\log\mongod.log
storage:
    dbPath: E:\MongDb\data\db

以管理员身份打开命令行,运行以下命令安装MongoDB服务:

mongod --config C:\mongodb\mongod.cfg --install --serviceName "MongoDB"

启动和关闭MongoDB服务:

net start MongoDB
net stop MongoDB

移除MongoDB服务:

mongod --remove

报错处理

确保

db
log
文件夹已经创建。如果在Linux系统上,还需确认文件夹的读写权限。

图形化工具

Ubuntu平台安装

在Ubuntu下,只需运行以下命令即可安装MongoDB:

sudo apt-get install mongodb

简单示例

安装Python的MongoDB驱动模块

pymongo

python -m pip install pymongo

示例代码:

import pymongo

连接数据库

myclient = pymongo.MongoClient("mongodb://localhost:27017/") mydb = myclient["mytest"]

创建名为"myset"的集合

mycol = mydb["myset"]

创建字典

mydict = {"name": "RUNOOB", "alexa": "10000", "url": "https://www./link/974e22cdbdb3734482fd0bcc2dc9bb79"}

插入数据

mycol.insert_one(mydict)

关闭连接

myclient.close()

参考资料

[^1]: 官方下载地址: https://www./link/197410d59aa228e0c9af78e1950d2381

[^2]: 中文文档: https://www./link/cd6c652e6f498d4363bff3c4b63bd685

[^3]: Robo 3T : https://www./link/04dce75ffbe9517b642899d80d63d41f