【推荐收藏不吃灰系列】万字介绍python MongoDB数据库

424 阅读8分钟

前言

近期更新了python语法编程丶python并发编程,前几天更是更新了python数据库编程的第一模块MySQL数据库和Redis数据库,目前还剩下MongoDB数据库,今天来更新一下,算是画上个句号吧,大多数也有视频,结合效果更佳

今天的《用python自动识别打怪升级》同理也能用到绝地求生等游戏上,有兴趣的可以回头翻翻看

关注公众号:python技术训练营
提前解锁 《整套50W字python体系PDF》,让学习更贴近未来实战。

内容囊括

1.面试专题几十个大厂面试题
2.入门基础教程
3.11模块零基础到精通笔记
4.百个项目实战+爬虫教程+代码
5.量化交易,机器学习,深度学习
6.Python游戏源码
7.交流学习

整理不易,点赞+关注一下吧😉

一丶MongoDB简单介绍

Python MongoDB是一种非关系型数据库,也被称为NoSQL数据库。旨在提供高性能、高可用性和可扩展性的数据存储解决方案。Python MongoDB使用JSON格式存储数据,这使得它非常适合处理大量非结构化数据。

Python MongoDB的主要特点包括

  • 高性能:Python MongoDB使用内存映射技术,可以快速读取和写入数据。

  • 高可用性:Python MongoDB支持主从复制和分片技术,可以保证数据的可靠性和可用性。

  • 可扩展性:Python MongoDB可以轻松地扩展到多个节点,以满足不断增长的数据需求。

  • 灵活性:Python MongoDB支持动态模式,可以根据需要随时更改数据结构。

  • 易用性:Python MongoDB提供了简单易用的API,可以轻松地进行数据操作。

Python MongoDB的安装非常简单,只需要使用pip命令即可安装。安装完成后,可以使用pymongo库来连接和操作MongoDB数据库。

Python MongoDB的应用场景非常广泛,特别是在大数据处理和实时数据分析方面。它可以用于存储日志数据、社交媒体数据、物联网数据等各种类型的非结构化数据。同时,Python MongoDB也可以与其他数据存储解决方案(如关系型数据库)进行集成,以满足不同的数据处理需求。

总之,Python MongoDB是一种高性能、高可用性和可扩展性的数据存储解决方案,可以帮助开发人员轻松地处理大量非结构化数据。

二丶关于database的基础命令

MongoDB是一种非关系型数据库,它使用文档存储数据,而不是使用表格。Python是一种流行的编程语言,它可以与MongoDB数据库进行交互。在Python中,我们可以使用PyMongo库来连接和操作MongoDB数据库。

在MongoDB中,我们可以使用以下基础命令来管理数据库:

创建数据库

在MongoDB中,我们可以使用use命令来创建一个新的数据库。例如,要创建一个名为mydatabase的数据库,我们可以使用以下命令:

use mydatabase

如果数据库不存在,则MongoDB将创建一个新的数据库。如果数据库已经存在,则MongoDB将返回该数据库的引用。

显示数据库

要显示MongoDB中所有的数据库,我们可以使用以下命令:

show dbs

这将列出MongoDB中所有的数据库。

删除数据库

要删除MongoDB中的数据库,我们可以使用以下命令:

db.dropDatabase()

这将删除当前选定的数据库。

切换数据库

要切换到MongoDB中的另一个数据库,我们可以使用以下命令:

use anotherdatabase

这将切换到名为anotherdatabase的数据库。

显示当前数据库

要显示当前选定的数据库,我们可以使用以下命令:

db

这将返回当前选定的数据库的引用。

总之,Python与MongoDB数据库的交互非常方便,可以使用PyMongo库来连接和操作MongoDB数据库。在Python中,我们可以使用基础命令来管理数据库,例如创建、显示、删除和切换数据库。

三丶关于集合的基础命令

Python MongoDB数据库关于集合的基础命令

在Python中使用MongoDB数据库时,集合是MongoDB中的一个重要概念。集合类似于关系型数据库中的表,但是MongoDB是一个文档型数据库,因此集合中存储的是文档。

以下是Python MongoDB数据库关于集合的基础命令

创建集合

要创建一个集合,可以使用MongoDB的db.create_collection()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来创建集合。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 创建一个名为mycollection的集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

插入文档

要向集合中插入文档,可以使用MongoDB的db.collection.insert()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来插入文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 插入一条文档
mydict = { "name": "John", "address": "Highway 37" }
x = mycol.insert_one(mydict)

查询文档

要查询集合中的文档,可以使用MongoDB的db.collection.find()方法。在Python中,可以使用pymongo库中的Collection类的find()方法来查询文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 查询所有文档
for x in mycol.find():
  print(x)

更新文档

要更新集合中的文档,可以使用MongoDB的db.collection.update()方法。在Python中,可以使用pymongo库中的Collection类的update_one()方法来更新文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 更新一条文档
myquery = { "address": "Highway 37" }
newvalues = { "$set": { "address": "Park Lane 38" } }
mycol.update_one(myquery, newvalues)

删除文档

要删除集合中的文档,可以使用MongoDB的db.collection.remove()方法。在Python中,可以使用pymongo库中的Collection类的delete_one()方法来删除文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 删除一条文档
myquery = { "address": "Park Lane 38" }
mycol.delete_one(myquery)

四丶数据类型

MongoDB数据库支持以下数据类型

  • String(字符串):存储文本数据,最常用的数据类型。

  • Integer(整型):存储整数。

  • Boolean(布尔型):存储布尔值(true/false)。

  • Double(双精度浮点型):存储浮点数。

  • Min/Max keys(最小值/最大值):用于比较值的最小值和最大值。

  • Arrays(数组):用于存储数组或列表。

  • Timestamp(时间戳):记录文档修改或添加的时间。

  • Object(对象):用于嵌入式文档。

  • Null(空值):用于表示空值或不存在的字段。

  • Symbol(符号):类似于字符串,但是用于特定的上下文环境。

  • Date(日期):用于存储日期和时间。

  • Object ID(对象ID):用于唯一标识文档。

  • Binary data(二进制数据):用于存储二进制数据,如图片、音频等。

  • Code(代码):用于存储JavaScript代码。

  • Regular expression(正则表达式):用于存储正则表达式。

五丶数据操作

Python中操作MongoDB数据库的方式有多种,可以使用官方提供的pymongo库,也可以使用第三方库mongoengine等。

以下是pymongo库的基本数据操作:

连接数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['testdb']

插入数据

collection = db['testcollection']
data = {'name': 'Tom', 'age': 18}
collection.insert_one(data)

查询数据

# 查询所有数据
result = collection.find()
for item in result:
    print(item)

# 查询指定条件的数据
result = collection.find({'name': 'Tom'})
for item in result:
    print(item)

更新数据

# 更新一条数据
collection.update_one({'name': 'Tom'}, {'$set': {'age': 20}})

# 更新多条数据
collection.update_many({'name': 'Tom'}, {'$set': {'age': 20}})

删除数据

# 删除一条数据
collection.delete_one({'name': 'Tom'})

# 删除多条数据
collection.delete_many({'name': 'Tom'})

聚合操作

# 统计数据总数
count = collection.count_documents({})

# 按条件分组统计
result = collection.aggregate([
    {'$group': {'_id': '$name', 'count': {'$sum': 1}}}
])
for item in result:
    print(item)

以上是pymongo库的基本数据操作,其他库的操作方式也类似

六丶数据的备份与恢复

Python中备份和恢复MongoDB数据库可以使用mongodumpmongorestore命令,也可以使用pymongo库中的函数进行操作。

使用mongodumpmongorestore命令备份和恢复MongoDB数据库

备份MongoDB数据库:

mongodump --host <host> --port <port> --db <database> --out <backup_directory>

其中,是MongoDB服务器的IP地址或主机名,是MongoDB服务器的端口号,默认为27017,是要备份的数据库名称,<backup_directory>是备份文件存放的目录。

恢复MongoDB数据库:

mongorestore --host <host> --port <port> --db <database> <backup_directory>

其中,、、和<backup_directory>的含义与备份命令相同。

使用pymongo库备份和恢复MongoDB数据库

备份MongoDB数据库:

import pymongo
import datetime

client = pymongo.MongoClient("<mongodb_uri>")
db = client["<database>"]
collection = db["<collection>"]

backup = collection.find()

with open("<backup_file>", "w") as f:
    for doc in backup:
        f.write(str(doc) + "\n")

其中,<mongodb_uri>是MongoDB服务器的URI,和是要备份的数据库和集合名称,<backup_file>是备份文件的路径。

恢复MongoDB数据库:

import pymongo

client = pymongo.MongoClient("<mongodb_uri>")
db = client["<database>"]
collection = db["<collection>"]

with open("<backup_file>", "r") as f:
    for line in f:
        doc = eval(line.strip())
        collection.insert_one(doc)

其中,<mongodb_uri>、、和<backup_file>的含义与备份命令相同。注意,这种方法只适用于备份和恢复小型数据库,对于大型数据库,建议使用mongodumpmongorestore命令进行操作。

七丶聚合操作

MongoDB的聚合操作是指将多个文档进行分组、筛选、排序、计算等操作,以生成新的文档集合的过程。Python中可以使用pymongo库来进行MongoDB的聚合操作。

以下是一个简单的聚合操作示例,假设我们有一个名为students的集合,其中包含每个学生的姓名、年龄和成绩:

from pymongo import MongoClient

client = MongoClient()
db = client['test']
collection = db['students']

pipeline = [
    {"$group": {"_id": "$age", "avg_score": {"$avg": "$score"}}},
    {"$sort": {"_id": 1}}
]

result = collection.aggregate(pipeline)

for doc in result:
    print(doc)

上述代码中,我们使用了MongoDB的group和group和avg操作符来计算每个年龄段的平均成绩,并使用$sort操作符按年龄升序排序。最终的结果将会是一个包含每个年龄段平均成绩的文档集合。

除了group和group和avg操作符外,MongoDB还提供了许多其他的聚合操作符,如match、match、project、sort、sort、limit等,可以根据具体需求进行组合使用。

八丶索引

MongoDB中的索引是用于提高查询性能的一种数据结构。在MongoDB中,可以使用多种类型的索引,包括单字段索引、复合索引、全文索引等。

以下是使用Python操作MongoDB索引的示例:

创建单字段索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建单字段索引
collection.create_index("name")

# 查询是否创建成功
print(collection.index_information())

创建复合索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建复合索引
collection.create_index([("name", 1), ("age", -1)])

# 查询是否创建成功
print(collection.index_information())

创建全文索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建全文索引
collection.create_index([("content", "text")])

# 查询是否创建成功
print(collection.index_information())

查询使用索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 查询使用索引
result = collection.find({"name": "Tom"}).explain()["executionStats"]
print(result)

以上是Python操作MongoDB索引的示例,可以根据实际需求选择不同类型的索引来提高查询性能。

九丶pymongo的操作

Python中操作MongoDB数据库需要使用pymongo库,以下是pymongo库的常用操作:

连接MongoDB数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')

选择数据库

db = client['database_name']

选择集合

collection = db['collection_name']

插入文档

data = {'name': 'John', 'age': 25}
collection.insert_one(data)

查询文档

result = collection.find_one({'name': 'John'})

更新文档

collection.update_one({'name': 'John'}, {'$set': {'age': 30}})

删除文档

collection.delete_one({'name': 'John'})

查询多个文档

results = collection.find({'age': {'$gt': 20}})
for result in results:
    print(result)

以上是pymongo库的常用操作,可以根据实际需求进行调用。

关注公众号:python技术训练营
提前解锁 《整套50W字python体系PDF》,让学习更贴近未来实战。

内容囊括

1.面试专题几十个大厂面试题
2.入门基础教程
3.11模块零基础到精通笔记
4.百个项目实战+爬虫教程+代码
5.量化交易,机器学习,深度学习
6.Python游戏源码
7.交流学习

整理不易,点赞+关注一下吧😉