携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第16天,点击查看活动详情 大家好,我是辣条。
目录
Mongodb的的增删改查
-
mongodb插入数据
-
mongodb的保存
3 mongodb的查询
4 mongodb的更新
5 mongodb的删除
mongodb的聚合操作
1 mongodb的聚合是什么
2 mongodb的常用管道和表达式
3 管道命令之$group
4 管道命令之$match
5 管道命令之$project
6 管道命令之$sort
7 管道命令之limit
-
为什么mongdb需要创建索引
-
mongodb创建简单的索引方法
-
创建索引前后查询速度对比
-
索引的查看
-
删除索引
-
mongodb创建唯一索引
-
建立复合索引
-
建立索引注意点
Mongodb的权限管理
-
为什么要进行权限管理的设置
-
mongodb的权限管理方案
-
mongodb超级管理员账号的创建
-
创建普通用户
-
查看创建的用户
-
删除用户
mongodb和python交互
-
mongdb和python交互的模块
-
使用pymongo
-
pymongo模块其他api
Mongodb的的增删改查
- mongodb插入数据 命令:db.集合名称.insert(document)
db.stu.insert({name:'gj', gender:1}) db.stu.insert({_id:"20170101", name:'gj', gender:1}) 插文档时,如果不指定_id参数,MongoDB会为文档自动分配一个唯一的ObjectId
- mongodb的保存 命令:db.集合名称.save(document)
db.stu.save({_id:'20170101', name:'gj', gender:2}) db.stu.save({name:'gj', gender:2}) db.stu.find() 如果文档的id已经存在则修改,如果id不存在则添加
3 mongodb的查询 命令:db.集合名称.find()
可以使用以下数据进行练习
db.stu.insert([{"name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true }, {"name" : "黄蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false }, {"name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false }, {"name" : "黄药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }, {"name" : "段誉", "hometown" : "大理", "age" : 16, "gender" : true }, {"name" : "段王爷", "hometown" : "大理", "age" : 45, "gender" : true }, {"name" : "洪七公", "hometown" : "华筝", "age" : 18, "gender" : true }]) 3.1 简单查询
方法find(): 查询
db.集合名称.find({条件文档})
方法findOne():查询,只返回第一个
db.集合名称.findOne({条件文档})
方法pretty(): 将结果格式化;不能和findOne()一起使用!
db.集合名称.find({条件文档}).pretty()
3.2 比较运算符
等于: 默认是等于判断, 没有运算符
小于:$lt (less than)
小于等于:$lte (less than equal)
大于:$gt (greater than)
大于等于:$gte
不等于:$ne
查询年龄大于18的所有学生 db.stu.find({age:{$gte:18}}) 3.3 逻辑运算符
逻辑运算符主要指与、或逻辑
and:在json中写多个条件即可
查询年龄大于或等于18, 并且性别为true的学生 db.stu.find({age:{gte:18},gender:true}) or:使用or, 值为数组, 数组中每个元素为json
查询年龄大于18, 或性别为false的学生 db.stu.find({or:[{age:{gt:18}},{gender:false}]}) 查询年龄大于18或性别为男生, 并且姓名是郭靖 db.stu.find({or:[{age:{gte:18}},{gender:true}],name:'gj'}) 3.4 范围运算符
使用nin 判断数据是否在某个数组内
查询年龄为18、 28的学生 db.stu.find({age:{$in:[18,28,38]}}) 3.5 支持正则表达式
使用$regex编写正则表达式
查询name以'黄'开头的数据 db.stu.find({name:{$regex:'^黄'}}) 3.6 自定义查询
mongo shell 是一个js的执行环境 使用$where 写一个函数, 返回满足条件的数据
查询年龄大于30的学生 db.stu.find({ $where:function() { return this.age>30;} }) 3.7 skip和limit
方法limit(): 用于读取指定数量的文档
db.集合名称.find().limit(NUMBER) 查询2条学生信息 db.stu.find().limit(2) 方法skip(): 用于跳过指定数量的⽂档
db.集合名称.find().skip(NUMBER) db.stu.find().skip(2) 同时使用
db.stu.find().limit(4).skip(5) db.stu.find().skip(5).limit(4) 注意:先使用skip在使用limit的效率要高于前者
3.8 投影
在查询到的返回结果中, 只选择必要的字段
命令:db.集合名称.find({},{字段名称:1,...})
参数为字段与值, 值为1表示显示, 值为0不显 特别注意:
对于_id列默认是显示的, 如果不显示需要明确设置为0
对于其他不显示的字段不能设置为0
db.stu.find({},{_id:0,name:1,gender:1})
3.9 排序
方法sort(), 用于对查询结果按照指定的字段进行排序
命令:db.集合名称.find().sort({字段:1,...})
参数1为升序排列 参数-1为降序排列
根据性别降序, 再根据年龄升序 db.stu.find().sort({gender:-1,age:1}) 3.10 统计个数
方法count()用于统计结果集中文档条数
命令:db.集合名称.find({条件}).count() 命令:db.集合名称.count({条件})
db.stu.find({gender:true}).count() db.stu.count({age:{$gt:20},gender:true}) 4 mongodb的更新 db.集合名称.update({query}, {update}, {multi: boolean}) 参数query:查询条件
参数update:更新操作符
参数multi:可选,默认是false,表示只更新找到的第一条数据,值为true表示把满足条件的数据全部更新
db.stu.update({name:'hr'},{name:'mnc'}) # 全文档进行覆盖更新 db.stu.update({name:'hr'},{set:{name:'hys'}}) # 指定键值更新操作 db.stu.update({},{set:{gender:0}},{multi:true}) # 更新全部 注意:"multi update only works with $ operators"
multi参数必须和$set一起使用!
5 mongodb的删除 db.集合名称.remove({query}, {justOne: boolean})
- 参数query:可选,删除的⽂档的条件
- 参数justOne:可选, 如果设为true或1,则只删除一条,默认false,表示删除全部 mongodb的聚合操作 1 mongodb的聚合是什么 聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。
语法:db.集合名称.aggregate({管道:{表达式}})
2 mongodb的常用管道和表达式 知识点:
掌握mongodb中管道的语法
掌握mongodb中管道命令
2.1 常用管道命令
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理 常用管道命令如下:
$group: 将集合中的⽂档分组, 可⽤于统计结果
$match: 过滤数据, 只输出符合条件的⽂档
$project: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果
$sort: 将输⼊⽂档排序后输出
$limit: 限制聚合管道返回的⽂档数
$skip: 跳过指定数量的⽂档, 并返回余下的⽂档
2.2 常用表达式
表达式:处理输⼊⽂档并输出 语法:表达式:'$列名' 常⽤表达式:
sum:1 表示以⼀倍计数
$avg: 计算平均值
$min: 获取最⼩值
$max: 获取最⼤值
$push: 在结果⽂档中插⼊值到⼀个数组中
3 管道命令之$group 3.1 按照某个字段进行分组
$group是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果
使用示例如下
db.stu.aggregate( {group: { _id:"gender", counter:{$sum:1} } } ) 其中注意点:
db.db_name.aggregate是语法,所有的管道命令都需要写在其中
_id 表示分组的依据,按照哪个字段进行分组,需要使用$gender表示选择这个字段进行分组
$sum:1 表示把每条数据作为1进行统计,统计的是该分组下面数据的条数
3.2 group by null
当我们需要统计整个文档的时候,$group 的另一种用途就是把整个文档分为一组进行统计
使用实例如下:
db.stu.aggregate( {group: { _id:null, counter:{sum:1} } } ) 其中注意点:
_id:null 表示不指定分组的字段,即统计整个文档,此时获取的counter表示整个文档的个数
3.3 数据透视
正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视
使用示例如下:
统计不同性别的学生
db.stu.aggregate( {group: { _id:null, name:{push:"$name"} } } ) 使用$$ROOT可以将整个文档放入数组中
db.stu.aggregate( {group: { _id:null, name:{push:"$$ROOT"} } } ) 3.4 动手
对于如下数据,需要统计出每个country/province下的userid的数量(同一个userid只统计一次)
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
参考答案
db.tv3.aggregate( {group:{_id:{country:'country',province:'userid'}}}, {group:{_id:{country:'_id.country',province:'_id.province'},count:{sum:1}}} 4 管道命令之match用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于$match 操作可以把结果交给下一个管道处理,而find不行
5 管道命令之project用于修改文档的输入输出结构,例如重命名,增加,删除字段
6 管道命令之sort用于将输入的文档排序后输出
7 管道命令之limit $limit限制返回数据的条数
$skip 跳过指定的文档数,并返回剩下的文档数
同时使用时先使用skip在使用limit
- 为什么mongdb需要创建索引 加快查询速度
进行数据的去重
-
mongodb创建简单的索引方法 语法:db.集合名.ensureIndex({属性:1}),1表示升序, -1表示降序
-
创建索引前后查询速度对比 测试:插入10万条数据到数据库中
插入数据:
for(i=0;i<100000;i++){db.t1.insert({name:'test'+i,age:i})} 创建索引前:
db.t1.find({name:'test10000'}) db.t1.find({name:'test10000'}).explain('executionStats') # 显示查询操作的详细信息 创建索引:
db.t1.ensureIndex({name:1}) 创建索引后:
db.t1.find({name:'test10000'}).explain('executionStats') 前后速度对比
-
索引的查看 默认情况下_id是集合的索引 查看方式:db.集合名.getIndexes()
-
删除索引 语法:db.集合名.dropIndex({'索引名称':1})
db.t1.dropIndex({name:1}) db.t1.getIndexes() 6. mongodb创建唯一索引 在默认情况下mongdb的索引域的值是可以相同的,创建唯一索引之后,数据库会在插入数据的时候检查创建索引域的值是否存在,如果存在则不会插入该条数据,但是创建索引仅仅能够提高查询速度,同时降低数据库的插入速度。
6.1 添加唯一索引的语法:
db.集合名.ensureIndex({"字段名":1}, {"unique":true}) 6.2 利用唯一索引进行数据去重
根据唯一索引指定的字段的值,如果相同,则无法插入数据
db.t1.ensureIndex({"name":1}, {"unique":true}) db.t1.insert({name: 'test10000'}) 7. 建立复合索引 在进行数据去重的时候,可能用一个域来保证数据的唯一性,这个时候可以考虑建立复合索引来实现。
例如:抓全贴吧信息,如果把帖子的名字作为唯一索引对数据进行去重是不可取的,因为可能有很多帖子名字相同
建立复合索引的语法:db.collection_name.ensureIndex({字段1:1,字段2:1})
- 建立索引注意点 根据需要选择是否需要建立唯一索引
索引字段是升序还是降序在单个索引的情况下不影响查询效率,但是带复合索引的条件下会有影响
数据量巨大并且数据库的读出操作非常频繁的时候才需要创建索引,如果写入操作非常频繁,创建索引会影响写入速度
例如:在进行查询的时候如果字段1需要升序的方式排序输出,字段2需要降序的方式排序输出,那么此时复合索引的建立需要把字段1设置为1,字段2设置为-1
Mongodb的权限管理
-
为什么要进行权限管理的设置 刚安装完毕的mongodb默认不使用权限认证方式启动,与MySQL不同,mongodb在安装的时候并没有设置权限,然而公网运行系统需要设置权限以保证数据安全,所以我们要学习mongodb的权限管理
-
mongodb的权限管理方案 MongoDB是没有默认管理员账号,所以要先添加管理员账号,并且mongodb服务器需要在运行的时候开启验证模式
用户只能在用户所在数据库登录(创建用户的数据库),包括管理员账号。
管理员可以管理所有数据库,但是不能直接管理其他数据库,要先认证后才可以。
- mongodb超级管理员账号的创建 3.1 创建超级用户
进入mongo shell
sudo mongod 使用admin数据库(超级管理员账号必须创建在该数据库上)
use admin 创建超级用户
db.createUser({"user":"python","pwd":"python","roles":["root"]}) 创建成功会显示如下信息
Successfully added user: { "user" : "python", "roles" : [ "root" ] } 退出mongo shell
exit 3.2 以权限认证的方式启动mongodb数据库
sudo mongod --auth 启动之后在启动信息中会有如下信息,说明mongodb以权限认证的方式启动成功
[initandlisten] options: { security: { authorization: "enabled" } } 3.3 登录验证
此时再使用数据库各命令的时候会报权限错误,需要认证才能执行相应操作、
use admin db.auth('python','python') python用户是创建在admin数据库上的所以必须来到admin数据库上进行认证
认证成功会返回1,失败返回0
- 创建普通用户 4.1 在使用的数据库上创建普通用户
1.选择需要创建用户的数据库
use test1 创建用户
db.createUser("user":"user1", "pwd":"pwd1", roles:["read"]) 创建普通用户user1,该用户在test1上的权限是只读 db.createUser("user":"user1", "pwd":"pwd1", roles:["readWrite"]) 创建普通用户user1,该用户在test1上的权限是读写 4.2 在admin用户数据库上创建普通用户
use admin db.createUser({"user":"python1", "pwd":"python1", roles:[{"role":"read","db":"dbname1"},{"role":"readWrite","db":"dbname2"} ]}) 在admin上创建python1用户,python1用户的权限有两个,一个再dbname1上的只读,另一个是在dbname2上的读写
- 查看创建的用户 show users { "_id" : "admin.python", "user" : "python", "db" : "admin", "roles" : [ { "role" : "root", "db" : "admin" } ] }
- 删除用户 6.1 进入账号数据所在的数据库
use db_name 6.2 删除用户
db.dropUser('python') mongodb和python交互
-
mongdb和python交互的模块 pymongo 提供了mongdb和python交互的所有方法 安装方式: pip install pymongo
-
使用pymongo 2.1 导入pymongo并选择要操作的集合
数据库和集合能够自动创建
2.1.1 无需权限认证的方式创建连接对象以及集合操作对象
from pymongo import MongoClient client = MongoClient(host,port) # 如果是本地连接host,port参数可以省略 collection = client[db名][集合名]
collection = client.db名.集合名 # 与上边用法相同
2.1.2 需要权限认证的方式创建连接对象以及集合操作对象
from pymongo import MongoClient from urllib.parse import quote_plus user = 'python' # 账号 password = 'python' # 密码 host = '127.0.0.1' # host port = 27017 # port uri = "mongodb://%s:%s@%s" % (quote_plus(user), quote_plus(password), host)
quote_plus函数:对url进行编码
uri = mongodb://python:python@127.0.0.1
client = MongoClient(uri, port=port) collection = client.db名.集合名 2.2 insert()添加数据
insert可以批量的插入数据列表,也可以插入一条数据
collection.insert({一条数据}) collection.insert([{数据一},{数据二}]) 2.2.1 添加一条数据
返回插入数据的_id
ret = collection.insert({"name":"test10010","age":33}) print(ret) 2.2.2 添加多条数据
返回ObjectId对象构成的列表
item_list = [{"name":"test1000{}".format(i)} for i in range(10)] rets = collection.insert(item_list) print(rets) for ret in rets: print(ret) 2.3 find_one()查找一条数据
接收一个字典形式的条件,返回字典形式的整条数据 如果条件为空,则返回第一条
ret = client.test.test.find_one({'name': 'test10001'}) print(ret) # 包含mongodb的ObjectId对象的字典 _ = ret.pop('_id') # 清除mongodb的ObjectId对象的k,v print(ret) 2.4 find()查找全部数据
返回所有满足条件的结果,如果条件为空,则返回全部 结果是一个Cursor游标对象,是一个可迭代对象,可以类似读文件的指针,但是只能够进行一次读取
rets = collection.find({"name":"test10005"}), for ret in rets: print(ret) for ret in rets: #此时rets中没有内容 print(ret) 2.5 update()更新数据(全文档覆盖或指定键值,更新一条或多条)
语法:collection.update({条件}, {'$set':{指定的kv或完整的一条数据}}, multi=False/True, upsert=False/True)
multi参数:默认为False,表示更新一条; multi=True则更新多条; multi参数必须和$set一起使用
upsert参数:默认为False; upsert=True则先查询是否存在,存在则更新;不存在就插入
$set表示指定字段进行更新
2.5.1 更新一条数据;全文档覆盖;存在就更新,不存在就插入
data = {'msg':'这是一条完整的数据1','name':'哈哈'} client.test.test.update({'haha': 'heihei'}, {'$set':data}, upsert=True) 2.5.2 更新多条数据;全文档覆盖;存在就更新,不存在就插入
data = {'msg':'这是一条完整的数据2','name':'哈哈'} # 该完整数据是先查询后获取的 client.test.test.update({}, {'$set':data}, multi=True, upsert=True) 2.5.3 更新一条数据;指定键值;存在就更新,不存在就插入
data = {'msg':'指定只更新msg___1'} client.test.test.update({}, {'$set':data}, upsert=True) 2.5.4 更新多条数据;指定键值;存在就更新,不存在就插入
data = {'msg':'指定只更新msg___2'} client.test.test.update({}, {'$set':data}, multi=True, upsert=True) 2.6 delete_one()删除一条数据
collection.delete_one({"name":"test10010"}) 2.7 delete_many()删除全部数据
collection.delete_many({"name":"test10010"}) 3. pymongo模块其他api 查看pymongo官方文档或源代码 api.mongodb.com/python/curr…
关注我持续为您分享干货内容,你的收藏、评论、点赞就是对我最大的支持!