MongoDB初学者+常用API

2,048 阅读7分钟

1 MongoDB简介

1.1 储存数据分析

  1. 数据量大
  2. 写入操作频繁
  3. 价值较低

对于这样的数据,更适合使用MongoDB来实现数据的存储

1.2 什么是MongoDB

  • MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。

  • MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。

1.3 MongoDB特点

  • Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:

  1. 面向集合存储,易存储对象类型的数据。
  2. 模式自由。
  3. 支持动态查询。
  4. 支持完全索引,包含内部对象。
  5. 支持查询。
  6. 支持复制和故障恢复。
  7. 使用高效的二进制数据存储,包括大型对象(如视频等)。
  8. 自动处理碎片,以支持云计算层次的扩展性。
  9. 支持RUBY,PYTHON,JAVA,C++,PHP,C#等多种语言。
  10. 文件存储格式为BSON(一种JSON的扩展)。

1.5 MongoDB体系结构

  • MongoDB 的逻辑结构是一种层次结构。主要由:文档(document)、集合(collection)、数据库(database)这三部分组成的。逻辑结构是面向用户的,用户使用 MongoDB 开发应用程序使用的就是逻辑结构。
  1. MongoDB 的文档(document),相当于关系数据库中的一行记录。
  2. 多个文档组成一个集合(collection),相当于关系数据库的表。
  3. 多个集合(collection),逻辑上组织在一起,就是数据库(database)。
  4. 一个 MongoDB 实例支持多个数据库(database)。

文档(document)、集合(collection)、数据库(database)的层次结构如下图:

1.6 MongoDB数据类型

特殊说明:

1. ObjectId

ObjectId 类似唯一主键,可以很快的去生成和排序,包含 12 bytes,含义是:

  • 前 4 个字节表示创建 unix 时间戳,格林尼治时间 UTC 时间,比北京时间晚了 8 个小时
  • 接下来的 3 个字节是机器标识码
  • 紧接的两个字节由进程 id 组成 PID
  • 最后三个字节是随机数

MongoDB 中存储的文档必须有一个 _id 键。这个键的值可以是任何类型的,默认是个 ObjectId 对象

2. 时间戳

BSON 有一个特殊的时间戳类型,与普通的日期类型不相关。时间戳值是一个 64 位的值。其中:

  • 前32位是一个 time_t 值【与Unix新纪元(1970年1月1日)相差的秒数】
  • 后32位是在某秒中操作的一个递增的序数

在单个 mongod 实例中,时间戳值通常是唯一的。

3. 日期

表示当前距离 Unix新纪元(1970年1月1日)的毫秒数。日期类型是有符号的, 负数表示 1970 年之前的日期。

2 MongoDB基本使用

2.1 常用命令

1. 选择和创建数据库

选择和创建数据库的语法格式:

use 数据库名称

查看数据库:

show dbs

查看集合,需要先选择数据库之后,才能查看该数据库的集合:

show collections

2. 插入与查询文档

选择数据库后,使用集合来对文档进行操作,插入文档语法格式:

db.集合名称.insert(数据);

插入以下测试数据:

db.comment.insert({content:"初学者",userid:"1011"})

查询集合的语法格式:

db.集合名称.find()

查询spit集合的所有文档,输入以下命令:

db.comment.find()

发现文档会有一个叫_id的字段,这个相当于我们原来关系数据库中表的主键,当你在插入文档记录时没有指定该字段,MongoDB会自动创建,其类型是ObjectID类型。如果我们在插入文档记录时指定该字段也可以,其类型可以是ObjectID类型,也可以是MongoDB支持的任意类型。

输入以下测试语句:

db.comment.insert({_id:"1",content:"到底为啥出错",userid:"1012",thumbup:2020});
db.comment.insert({_id:"2",content:"加班到半夜",userid:"1013",thumbup:1023});
db.comment.insert({_id:"3",content:"手机流量超了咋办",userid:"1013",thumbup:111});
db.comment.insert({_id:"4",content:"坚持就是胜利",userid:"1014",thumbup:1223});

按一定条件来查询,比如查询userid为1013的记录,只要在find()中添加参数即可,参数也是json格式,如下:

db.comment.find({userid:'1013'})

只需要返回符合条件的第一条数据,我们可以使用findOne命令来实现:

db.comment.findOne({userid:'1013'})

返回指定条数的记录,可以在find方法后调用limit来返回结果,例如:

db.comment.find().limit(2)

3. 修改与删除文档

修改文档的语法结构:

db.集合名称.update(条件,修改后的数据)

修改_id为1的记录,点赞数为1000,输入以下语句:

db.comment.update({_id:"1"},{thumbup:1000})

执行后发现,这条文档除了thumbup字段其它字段都不见了。

为了解决这个问题,我们需要使用修改器$set来实现,命令如下:

db.comment.update({_id:"2"},{$set:{thumbup:2000}})

删除文档的语法结构:

db.集合名称.remove(条件)

以下语句可以将数据全部删除,慎用~

db.comment.remove({})

删除条件可以放到大括号中,例如删除thumbup为1000的数据,输入以下语句:

db.comment.remove({thumbup:1000})

4. 统计条数

统计记录条件使用count()方法。以下语句统计spit集合的记录数:

db.comment.count()

按条件统计 ,例如统计userid为1013的记录条数:

db.comment.count({userid:"1013"})

5. 模糊查询

MongoDB的模糊查询是通过正则表达式的方式实现的。格式为:

/模糊查询字符串/

查询评论内容包含“流量”的所有文档,代码如下:

db.comment.find({content:/流量/})`

查询评论内容中以“加班”开头的,代码如下:

db.comment.find({content:/^加班/})

6. 大于 小于 不等于

<, <=, >, >= 这个操作符也是很常用的,格式如下:

db.集合名称.find({ "field" : { $gt: value }}) // 大于: field > value
db.集合名称.find({ "field" : { $lt: value }}) // 小于: field < value
db.集合名称.find({ "field" : { $gte: value }}) // 大于等于: field >= value
db.集合名称.find({ "field" : { $lte: value }}) // 小于等于: field <= value
db.集合名称.find({ "field" : { $ne: value }}) // 不等于: field != value

查询评论点赞数大于1000的记录:

db.comment.find({thumbup:{$gt:1000}})

7. 包含与不包含

包含使用$in操作符

查询评论集合中userid字段包含1013和1014的文档:

db.comment.find({userid:{$in:["1013","1014"]}})

不包含使用$nin操作符

查询评论集合中userid字段不包含1013和1014的文档:

db.comment.find({userid:{$nin:["1013","1014"]}})

8. 条件连接

我们如果需要查询同时满足两个以上条件,需要使用$and操作符将条件进行关联(相当于SQL的and)。格式为:

$and:[ {条件},{条件},{条件} ]

查询评论集合中thumbup大于等于1000 并且小于2000的文档:

db.comment.find({$and:[ {thumbup:{$gte:1000}} ,{thumbup:{$lt:2000} }]})

如果两个以上条件之间是或者的关系,我们使用操作符进行关联,与前面and的使用方式相同,格式为:

$or:[ {条件},{条件},{条件} ]

查询评论集合中userid为1013,或者点赞数小于2000的文档记录:

db.comment.find({$or:[ {userid:"1013"} ,{thumbup:{$lt:2000} }]})

9. 列值增长

对某列值在原有值的基础上进行增加或减少,可以使用$inc运算符:

db.comment.update({_id:"2"},{$inc:{thumbup:1}})

3 常用的API

1.对单个字段进行修改

我们接来对几个比较常用的进行操作说明,其余的语法都是一样

// 1. 采用$set来根据查询条件修改文档,用来指定一个键的值,如果不存在则创建它。
db.orders.update(                            
   {"onumber" : "001"},  
   { $set: { "cname " : "zcy"} },  
   false, 
   // multi 设置为true,全部更新
   true  
)  

// 2. $mul  将该字段的值乘以指定的值 { $mul: { field: <number> } }  
db. orders.update(                            
{"ino" : "001"},  
{ $mul: {"quantity" :3} }  
) 

// 3. $setOnInsert     操作时,操作给相应的字段赋值
db.collection.update(  
  <query>,  
   {$setOnInsert: { <field1>: <value1>, ... } },  
   {upsert: true }  
) 

db.products.update(  
      {"ino" : "001"},  
      {  
        $set:{ "quantity":3 },  
        $setOnInsert:{ "defaultQty":100 }  
      },  
      {upsert: true }  
    )  
    
$inc,指定属性的值加上现在的值,如果键不存在则创建它。
{ $inc: { <field1>: <amount1>,<field2>: <amount2>, ... } }  

db. orders.update(                            
{"onumber" : "001","items.ino":"001"},  
{ $inc: {"items.$.price" : 2.0} }  
) 

2. 对数组进行修改

1. 根据查询条件修改文档里内嵌文档(第二层级的),例如我们想修改items 字段ino为001下的price的4修改8,语法items.$. price ,更新数组中第一个匹配的子文档,我们内嵌文档的ino是唯一的,满足我们的需求

例子:

db. orders.update(                            
{"onumber" : "001","items.ino":"001"},  
{ $set: {"items.$.price" : 8.0} }  
) 

2. 根据查询条件修改文档里内嵌文档在内嵌文档(第三层级的),例如我们想修改items 字段ino等于001下的products并且pno等于001的pName值为ps,语法items.0. products. 更新数组中第一个匹配的子文档。]

db. orders.update(                            
{"onumber" : "001","items.ino":"001","items.products.pno":"001"},  
{ $set: {"items.0.products.$.pName": "ps"} }  
)  

3. $pop删除数组的第一个或最后一个项

{ $pop: { <field>: <-1 | 1>,... } }  // 1最后一项-1是第一项

db. orders.update(                            
{"onumber" : "001"},  
{ $pop: {"items" : -1} }  
) 

4. $push将值添加到数组中,如果有的数组存在则向数组末尾添加该值,如果数组不存在则创建该数组并保存该值

{ $push: { <field1>: <value1>,... } }  

db.orders.update({
  "onumber": "001"
}, {
  $push: {
    "items": {
      "ino": "002",
      "quantity": 2,
      "price": 6.0,
      "products": [{
          "pno": "003",
          "pName": "p3"
        },
        {
          "pno": "004",
          "pName": "p4"
        }
      ]
    }
  }
})

5. 删除数据

语法 db.collection.remove()

// 1. 删除orders集合的所有数据,集合还存在,索引都还存在,相当与SQ的truncate命令
db.orders.remove({})

// 2. 根据条件删除数据
db.orders.remove({"onumber": "001"})

// 3. 删除集合、索引都不存在了。
db.collection.drop()