MongoDB简介、功能以及示例MongoDB是一个文档数据库，提供好的性能，领先的非关系型数据库。采用JSON存储文档

什么是MongoDB

MongoDB是一个文档数据库，提供好的性能，领先的非关系型数据库。采用JSON存储文档数据。2007年10月，MongoDB由10gen团队所发展。2009年2月首度推出。MongoDB用c++编写的。

优势：

面向文档的存储：以 JSON 格式的文档保存数据。
任何属性都可以建立索引。
复制以及高可扩展性。
自动分片。
丰富的查询功能。
快速的即时更新。
来自 MongoDB 的专业支持。

elasticsearch与MongoDB相同点与不同点

相同点：

1、都是以json格式管理数据的nosql数据库。

2、都支持CRUD操作。

3、都支持聚合和全文检索。

4、都支持分片和复制。

5、都支持阉割版的join操作。

6、都支持处理超大规模数据。

不同点：

1、es是java编写，通过RESTFul接口操作数据。MongoDB是C++编写，通过driver操作数据。（es对java开发更有好，利于排查理解）

2、MongoDB的分片有hash和range两种方式，es只有hash一种。

3、es是天生分布式，主副分片自动分配和复制，开箱即用。mongodb的分布式是由“前置查询路由+配置服务+shard集合”，需要手动配置集群服务。

4、内部存储ES是到排索引+docvalues+fielddata。MongoDB暂时未知。

5、es全文检索有强大的分析器且可以灵活组合，查询时智能匹配。MongoDB的全文检索字段个数有限制。

6、es所有字段自动索引，MongoDB的字段需要手动索引。

7、MongoDB支持多文档事务

MongoDB特性：灵活性，可扩展性，强大的查询语言，优异的性能

mongodb安装与启动

MongoDB下载网址: www.mongodb.com/download-ce…

选择版本、系统环境以下将以.tgz 为例

下载完成将得到mongodb-linux-x86_64-rhel70-4.2.3.tgz包，将其上传到linux（sentos7）某个目录

上传完成后解压并移动到/usr/local/mongodb目录

mv mongodb-linux-x86_64-rhel70-4.2.3 /usr/local/mongodb

创建专门的负责的用户并赋予权限

cd /usr/local/mongodb 
groupadd mongodb
useradd -s /sbin/nologin -g mongodb -M mongodb
mkdir data log run
chown -R mongodb:mongodb data log run

在/usr/local/mongodb 里面创建一个配置文件 mongodb.conf

vim mongodb.conf 并写入下面的信息:

bind_ip=0.0.0.0
port=27017
dbpath=/usr/local/mongodb/data/
logpath=/usr/local/mongodb/log/mongodb.log
pidfilepath =/usr/local/mongodb/run/mongodb.pid
logappend=true
fork=true    
maxConns=500
noauth = true


配置解释：
fork=true  运行在后台
logappend=true  如果为 true，当 mongod/mongos 重启后，将在现有日志的尾部继续添加日志。否则，将会备份当前日志文件，然后创建一个新的日志文件。默认为 false。
noauth=true  不需要验证用户密码
maxConns=500  最大同时连接数，默认2000

以上是MongoDB的安装与启动的准备工作，可直接启动启动命令：

/usr/local/mongodb/bin/mongod -f /usr/local/mongodb/mongodb.conf

配置环境变量

vim /etc/profile

在/etc/profile文件末尾添加一行:

 export PATH=/usr/local/mongodb/bin:$PATH

让其生效:

source /etc/profile

查看当前mongodb的版本:

mongod --version

MongoDB的crud

执行mongo命令连接MongoDB

数据库的操作

MongoDB自带的原始数据库：

admin：从权限角度来看，这是“root”数据库。如果将一个用户添加到这个数据库。这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行，比如列出所有的数据库或者关闭服务器
local：这个数据永远不会被复制，可以用来存储限于本地单台服务器的任意集合
config：当mongo用于分片设置时，config数据库在内部使用。用于保存分片的相关信息

查看：show dbs

创建：use 数据库名

使用use时，如果数据库存在则会进入到相应的数据库，如果不存在则会自动创建

一旦进入数据库，则可以使用db来引用当前库；如果是第一次创建，那个这个数据库只是存在于内存当中，直到这个数据库中创建了集合后才会持久化到磁盘上

删除：db.dropDatabase()

用于删除已经持久化的数据库，刚创建在内存中的数据库删除无效

集合的操作

创建： db.createCollection("集合名称")

查看： show tables 或者 show collections

删除： db.集合名称.drop()

文档的操作

添加：

db.xyj.insert({name:"猪八戒",age:600,gender:"男"});   

db.xyj.insertOne({_id:"1001",name:"孙悟空",age:500,gender:"男"});

xyj是集合名称，如果该集合还没有被创建，则会自动创建

批量添加：

db.xyj.insert([
     {name:"沙和尚",age:400,gender:"男"},
     {name:"白骨精",age:200,gender:"女"},
     {name:"蜘蛛精",age:200,gender:"女"}
]);

db.xyj.insertMany([
     {name:"沙和尚",age:400,gender:"男"},
     {name:"白骨精",age:200,gender:"女"},
     {name:"蜘蛛精",age:200,gender:"女"}
]);

db.collection.insertOne()     插入一个文档对象
db.collection.insertMany()    插入多个文档对象

当我们向集合中插入文档时，如果没有给文档指定 _id属性，则数据库会自动为文档添加 _id该属性用来作为文档的唯一标识。 _id我们可以自己指定，如果我们指定了数据库就不会在添加了，如果自己指定 _id 也必须确保它的唯一性

额外小知识

try{
	db.xyj.insert([
      {name:"沙和尚",age:400,gender:"男"},
      {name:"白骨精",age:200,gender:"女"},
      {name:"蜘蛛精",age:200,gender:"女"}
    ]);
}catch(e){
	print(e)
}

可以知道那条插入失败

覆盖修改：db.xyj.update({_id:"1001"},{age:NumberInt(520)})

执行效果：_id:1001这条数据只有age一个字段了

局部修改： db.xyj.update({_id:"1001"},{$set:{age:NumberInt(30)}})

执行效果：只会修改这条数据的某个字段

批量修改： db.xyj.update({name:"蜘蛛精"},{$set:{age:NumberInt(100)}},{multi:true})

在修改条数据时，必须要加上第三个参数**{multi:true}**，否则只会修改第一条数据

字段增加操作： db.xyj.update({_id:"1001")},{$inc:{age:NumberInt(1)}})

注意：$inc 对应的字段必须是数字，而且递增或递减的值也必须是数字。

删除文档： db.xyj.remove({_id:"1001"})

删除文档字段： db.xyj.update({"_id":1001}, {"$unset": {"name":1}})

$unset 指定字段的值只需是任意合法值即可。

删除所有： db.xyj.remove({})

插入测试数据

db.xyj.insertMany([
     {name:"沙和尚",age:400,gender:"男",hobby:["挑扁担", "游泳"]},
     {name:"白骨精",age:200,gender:"女",hobby:["杀人", "吃喝"]},
     {name:"蜘蛛精",age:200,gender:"女",hobby:[""洗澡", "跳舞"]},
	 {name:"唐僧",age:26,gender:"男",hobby:["坐禅","骑马"]}
]);

数组添加（$push）：

db.xyj.update({"name": "白骨精"}, {"$push": {"hobby": "念佛"}})

删除元素（$pop）：

db.xyj.update({"_id": ObjectId("8fe58t098n6d71f45h274l16")}, {"$pop": {"hobby": 1}})  // 删除最后一个元素
db.xyj.update({"_id": ObjectId("8fe58t098n6d71f45h274l16")}, {"$pop": {"hobby": -1}})  // 删除第一个元素

删除特定元素（$pull）：

db.xyj.update({"_id": ObjectId("8fe58t098n6d71f45h274l16")}, {"$pull": {"hobby": "吃喝" }})

更新嵌套数组的值：

db.xyj.insert({_id:"1001", name:"孙悟空", age:500, gender:"男", address: [{place: "五行山", tel: 123}, {place: "花果山", tel: 321}]});

db.xyj.update({"_id": "1001"}, {"$set": {"address.0.tel": 213}})

数组查询：

db.xyj.find({"hobby":"骑马"})

多个元素的查询
db.xyj.find({"hobby":{"$all": ["挑扁担", "游泳"]}})
只有hobby数组同时存在"挑扁担",和"游泳"才会匹配

限制数组长度查询
db.xyj.find({"hobby": {"$size": 2}})
只有数组的长度是2才会匹配

查看所有：

mongodb:   db.xyj.find()
sql:   select * from xyj

投影查询：

mongodb:   db.xyj.find({name:"孙悟空"},{name:1, age:1, _id:0})   
sql:   select name, age from xyj where name= "孙悟空"
1表示显示 0表示强制隐藏

按字段条件查询：

mongodb:   db.xyj.find({name:"猪八戒"})
sql:   select * from xyj where name= "猪八戒"

按字段条件查询并只返回一条：

db.xyj.findOne({name:"猪八戒"})

组合查询：

语法：db.xyj.find($and:[{},{},{}])
//查询年龄大于300并且小于500的
db.xyj.find({$and:[{age:{$gt:NumberInt(300)}},{age:{$lt:NumberInt(500)}}]})  
//查询名字里有”精“的或者年纪大于200的
db.xyj.find({$or:[{age:{$gt:NumberInt(30)}},{name:/精/}]})  

$gt--》大于；$lt--》小于；$gte--》大于等于；$lte--》小于等于；$ne---》不等于(不等于不一定要用于数字)

包含查询：

 db.xyj.find({age:{$in:[200,300]}})

不包含：

 db.xyj.find({age:{$nin:[300,400]}})

Like：

db.xyj.find({"name": /精/})

统计查询:

db.xyj.count()或者db.xyj.count({字段：条件})

取模：

db.xyj.find({"age": {$mod: [5, 1]}})
比如我们要匹配 age % 5 == 1

是否存在（$exists)

db.xyj.find({"love": {"$exists": true}})  // 如果存在字段love，就返回
db.xyj.find({"love": {"$exists": false}}) // 如果不存在字段love，就返回

分页查询

limit：显示几条记录

skip：跳过几条记录

只查询2条：db.xyj.find().limit(2)

跳过前2条再查询2条：db.xyj.find().limit(2).skip(2)

结合排序：db.xyj.find().limit(2).skip(2).sort({age:1}) // 1代表升序，-1代表降序

执行顺序： sort > skip > limit

聚合管道

较常见的管道操作符以及他们的作用：

操作符	描述	语法
$project	数据投影，主要用于重命名，增加，删除字段	`db.article.aggregate({ $project : {title : 1 ,author : 1 ,}});`
$match	过滤，筛选符合条件的文档，作为下一阶段输入	`db.articles.aggregate( [{ $match : { score : { $gt : 70, $lte : 90 } } },{ $group: { _id: null, count: { $sum: 1 } } }] );`
$limit	限制经过管道的文档数量	`db.article.aggregate({ $limit : 5 });`
$skip	待操作集合处理前跳过部分文档	`db.article.aggregate({ $skip : 5 });`
$unwind	将数组拆分成独立字段	`db.article.aggregate({$project:{author:1,title:1,tags:1}},{$unwind:"$tags"})`
$group	对数据进行分组	`db.article.aggregate({ $group : {_id : "$author",docsPerAuthor : { $sum : 1 },viewsPerAuthor : { $sum : "$pageViews" }}});`
$sort	对文档按照指定字段排序	`db.users.aggregate( { $sort : { age : -1, posts: 1 } });`
$sample	随机选择从其输入指定数量的文档。	`{ $sample: { size: <positive integer> } }`
$out	必须为pipeline最后一个阶段管道，因为是将最后计算结果写入到指定的collection中
$indexStats	返回数据集合的每个索引的使用情况	`{ $indexStats: { } }`

插入测试数据

document1=({name:'dogOne',age:1,tags:['animal','dog'],type:'dog',money:[{min:100},{norm:200},{big:300}]});

document2=({name:'catOne',age:3,tags:['animal','cat'],type:'cat',money:[{min:50},{norm:100},{big:200}]});

document3=({name:'catTwo',age:2,tags:['animal','cat'],type:'cat',money:[{min:20},{norm:50},{big:100}]});

document4=({name:'dogTwo',age:5,tags:['animal','dog'],type:'dog',money:[{min:300},{norm:500},{big:700}]});

document5=({name:'appleOne',age:0,tags:['fruit','apple'],type:'apple',money:[{min:10},{norm:12},{big:13}]});

document6=({name:'appleTwo',age:0,tags:['fruit','apple'],type:'apple',money:[{min:10},{norm:12},{big:13}]});

document7=({name:'pineapple',age:0,tags:['fruit','pineapple'],type:'pineapple',money:[{min:8},{norm:9},{big:10}]});

db.mycol.insert(document1)

db.mycol.insert(document2)

db.mycol.insert(document3)

db.mycol.insert(document4)

db.mycol.insert(document5)

db.mycol.insert(document6)

db.mycol.insert(document7)

假定我们想提取money中min为100的文档，并且只输出名称和money数组中的min那一项

db.mycol.aggregate(
   {$match:{'money.min':100}},
   {$project:{_id:0,name:'$name',minprice:'$money.min'}}
)

假定我们想提取money中min小于100的文档，并且限制3个文档，跳过一个文档再显示

db.mycol.aggregate(

    {$match:{'money.min':{$lt:100}}},

    {$limit:3},

    {$skip:1},

    {$project:{_id:0,name:'$name',minprice:'$money.min'}}

    )

通过type类型来对数据进行分类，并且同时统计他们的年龄age总和

db.mycol.aggregate(
    {$group:{_id:'$type',sumage:{$sum:'$age'}}}
)

按照年龄对数据进行排序

db.mycol.aggregate(
    {$group:{_id:'$type',sumage:{$sum:'$age'}}},
    {$sort:{sumage:1}}
)