mongoDB的深入理解
2016-08-30 16:10
239 查看
mongoDB的简介
分布式文件存储的NoSql文档是mongoDB的基本单位,每一个文档都有与之对应的ID
文档里边可以是多个键值对
文档里边可以嵌套另一个文档
一个集合里边可以有多个文档
一个数据库里边可以有多个集合
聚集分析
1、管道模式进行聚集常用的管道模式有以下
$match过滤文档,只传递匹配的文档到管道中的下一个步骤
db.book.insert({book_id:1,num:100,status:"normal"}) db.book.insert({book_id:2,num:200,status:"normal"}) db.book.insert({book_id:3,num:200,status:"sold"}) db.book.insert({book_id:1,num:200,status:"normal"}) db.price.aggregate([ { $group:{ _id:"$book_id", count:{$sum:1} } }, {$match:{count:{$gt:1}} } ])
会返回的结果
{ "result" : [ { "_id" : null, "count" : 5 } ], "ok" : 1 }
limit:限制管道中文档的数量skip:跳过指定数量的文档,返回剩下的文档
sort:对所有输入的文档进行排序group : 对所有的文档进行分组,然后进行聚集结果
first:返回group的第一个值last:返回group的最后一个值
max:返回group的最大值min:返回group的最小值
avg:返回group操作后的平均值sum返回group的所有的值的和
SELECT count(*) as count1 from books
会返回 count1 4
等价于
db.book.aggregate([ { $group:{ _id:null, count1:{$sum:1} } } ])
SELECT sum(num) as total from books
统计books表中所有num的和 会返回700
等价于
db.book.aggregate([ { $group:{ _id:null, sum:{$sum:"$num"} } } ])
SELECT book_id, sum(num) as total from books GROUP BY book_id
实现分别统计相同的book_id的总体的num值
db.book.aggregate([ { $group:{ _id:"$book_id", total:{$sum:"$num"} } } ])
MapReduce模聚集
为海量数据数据的查询分析,用mongoDB的做分布式,然后再用MapReduce 做数据分析
Select sum(num) as value,book_id as _id 6yh from books where status ="normal" group by book_id
查询到的结果为
value _id
300 1
200 2
使用mongoDB的执行
Db.books.mapreduce({ Function(){emit(this.book_id,this.num);}, Function(key,values){return Array.sum(values);}, { Query:{status:"normal"}, Outresult:"books_totals" } })
代码分析:
以上相当于关系数据库中如下sql
Select sum(num) as value,book_id as _id 6yh from books where status =”normal” group by book_id
Mapreduce的解决方案:
定义一个map
Function(){emit(this.book_id,this.num);}
定义reduce
Function(key,values){return Array.sum(values);}
执行mapreduce函数
Query:{status:”normal”},返回状态为normal的值,同时定义了保存结果的集合名,最后的输出结果将保存在集合books_totals中。
注意:这里的map、reduce函数都是利用javascript编写的函数,其中map函数的关键部分是emit(key,value)函数,此函数的调用使集合使集合中的document对象按照key值生成一个value,形成一个键值对。其中key可以单一field,也可以由多个field组成,mongodb会按照key生成对应的value值,value为一个数组。
Reduc函数的定义中有参数key和value,其中key就是上面map函数中指定的key值,value就是对应key对应的值,Array.sum(value)这里是对数组中的值求和,按照不同的业务需要,我们可以编写自己的js函数来处理。
3、简单聚集函数
1、distinct函数
db.orders.distinct(key,)
第一个参数为filed 第二个参数为查询选择器
db.book.distinct("book_id")
会选择出所有文档中不同的book_id
2、count函数 用于统计查询返回的记录总数
db.book.find().count()
会返回4
node版原生的mongoDB驱动
1、声明依赖关系2、定义数据库主机端口
3、建立数据库连接
4、创建数据库文档
5、输出一个新创建的文档
相关文章推荐
- 深入理解mongodb和hbase区别
- MongoDB3.6新特性深入理解
- mongoDB深入理解
- mongodb系列02-------深入理解索引原理
- 深入理解MongoDB分片的管理
- 第五部分 架构篇 第十三章 MongoDB Replica Sets 架构(成员深入理解)
- Titan Framework MongoDB深入理解1
- MongoDB的十个深入理解
- Titan Framework MongoDB深入理解3
- 深入理解MongoDB
- Titan Framework MongoDB深入理解2
- 深入理解MongoDB的复合索引
- 深入理解MongoDB(一)Linux下配置MongoDB全攻略
- 深入理解MongoDB分片的管理
- 深入理解JVM—JVM内存模型
- 深入理解Java虚拟机 - 垃圾收集概述
- 深入理解Android中的xmlns:tools属性
- 深入理解C/C++函数指针
- 深入理解驱动程序
- 深入理解javascript作用域第二篇之词法作用域和动态作用域