Python调用MongoDB使用心得
2016-06-07 12:57
483 查看
本文是一个Python 使用MongoDB的简单教程,将使用pymongo对MongoDB进行的各种操作进行了简单的汇总,NoSQLFan进行了简单整理,使用Python的同学可以看一看。
下载相应平台的版本,解压即可。为方便使用,将bin路径添加到系统path环境变量里。其中mongod是服务器,mongo是客户shell,然后创建数据文件目录:在c盘下创建data文件夹,里面创建db文件夹。
基本使用:
![](http://pic.yupoo.com/iammutex/BlM6njVR/kPjgU.png)
安装对应语言的Driver,Python 安装 pymongo
使用方法总结,摘自官方教程
创建连接
切换数据库
获取collection
db和collection都是延时创建的,在添加Document时才真正创建
文档添加,_id自动创建
批量插入
获取所有collection(相当于SQL的show tables)
获取单个文档
查询多个文档
加条件的查询
高级查询
统计数量
加索引
查看查询语句的性能
附自己总结的一点小心得,仅供参考
缺点
不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)
不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)
文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)
特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):
文档型数据库,表结构可以内嵌
没有模式,避免空字段开销(Schema Free)
分布式支持
查询支持正则
动态扩展架构
32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)
名词对应
一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)
一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed
储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)
表间关联,叫做 Reference
下载相应平台的版本,解压即可。为方便使用,将bin路径添加到系统path环境变量里。其中mongod是服务器,mongo是客户shell,然后创建数据文件目录:在c盘下创建data文件夹,里面创建db文件夹。
基本使用:
![](http://pic.yupoo.com/iammutex/BlM6njVR/kPjgU.png)
安装对应语言的Driver,Python 安装 pymongo
$ easy_install pymongo
使用方法总结,摘自官方教程
创建连接
>>> import pymongo >>> connection=pymongo.Connection("localhost",27017)
切换数据库
>>> db = connection.test_database
获取collection
>>> collection = db.test_collection
db和collection都是延时创建的,在添加Document时才真正创建
文档添加,_id自动创建
>>> import datetime >>> post = {"author": "Mike", ... "text": "My first blog post!", ... "tags": ["mongodb", "python", "pymongo"], ... "date": datetime.datetime.utcnow()} >>> posts = db.posts >>> posts.insert(post) ObjectId("...")
批量插入
>>> new_posts = [{"author": "Mike", ... "text": "Another post!", ... "tags": ["bulk", "insert"], ... "date": datetime.datetime(2009, 11, 12, 11, 14)}, ... {"author": "Eliot", ... "title": "MongoDB is online casino fun", ... "text": "and pretty easy too!", ... "date": datetime.datetime(2009, 11, 10, 10, 45)}] >>> posts.insert(new_posts) [ObjectId("..."), ObjectId("...")]
获取所有collection(相当于SQL的show tables)
>>> db.collection_names() [u"posts", u"system.indexes"]
获取单个文档
>>> posts.find_one() {u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]}
查询多个文档
>> for post in posts.find(): ... post ... {u"date": datetime.datetime(...), u"text": u"My first blog post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"mongodb", u"python", u"pymongo"]} {u"date": datetime.datetime(2009, 11, 12, 11, 14), u"text": u"Another post!", u"_id": ObjectId("..."), u"author": u"Mike", u"tags": [u"bulk", u"insert"]} {u"date": datetime.datetime(2009, 11, 10, 10, 45), u"text": u"and pretty easy too!", u"_id": ObjectId("..."), u"author": u"Eliot", u"title": u"MongoDB is fun"}
加条件的查询
>>> posts.find_one({"author": "Mike"})
高级查询
>>> posts.find({"date": {"$lt": d}}).sort("author")
统计数量
>>> posts.count() 3
加索引
>>> from pymongo import ASCENDING, DESCENDING >>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)]) u"date_-1_author_1"
查看查询语句的性能
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"] u"BtreeCursor date_-1_author_1" >>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"] 2
附自己总结的一点小心得,仅供参考
缺点
不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)
不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)
文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)
特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):
文档型数据库,表结构可以内嵌
没有模式,避免空字段开销(Schema Free)
分布式支持
查询支持正则
动态扩展架构
32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)
名词对应
一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)
一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed
储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)
表间关联,叫做 Reference