您的位置：首页 > 编程语言 > Python开发

Python: Windows 7 64位安装、使用 pymongo 3.2

2017-06-05 20:14 525 查看

官网tutorial: http://api.mongodb.com/python/current/tutorial.html

本教程将要告诉你如何使用pymongo模块来操作MongoDB数据库。

一、先决条件

开始之前，我们需要确定电脑已经安装了pymongo和MongoDB.

1.安装pymongo

使用pip安装pymongo，在cmd命令行输入：

pip install pymongo

在python IDLE 中输入：import pymongo 没有报错表示安装成功。

2.安装MongoDB

参考这个链接：http://www.cnblogs.com/billyzh/p/5913687.html

如果不安装MongoDB会出现后面的一个问题。

3.MongoDB中的基本概念

　　在MongoDB中基本的概念是文档(document)、集合(collection)、数据库(database).

　　下图(盗的图)可能容易理解MongoDB中的一些概念:

　　

　　通过下图实例，可以更直观的的了解MongoDB中的一些概念：

　　

二、通过MongoClient建立一个连接

开始使用pymongo的第一步是创建一个MongoClient,来运行mongod实例。

>>> from pymongo import MongoClient

>>> client = MongoClient()

上面代码将会连接默认的host和port。也可指定：

>>> client = MongoClient('localhost',27017)

或者用MongoDB URI格式：

>>> client = MongoClient('mongodb://localhost:27017/')

默认状态下Mongo客户端是没有加密的,但是如果需要通过账户登录:

>>> client = MongoClient('mongodb://账号:密码@localhost:27017/')

三、获取一个数据库

一个MongoDB实例可以支持多个独立的数据库。使用PyMongo时，可以通过访问MongoClient的属性的方式来访问数据库。

>>> db = client.test_database

如果数据库名字使用属性方式不能访问(像test-database),也可以通过访问字典值的方式。

>>> db = client['test-database']

四、获取一个Collection

一个collection是一组存在MongoDB中的文件(documents)，大致可以认为是关系型数据库中表的概念。

　获取Collection方法与获取数据库方法一致:

>>> collection = db.test_collection #注意连接符是_不是-

或用字典方式：

>>> collection = db['test-collection']

需要注意的是，MongoDB里的collections(集合)和databases(数据库)都是惰性创建的，前面提到的所有命令

实际上没有对MongoDB server进行任何操作。当第一个文件插入后，collections和databases才会被创建。

五、文件(Documents)

数据在MongoDB中是用JSON类文件的形式表示和保存起来的。在pymongo中用字典来代表文件。

例如，下面这个字典可能被用来代表一篇博客文章:

>>> import datetime

>>> post = {

"author": "Mike",

　　　　　　　　　"text": "My first blog post!",

　　　　　　　　"tags": ["mongodb","python","pymongo"],

　　　　　　　　　"date": datetime.datetime.utcnow()

　　　　　　　　　}

　注意，文件里可以包含python原生(native)类型（datetime.datetime实例），这些类型的值会被自动在原生类型和BSON格式之间转换。

六、插入一个文件(Inserting a Document)

插入一个文件到collection中，可以使用insert_one()方法。

>>> posts = db.posts

>>> post_id = posts.insert_one(post).inserted_id

>>> post_id

ObjectId('57eb8f2177eddf292cbea0b3')

当一个文件被插入一个特殊的键值'_id',即使文件内没有_id这个键值，那么系统自动添加一个到文件里。

这是一个特殊键值，它的值在整个collection里是唯一的。insert()返回这个文件的_id值。

插入第一个文件后，这个posts collection 就真正的在server上创建了。我们可以通过查看数据库上的

所有collection来验证：

>>> db.collection_names(include_system_collections=False)

['posts']

七、获取单个文件 find_one()

在MongoDB中，最基本的查询是find_one。这个方法返回一个符合查询的文件，或者在没有匹配的时候返回None。

当只有一个文件符合条件的时候，或者只对第一个符合条件的文件感兴趣的时候，这个方法是很有用的。

我们用find_one()来获取posts collection 里的第一个文件：

>>> posts.find_one()

{'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',

'_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],

'text': 'My first blog post!'}

返回结果是一个我们之前插入的符合条件的字典类型值。

注意，返回的文件里包含_id这个键值，这是自动添加的。

find_one()还支持对特定元素进行匹配的查询。限制我们文档的作者是"Mike",可以这么做：

>>> posts.find_one({"author":"Mike"})

{'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',

'_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],

'text': 'My first blog post!'}

如果我们用不同的作者，比如："Eliot",将不会得到结果。

>>> posts.find_one({"author":"Eliot"})

>>>

八、按照ObjectId查询

通过_id也可以进行查询，在例子中就是ObjectId:

>>> post_id

ObjectId('57eb54a877eddf292cbea0a8')

>>> posts.find_one({"_id": post_id})

{'date': datetime.datetime(2016, 9, 28, 5, 25, 53, 6000), 'author': 'Mike',

'_id': ObjectId('57eb54a877eddf292cbea0a8'), 'tags': ['mongodb', 'python'],

'text': 'My first blog post!'}

注意：ObjectId 并不等同于它的字符串形式。

>>> post_id_as_str = str(post_id)

>>> posts.find_one({"_id": post_id_as_str}) #No result

>>>

在web应用的一个常见任务就是在request的URL里获取ObjectId，然后找到与之匹配的文件。

在本例中，必须要先从字符串转换为ObjectId，然后传给find_one:

>>> from bson.objectid import ObjectId

#从URL里获取post_id，然后把它作为字符串传入

>>> def get(post_id):

#将字符串转换为ObjectId

document = client.db.collection.find_one({"_id": ObjectId(post_id)})

小插曲：

MongoDB以BSON格式保存数据。BSON字符串都是UTF-8编码的，所以pymongo必须确保它保存的字符串值

包含有效地UTF-8数据.常规字符串(<type ‘str’>)都是有效的，可以不改变直接保存。

Unicode字符串(<type ‘unicode’>)就需要先编码成UTF-8格式。

九、批量插入

为了让查询更有趣，我们多插入几个文件。除了单个文件插入，也可以通过给insert_many()方法传入

一个列表(list)，作为该方法的第一个参数,进行批量插入操作。

这将会插入列表(list)中的每个文件(document)到集合中去，而且只向server发送一条命令:

new_posts = [{"author": "Mike",

　　　　　　　　　　 "text": "Another post!",

　　　　　　　　　　　 "tags": ["bulk", "insert"],

　　　　　　　　　　　 "date": datetime.datetime(2009, 11, 12, 11, 14)

　　　　　　　　　　　},

　　　　　　　　　　{"author": "Eliot",

　　　　　　　　　　 "title": "MongoDB is fun",

　　　　　　　　　　 "text": "and pretty easy too!",

　　　　　　　　　　 "date": datetime.datetime(2009, 11, 10, 10, 45)

　　　　　　　　　　}]

　　　　>>> result = posts.insert_many(new_posts)

　　　　>>> result.inserted_ids

　　　　[ObjectId('57eb700b77eddf292cbea0a9'), ObjectId('57eb700b77eddf292cbea0aa')]

这个例子里有一些比较有趣的地方：

insert_many()现在返回两个ObjectId实例，每个代表一个插入的文件。

new_posts[1]与其他的posts内容格式不相同,里面没有"tags”。另外我们增加了一个新的“title”域。这就是MongoDB所提到的无schema特点。

十、查询多个文件

为了得到更多的文件，我们使用find()方法。find()返回一个Cursor实例,可使我们遍历所有匹配的文件。

比如遍历每个posts collection里的文件:

>>> for post in posts.find():

　　 post

与使用find_one()时候相同，可以传入一个文件来限制查询结果。比如查询作者"Mike" 文件：

　　　>>> for post in posts.find({"author":"Mike"}):

post

十一、文件数量(Counting)

如果只想知道符合查询条件的文件有多少，可以用count()操作，而没必要进行完整的查询。

查询collection的文件总数：

>>> posts.count()

11

或者只是查询一些特定文件数量：

>>> posts.find({"author": "Mike"}).count()

10

十二、限定范围的查询

MongoDB支持多种高级查询。比如我们按照时间(小于某个时间)来查询,结果按作者名参数来排序:

>>> d = datetime.datetime(2009,11,12,12)

>>> for post in posts.find({"date":{"$lt":d}}).sort("author"):

print(post)

　　　{'date': datetime.datetime(2009, 11, 10, 10, 45), 'author': 'Eliot', 'text': 'and pretty easy too!', '_id': ObjectId('57eb700b77eddf292cbea0aa'), 'title': 'MongoDB is fun'}

　　　{'date': datetime.datetime(2009, 11, 12, 11, 14), 'author': 'Mike', '_id': ObjectId('57eb700b77eddf292cbea0a9'), 'tags': ['bulk', 'insert'], 'text': 'Another post!'}

这里使用了特殊的"$lt"操作符来进行范围查询，并调用sort()方法，对结果按照作者参数排序。

十三、索引(Indexing)

添加索引可以帮助加快某些查询，也可以添加额外的功能来查询和存储文件。

在这个示例中，我们将演示如何在一个键上创建一个唯一索引，这个索引将拒绝--那些已经在索引中存在该键值的文件。

首先，我们需要创建一个索引：

>>> result = db.profiles.create_index([('user_id',pymongo.ASCENDING)],unique = True)

>>> result

'user_id_1'

>>> list(db.profiles.index_information())

['_id_', 'user_id_1']

注意：现在我们有两个索引,一个索引 _id是MongoDB自己创建的。另外一个 user_id是我们刚刚创建的。

现在，让我们建立一些用户配置文件：

　　>>> user_profiles = [{'user_id':211,'name':'Luke'},{'user_id':212,'name':'Ziltoid'}]

　　>>> result = db.profiles.insert_many(user_profiles)

　该索引可以防止我们的user_id已经插入集合中的文档：

　　>>> new_profile = {'user_id': 213, 'name': 'Drew'}

　　>>> duplicate_profile = {'user_id': 212, 'name': 'Tommy'}

　　>>> result = db.profiles.insert_one(new_profile) # This is fine.

　　>>> result = db.profiles.insert_one(duplicate_profile)

　　Traceback (most recent call last):

　　pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: test_database.profiles index: user_id_1 dup key: { : 212 }

关于索引的MongoDB文档链接：

问题：

　　1.pymongo.errors.ServerSelectionTimeoutError: localhost:27017: [WinError 10061] 由于目标计算机积极拒绝，无法连接。

　原因：未装MongoDB或者MongoDB服务没有开启。(这个错误找了很长时间，哎。。。)

　　　参考链接：http://www.cnblogs.com/greenteaone/p/3745734.html

　　2.在数据库存入了文件，如何查看呢？就需要用到MongoDB可视化工具了。

　　　　1)MongoBooster(已用)

　　　　　　下载地址：http://mongobooster.com/home

　　　　2)Robomongo

　　　　　　下载地址：https://robomongo.org/

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

Python: Windows 7 64位 安装、使用 pymongo 3.2

Python: Windows 7 64位安装、使用 pymongo 3.2