您的位置:首页 > 编程语言 > Python开发

Python: Windows 7 64位 安装、使用 pymongo 3.2

2017-06-05 20:14 525 查看
官网tutorial:  http://api.mongodb.com/python/current/tutorial.html

本教程将要告诉你如何使用pymongo模块来操作MongoDB数据库。

一、先决条件

    开始之前,我们需要确定电脑已经安装了pymongo和MongoDB.

    1.安装pymongo

          使用pip安装pymongo,在cmd命令行输入:

               pip install pymongo

          在python IDLE 中输入:import pymongo 没有报错表示安装成功。

    2.安装MongoDB

         参考这个链接:http://www.cnblogs.com/billyzh/p/5913687.html

         如果不安装MongoDB会出现后面的一个问题。

    3.MongoDB中的基本概念

    在MongoDB中基本的概念是文档(document)、集合(collection)、数据库(database).

    下图(盗的图)可能容易理解MongoDB中的一些概念:

  


  通过下图实例,可以更直观的的了解MongoDB中的一些概念:

  


二、通过MongoClient建立一个连接

    开始使用pymongo的第一步是创建一个MongoClient,来运行mongod实例。

        >>> from pymongo import MongoClient

        >>> client = MongoClient()

   上面代码将会连接默认的host和port。也可指定:

        >>> client = MongoClient('localhost',27017)

   或者用MongoDB URI格式:

        >>> client = MongoClient('mongodb://localhost:27017/')

   默认状态下Mongo客户端是没有加密的,但是如果需要通过账户登录:

        >>> client = MongoClient('mongodb://账号:密码@localhost:27017/')

三、获取一个数据库

    一个MongoDB实例可以支持多个独立的数据库。使用PyMongo时,可以通过访问MongoClient的属性的方式来访问数据库。

        >>> db = client.test_database

    如果数据库名字使用属性方式不能访问(像test-database),也可以通过访问字典值的方式。

        >>> db = client['test-database']

四、获取一个Collection

    一个collection是一组存在MongoDB中的文件(documents),大致可以认为是关系型数据库中表的概念。

  获取Collection方法与获取数据库方法一致:

       >>> collection = db.test_collection #注意连接符是_不是-

    或用字典方式:

       >>> collection = db['test-collection']

    需要注意的是,MongoDB里的collections(集合)和databases(数据库)都是惰性创建的,前面提到的所有命令

    实际上没有对MongoDB server进行任何操作。当第一个文件插入后,collections和databases才会被创建。

五、文件(Documents)

    数据在MongoDB中是用JSON类文件的形式表示和保存起来的。在pymongo中用字典来代表文件。

    例如,下面这个字典可能被用来代表一篇博客文章:

        >>> import datetime

        >>> post = {

                          "author": "Mike",

         "text": "My first blog post!",

           "tags": ["mongodb","python","pymongo"],

         "date": datetime.datetime.utcnow()

         }

  注意,文件里可以包含python原生(native)类型(datetime.datetime实例),这些类型的值会被自动在原生类型和BSON格式之间转换。

六、插入一个文件(Inserting a Document)

    插入一个文件到collection中,可以使用insert_one()方法。

        >>> posts = db.posts

        >>> post_id = posts.insert_one(post).inserted_id

        >>> post_id

        ObjectId('57eb8f2177eddf292cbea0b3')

    当一个文件被插入一个特殊的键值'_id',即使文件内没有_id这个键值,那么系统自动添加一个到文件里。

    这是一个特殊键值,它的值在整个collection里是唯一的。insert()返回这个文件的_id值。

    插入第一个文件后,这个posts collection 就真正的在server上创建了。我们可以通过查看数据库上的

    所有collection来验证:

        >>> db.collection_names(include_system_collections=False)

        ['posts']

七、获取单个文件 find_one()

    在MongoDB中,最基本的查询是find_one。这个方法返回一个符合查询的文件,或者在没有匹配的时候返回None。

    当只有一个文件符合条件的时候,或者只对第一个符合条件的文件感兴趣的时候,这个方法是很有用的。

    我们用find_one()来获取posts collection 里的第一个文件:

        >>> posts.find_one()

        {'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike', 

        '_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'], 

        'text': 'My first blog post!'}

    返回结果是一个我们之前插入的符合条件的字典类型值。

    注意,返回的文件里包含_id这个键值,这是自动添加的。

    find_one()还支持对特定元素进行匹配的查询。限制我们文档的作者是"Mike",可以这么做:

       >>> posts.find_one({"author":"Mike"})

       {'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike', 

       '_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'], 

       'text': 'My first blog post!'}

    如果我们用不同的作者,比如:"Eliot",将不会得到结果。

        >>> posts.find_one({"author":"Eliot"})

        >>>

八、按照ObjectId查询

    通过_id也可以进行查询,在例子中就是ObjectId:

         >>> post_id

         ObjectId('57eb54a877eddf292cbea0a8')

         >>> posts.find_one({"_id": post_id})

        {'date': datetime.datetime(2016, 9, 28, 5, 25, 53, 6000), 'author': 'Mike', 

        '_id': ObjectId('57eb54a877eddf292cbea0a8'), 'tags': ['mongodb', 'python'], 

        'text': 'My first blog post!'}

    注意:ObjectId 并不等同于它的字符串形式。

       >>> post_id_as_str = str(post_id)

       >>> posts.find_one({"_id": post_id_as_str}) #No result

       >>> 

    在web应用的一个常见任务就是在request的URL里获取ObjectId,然后找到与之匹配的文件。

    在本例中,必须要先从字符串转换为ObjectId,然后传给find_one:

    >>> from bson.objectid import ObjectId

    #从URL里获取post_id,然后把它作为字符串传入

    >>> def get(post_id):

           #将字符串转换为ObjectId

           document = client.db.collection.find_one({"_id": ObjectId(post_id)})

    小插曲:

    MongoDB以BSON格式保存数据。BSON字符串都是UTF-8编码的,所以pymongo必须确保它保存的字符串值

    包含有效地UTF-8数据.常规字符串(<type ‘str’>)都是有效的,可以不改变直接保存。

    Unicode字符串(<type ‘unicode’>)就需要先编码成UTF-8格式。

九、批量插入

    为了让查询更有趣,我们多插入几个文件。除了单个文件插入,也可以通过给insert_many()方法传入

    一个列表(list),作为该方法的第一个参数,进行批量插入操作。

    这将会插入列表(list)中的每个文件(document)到集合中去,而且只向server发送一条命令:

          new_posts = [{"author": "Mike",

              "text": "Another post!",

            "tags": ["bulk", "insert"],

            "date": datetime.datetime(2009, 11, 12, 11, 14)

           },

          {"author": "Eliot",

            "title": "MongoDB is fun",

            "text": "and pretty easy too!",

           "date": datetime.datetime(2009, 11, 10, 10, 45)

          }]

    >>> result = posts.insert_many(new_posts)

    >>> result.inserted_ids

    [ObjectId('57eb700b77eddf292cbea0a9'), ObjectId('57eb700b77eddf292cbea0aa')] 

    这个例子里有一些比较有趣的地方:

    insert_many()现在返回两个ObjectId实例,每个代表一个插入的文件。

    new_posts[1]与其他的posts内容格式不相同,里面没有"tags”。另外我们增加了一个新的“title”域。这就是MongoDB所提到的无schema特点。

十、查询多个文件

    为了得到更多的文件,我们使用find()方法。find()返回一个Cursor实例,可使我们遍历所有匹配的文件。

    比如遍历每个posts collection里的文件:

         >>> for post in posts.find():

     post

    与使用find_one()时候相同,可以传入一个文件来限制查询结果。比如查询作者"Mike" 文件:

   >>> for post in posts.find({"author":"Mike"}):

        post

十一、文件数量(Counting)

    如果只想知道符合查询条件的文件有多少,可以用count()操作,而没必要进行完整的查询。

    查询collection的文件总数:

         >>> posts.count()

         11

    或者只是查询一些特定文件数量:

        >>> posts.find({"author": "Mike"}).count()

        10

十二、限定范围的查询

    MongoDB支持多种高级查询。比如我们按照时间(小于某个时间)来查询,结果按作者名参数来排序:

        >>> d = datetime.datetime(2009,11,12,12)

        >>> for post in posts.find({"date":{"$lt":d}}).sort("author"):

                     print(post)

   {'date': datetime.datetime(2009, 11, 10, 10, 45), 'author': 'Eliot', 'text': 'and pretty easy too!', '_id': ObjectId('57eb700b77eddf292cbea0aa'),        'title': 'MongoDB is fun'}

   {'date': datetime.datetime(2009, 11, 12, 11, 14), 'author': 'Mike', '_id': ObjectId('57eb700b77eddf292cbea0a9'), 'tags': ['bulk', 'insert'],                'text': 'Another post!'}

    这里使用了特殊的"$lt"操作符来进行范围查询,并调用sort()方法,对结果按照作者参数排序。

十三、索引(Indexing)

    添加索引可以帮助加快某些查询,也可以添加额外的功能来查询和存储文件。

    在这个示例中,我们将演示如何在一个键上创建一个唯一索引,这个索引将拒绝--那些已经在索引中存在该键值的文件。

    首先,我们需要创建一个索引:

        >>> result = db.profiles.create_index([('user_id',pymongo.ASCENDING)],unique = True)

        >>> result

        'user_id_1'

       >>> list(db.profiles.index_information())

        ['_id_', 'user_id_1'] 

   注意:现在我们有两个索引,一个索引 _id是MongoDB自己创建的。另外一个 user_id是我们刚刚创建的。

   现在,让我们建立一些用户配置文件:

  >>> user_profiles = [{'user_id':211,'name':'Luke'},{'user_id':212,'name':'Ziltoid'}]

  >>> result = db.profiles.insert_many(user_profiles)

 该索引可以防止我们的user_id已经插入集合中的文档:

  >>> new_profile = {'user_id': 213, 'name': 'Drew'}

  >>> duplicate_profile = {'user_id': 212, 'name': 'Tommy'}

  >>> result = db.profiles.insert_one(new_profile) # This is fine.

  >>> result = db.profiles.insert_one(duplicate_profile) 

  Traceback (most recent call last): 

  pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: test_database.profiles index: user_id_1 dup key: { : 212 }

    关于索引的MongoDB文档链接:

问题:

  1.pymongo.errors.ServerSelectionTimeoutError: localhost:27017: [WinError 10061] 由于目标计算机积极拒绝,无法连接。

    原因:未装MongoDB或者MongoDB服务没有开启。(这个错误找了很长时间,哎。。。)

        参考链接:http://www.cnblogs.com/greenteaone/p/3745734.html

  2.在数据库存入了文件,如何查看呢?就需要用到MongoDB可视化工具了。

    1)MongoBooster(已用)

      下载地址:http://mongobooster.com/home

    2)Robomongo

      下载地址:https://robomongo.org/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐