您的位置:首页 > 编程语言 > C语言/C++

关于C++标准库中的 Map 和 hash_map 知识点小总结

2014-05-05 14:48 399 查看
MAP

map是一类关联式容器。它的特点是增加和删除节点对迭代器的影响很小,除了操作节点,对其他的节点都没有什么影响。对于迭代器来说,可以修改实值,而不能修改key。使用map得包含map类所在的头文件:

#include <map> //注意,STL头文件没有扩展名.h


map对象是模板类,需要关键字和存储对象两个模板参数:

std:map<int, string> personnel;
这样就定义了一个用int作为索引,并拥有相关联的指向string的指针.为了使用方便,可以对模板类进行一下类型定义:

typedef map<int, CString> UDT_MAP_INT_CSTRING;
UDT_MAP_INT_CSTRING enumMap;
查找:

下标操作符给出了获得一个值的最简单方法,但是,只有当map中有这个键的实例时才对,否则会自动插入一个实例,值为初始化值。

CString tmp = enumMap[2];


可以使用Find()和Count()方法来发现一个键是否存在。

查找map中是否包含某个关键字条目用find()方法,传入的参数是要查找的key,在这里需要提到的是begin()和end()两个成员,分别代表map对象中第一个条目和最后一个条目(其实是最后一个元素的后一个位置),这两个数据的类型是iterator.

int nFindKey = 2;            //要查找的Key
//定义一个条目变量(实际是指针)
UDT_MAP_INT_CSTRING::iterator it= enumMap.find(nFindKey);
if(it == enumMap.end())
{
//没找到
}
else
{
//找到
}


通过map对象的方法获取的iterator数据类型是一个std::pair对象,包括两个数据iterator->first
和iterator->second 分别代表关键字和存储的数据。
插入:

改变map中的条目非常简单,因为map类已经对[]操作符进行了重载

enumMap[1] = "One";
enumMap[2] = "Two";
.....


这样非常直观,但存在一个性能的问题。插入2时,先在enumMap中查找主键为2的项,没发现,然后将一个新的对象插入enumMap,键是2,值是一个空字符串,插入完成后,将字符串赋为"Two";该方法会将每个值都赋为缺省值,然后再赋为显示的值,如果元素是类对象,则开销比较大。我们可以用以下方法来避免开销:

enumMap.insert(map<int, CString> :: value_type(2, "Two"))


删除:

移除某个map中某个条目用erase(),该成员方法的定义如下:

iterator erase(iterator it); //通过一个条目对象删除
iterator erase(iterator first, iterator last);       //删除一个范围
size_type erase(const Key& key); //通过关键字删除
clear();   //就相当于 enumMap.erase(enumMap.begin(), enumMap.end());


map的sort问题

Map中的元素是自动按key升序排序,所以不能对map用sort函数:

map中swap的用法

Map中的swap不是一个容器中的元素交换,而是两个容器交换;

map的基本操作函数:

begin() 返回指向map头部的迭代器

clear() 删除所有元素

count() 返回指定元素出现的次数

empty() 如果map为空则返回true

end() 返回指向map末尾的迭代器

equal_range() 返回特殊条目的迭代器对

erase() 删除一个元素

find() 查找一个元素

get_allocator() 返回map的配置器

insert() 插入元素

key_comp() 返回比较元素key的函数

lower_bound() 返回键值>=给定元素的第一个位置

max_size() 返回可以容纳的最大元素个数

rbegin() 返回一个指向map尾部的逆向迭代器

rend() 返回一个指向map头部的逆向迭代器

size() 返回map中元素的个数

swap() 交换两个map

upper_bound() 返回键值>给定元素的第一个位置

value_comp() 返回比较元素value的函数

hash_map

hash_map类在头文件hash_map中,和所有其它的C++标准库一样,头文件没有扩展名

#include <hash_map>
using namespace std;
using namespace stdext;


hash_map是一个聚合类,它继承自_Hash类,包括一个vector,一个list和一个pair,其中vector用于保存桶,list用于进行冲突处理,pair用于保存key->value结构,简要地伪码如下:

class hash_map<class _Tkey, class _Tval>
{
private:
typedef pair<_Tkey, _Tval> hash_pair;
typedef list<hash_pair>    hash_list;
typedef vector<hash_list>  hash_table;
};


hash_map的用法和map是一样的,提供了 insert,size,count等操作,并且里面的元素也是以pair类型来存贮的。虽然对外部提供的函数和数据类型是一致的,但是其底层实现是完全不同的,map底层的数据结构是rb_tree而,hansh_map却是哈希表来实现的。

void main()
{//简单的一个列子,其使用方法和map是一样的。
hash_map<int,string> hmap;//定义一个实例
hmap.insert(pair<int,string>(10,"sfsfd"));//插入一个pair对象,
hmap.insert(hash_map<int,string>::value_type(34,"sddsf"));//value_type就是pair类型的

hmap[23] = "23";
hmap[33] = "33";
hmap[-1] = "-1";
hash_map<int,string>::iterator it = hmap.begin();//定义迭代器指针
while(it!=hmap.end())//遍历
cout<<it->first<<"\t"<<it++->second<<endl;//分别输出关键字和存储的数据
it = hmap.find(23);  //查找
if(it!=hmap.end())  //找到了就打印出来
PRINT(it);
cout<<hmap.size()<<endl;
cout<<hmap.count(58)<<endl;
cout<<hmap.empty()<<endl;
hash_map<int,string>::const_reverse_iterator cit = hmap.rend();//指向头部的逆向迭代器
PRINT(cit);
}


map 与 hash_map

总体来说,hash_map 查找速度会比map快,而且查找速度基本和数据量大小无关,属于常数级别;而map的查找速度是log(n)级别。hash还有hash函数的耗时。当有100w条记录的时候,map也只需要20次的比较,200w也只需要21次的比较!所以并不一定常数就比log(n) 小!

hash_map对空间的要求要比map高很多,所以是以空间换时间的方法,而且,hash_map如果hash函数和hash因子选择不好的话,也许不会达到你要的效果,所以至于用map,还是hash_map,从3个方面来权衡: 查找速度,数据量, 内存使用,还有一个就是你的经验!没有特别的标准。

另外可以通过重写 hash_compair仿函数,更改里面关于桶数量的定义,如果取值合适,也可以得到更优的性能。而且如果你的数据是自定义的类型,必须要重写这个仿函数。可以模仿原来的写法,所有的成员函数,成员变量一个不能少!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: