您的位置:首页 > 其它

STL容器之set/multiset

2015-06-09 20:08 316 查看
set/multiset会根据待定的排序准则,自动将元素排序。两者不同在于前者不允许元素重复,而后者允许。

关于set

对于set,元素的值标识这个元素。每个元素必须是唯一的,且一旦存入set就不可修改(the elements are always const),但是可以进行插入和删除操作。

访问单个元素,set通常比unordered_set慢,但是set允许按顺序直接插入。

set通常用二叉搜索树实现(sgi用红黑树实现)。

关于Compare

Compare可以是一个函数指针或函数对象,Compare(a,b) shall return true if a is considered to go before b in the strict weak ordering。

关于strict weak ordering

The STL algorithms for stable_sort( ) and sort( ) require the binary predicate to be strict weak ordering.

For example:

· Strict:
pred (X, X) is always false
.

· Weak:
If !pred(X,Y) && !pred(Y,X), then X==Y
.

· Ordering:
If pred(X,Y) && pred(Y,Z), then pred(X,Z)
.

set的迭代器是双向迭代器。

set的接口如下,至于实现,基本是转调了红黑树的函数而已:

template < typename T, typename Compare = less<T>,
typename Alloc = allocator<T> >
class set
{
public:
typedef T       key_type;
typedef T       value_type;
typedef Compare key_compare;
typedef Compare value_compare;
typedef Alloc   allocator_type;

typedef typename allocator_type::pointer             pointer;
typedef typename allocator_type::const_pointer       const_pointer;
typedef typename allocator_type::reference           reference;
typedef typename allocator_type::const_reference     const_reference;

private:
// 红黑树
typedef _Rb_tree<key_type, value_type, _Identity<key_type>, key_compare, allocator_type> _Rep_type;

public:
typedef typename _Rep_type::const_iterator            iterator;
typedef typename _Rep_type::const_iterator            const_iterator;
typedef typename _Rep_type::const_reverse_iterator    reverse_iterator;
typedef typename _Rep_type::const_reverse_iterator const_reverse_iterator;
typedef typename _Rep_type::size_type                 size_type;
typedef typename _Rep_type::difference_type           difference_type;

// 构造
explicit set(const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());

template <typename InputIterator>
set(InputIterator first, InputIterator last,
const key_compare& comp = key_compare(),
const allocator_type& alloc = allocator_type());

set (const set& x);

// 析构
~set();

// 赋值
set& operator=(const set& x);

// 迭代器
iterator begin();
const_iterator begin() const;

iterator end();
const_iterator end() const;

reverse_iterator rbegin();
const_reverse_iterator rbegin() const;

reverse_iterator rend();
const_reverse_iterator rend() const;

// Capacity
bool empty() const;
size_type size() const;
size_type max_size() const;

// Modifiers
/**
由于set的元素是唯一的, 如果val已存在于set中, 插入操作则会失败;
插入操作的状态存入返回值的第二个元素里,
如果插入失败, 返回pair的第一个元素存储的是指向此元素的迭代器,
如果插入成功, 其存储的是指向新插入元素的迭代器.
*/
pair<iterator,bool> insert(const value_type& val);

/**
此函数不关心插入是否成功, 返回值和上个函数返回pair的第一个元素相同.
第一个参数仅是一个hint, 它可能会提高插入的效率.
A bad hint would cause no gains in efficiency.
Insertion requires logarithmic time (if the hint is not taken).
*/
iterator insert(iterator position, const value_type& val);

template <typename InputIterator>
void insert(InputIterator first, InputIterator last);

void erase(iterator position);
size_type erase(const value_type& val);
void erase(iterator first, iterator last);

void swap (set& x);
void clear();

// get操作
key_compare key_comp() const;
value_compare value_comp() const;
allocator_type get_allocator() const;

// Operations
// 没有找到将返回end()
iterator find(const value_type& val) const;
// 返回0或1
size_type count(const value_type& val) const;

/**
Return iterator to lower bound
返回指向第一个满足not considered to go before val的元素的迭代器
即key_compare(element,val)返回false, 也就是element>=val
*/
iterator lower_bound(const value_type& val) const;

// 返回指向第一个满足considered to go after val的元素的迭代器
// 当set包含一个等于val的元素时, lower_bound(val)返回指向这个元素的迭代器, 而upper_bound(val)返回指向下个元素的迭代器
iterator upper_bound(const value_type& val) const;

/**
返回与val相等的所有元素的边界
因为set里所有元素都是唯一的, 所以此序列最多包含一个元素
如果没有符合的值, 两个迭代器都指向val的下一个元素, 此元素被认为go after val
如果找到, 第一个迭代器指向val, 第二个迭代器指向下一个元素
*/
pair<iterator,iterator> equal_range(const value_type& val) const;
}


关于multiset

multiset的特性以及用法和set完全相同,唯一的差别在于它允许键值重复。另外还要注意以下几点:

multiset::find()仅返回第一个查找到的元素,如要获得所有元素序列,可使用multiset::equal_range()。

size_type multiset::erase (const value_type& val);会erase掉所有与val相等的元素。

对于插入操作,不能保证相等元素的相对顺序。

例子1

cplusplus.com上自定义Comparator的例子:

// http://www.cplusplus.com/reference/set/set/set/ // 其实是关于构造函数的例子
// constructing sets
#include <iostream>
#include <set>

bool fncomp(int lhs, int rhs) {return lhs<rhs;}

struct classcomp {
bool operator() (const int& lhs, const int& rhs) const
{return lhs<rhs;}
};

int main()
{
std::set<int> first;                           // empty set of ints

int myints[] = {10,20,30,40,50};
std::set<int> second(myints,myints+5);        // range

std::set<int> third(second);                  // a copy of second

std::set<int> fourth(second.begin(), second.end());  // iterator ctor.

std::set<int,classcomp> fifth;                 // class as Compare

bool (*fn_pt)(int,int) = fncomp;
std::set<int,bool(*)(int,int)> sixth(fn_pt);  // function pointer as Compare

return 0;
}


本来我是不准备展示这个例子的,但是在思考下一个例子的时候,发现还是有必要对class和function pointer作为Comparator的不同做些说明。

可以看到,当用class作为Comparator时,构造函数并不需要参数,因为有默认参数key_compare(),这样OK;但是当用function pointer作为Comparator的时候就不OK了,虽然编译不会出错,但运行起来肯定会出错!

那为什么会编译通过?

考虑到

int m = int();
cout << m << endl;


会输出0,我认为(不一定对啊)c++对基本数据类型进行了“类”化,主要出于一些算法对基本类型进行specialize时,接口统一(可能描述有问题)的考虑。int()相当于用0初始化m,bool(*)(int,int)()就是用0初始化这个函数指针类型。

所以,一定要用实际的函数指针来初始化Comparator。

例子2

当set用int作为参数时,key就是int类型,insert一个元素就是拷贝一个int,也没啥开销。但当元素类型是一个类时,insert一个元素就会调用拷贝构造函数,这开销就可能很大了。

可以用指向类的指针作为set的参数啊!只要自定义Comparator就OK了。

下面就是一个例子:

#include <iostream>
#include <set>
#include <cstdlib>
using namespace std;

struct Cont
{
Cont(int m=0,int n=0):a(m),b(n) {}
int a,b;
void show() { cout << a+b << endl; }
};

bool com(Cont *a, Cont *b)
{
return a->a+a->b < b->a+b->b;
}

int main ()
{
set<Cont*,bool (*)(Cont*,Cont*)> myset(com);
Cont *p = NULL;
for(int i=0; i<5; ++i)
{
p = new Cont(rand(),rand());
myset.insert(p);
}

set<Cont*,bool (*)(Cont*,Cont*)>::iterator ite;
for(ite=myset.begin(); ite!=myset.end(); ++ite)
{
(*ite)->show();
delete *ite;
}

return 0;
}


既然可以用指针,那么可以用引用吗?答案是不行。

set用到的很多类里都有类似这样的定义:typedef T* pointer;,然而定义一个指向引用的指针是非法的:typedef int&*pointer;(错误!)。

能想出这样的例子来,我都佩服我自己,然而为什么我还没有找到实习?crying…

参考

http://www.cplusplus.com/reference/set/

STL源码剖析
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: