您的位置:首页 > 其它

初识STL vector

2015-03-17 20:55 197 查看
vector可用于代替C中的数组,或者MFC中的CArray,从许多说明文档或者网上评论,一般一致认为应该多用vector,因为它的效率更高,而且具备很好的异常安全性。而且vector是STL推荐使用的默认容器,除非你知道你有特殊需要,使用vector不能满足你的需求,例如需要容器在head和tail高效的插入和删除,或者在任何位置高效的删除和插入操作,那么你可能使用deque或者list更加合适。

vector是连续内存容器,换句话说,标准要求所有标准库实现的时候,vector中的元素的内存必须是连续的。所以对于插入和删除的时间复杂度是很高的,因为删除或者插入的时候,需要元素的移动,即元素复制拷贝。

vector的内部实现一般需要用到placement new ,所以效率很高,因为很多的时候,只要我们是使用得到,就可以省去很多的内存分配开销。而且vector的使用,元素可以没有默认的构造函数,但是需要拷贝构造函数的存在,这是使用CArray所无法实现的。

使用原则:

1,尽量使用vector代替C风格的数组或者CArray;

2,尽量使用算法代替手工写的循环;

3,尽量使用vector本身的函数代替其他泛型算法;

Vector总览

vector是C++标准模板库中的部分内容,它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。vector之所以被认为是一个容器,是因为它能够像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动态数组,能够增加和压缩数据。

为了可以使用vector,必须在你的头文件中包含下面的代码:
#include <vector>
vector属于std命名域的,因此需要通过命名限定,如下完成你的代码:
using std::vector;
vector<int>
vInts;
或者连在一起,使用全名:
std::vector<int>
vInts;
建议使用全局的命名域方式:

using namespace std;

vector容器提供了很多接口,在下面的表中列出vector的成员函数和操作

Vector成员函数

函数
表述
c.assign(beg,end)
c.assign(n,elem)
将[beg; end)区间中的数据赋值给c,注意不包含end
将n个elem的拷贝赋值给c。
c.at(idx)
传回索引idx所指的数据,如果idx越界,抛出out_of_range。
c.back()
传回最后一个数据,不检查这个数据是否存在。
c.begin()
迭代器指向第一个元素
c.capacity()
返回为vector分配的内存大小。
c.clear()
移除容器中所有数据。
c.empty()
判断容器是否为空。
c.end()
迭代器指向最后一个数据地址。
c.erase(pos)
c.erase(beg,end)
删除pos位置的数据,传回下一个数据的位置。
删除[beg,end)区间的数据,传回下一个数据的位置。
c.front()
传回第一个数据。
get_allocator
使用构造函数返回一个拷贝。
c.insert(pos,elem)
c.insert(pos,n,elem)
c.insert(pos,beg,end)
在pos位置插入一个elem拷贝,传回新数据位置。
在pos位置插入n个elem数据。无返回值。
在pos位置插入在[beg,end)区间的数据。无返回值。
c.max_size()
返回容器中最大数据的数量。
c.pop_back()
删除最后一个数据。
c.push_back(elem)
在尾部加入一个数据。
c.rbegin()
传回一个逆向队列的第一个数据。
c.rend()
传回一个逆向队列的最后一个数据的下一个位置。
c.resize(num)
重新指定队列的长度。
c.reserve()
保留适当的容量。
c.size()
返回容器中实际数据的个数。
c1.swap(c2)
swap(c1,c2)
将c1和c2元素互换。
同上操作。
vector<Elem> c
vector <Elem> c1(c2)
vector <Elem> c(n)
vector <Elem> c(n, elem)
vector <Elem> c(beg,end)
c.~ vector <Elem>()
创建一个空的vector。
复制一个vector。
创建一个vector,含有n个数据,数据均已缺省构造产生。
创建一个含有n个elem拷贝的vector。
创建一个以[beg;end)区间的vector。
销毁所有数据,释放内存。
Vector操作

函数
描述
operator[]
返回容器中指定位置的一个引用。
附上www.cplusplus.com里的说明图:


Member functions

(constructor)
Construct vector (public member function )

(destructor)
Vector destructor (public member function )

operator=
Assign content (public member function )

Iterators:

begin
Return iterator to beginning (public member function )

end
Return iterator to end (public member function )

rbegin
Return reverse iterator to reverse beginning (public member function )

rend
Return reverse iterator to reverse end (public member function )

cbegin
Return const_iterator to beginning (public member function )

cend
Return const_iterator to end (public member function )

crbegin
Return const_reverse_iterator to reverse beginning (public member function )

crend
Return const_reverse_iterator to reverse end (public member function )

Capacity:

size
Return size (public member function )

max_size
Return maximum size (public member function )

resize
Change size (public member function )

capacity
Return size of allocated storage capacity (public member function )

empty
Test whether vector is empty (public member function )

reserve
Request a change in capacity (public member function )

shrink_to_fit
Shrink to fit (public member function )

Element access:

/]operator[]
Access element (public member function )

at
Access element (public member function )

front
Access first element (public member function )

back
Access last element (public member function )

data
Access data (public member function )

Modifiers:

assign
Assign vector content (public member function )

push_back
Add element at the end (public member function )

pop_back
Delete last element (public member function )

insert
Insert elements (public member function )

erase
Erase elements (public member function )

swap
Swap content (public member function )

clear
Clear content (public member function )

emplace
Construct and insert element (public member function )

emplace_back
Construct and insert element at the end (public member function )

Allocator:

get_allocator
Get allocator (public member function )


Non-member function overloads

relational operators
Relational operators for vector (function template )

swap
Exchange contents of vectors (function template )


Template specializations

vector<bool>
Vector of bool (class template specialization )

各种函数的使用方法详见http://www.cplusplus.com/reference/vector/vector/?kw=vector

Vecotr内存分配
vector内存分配原则是保证一块连续的空间。 vector
并不是随每一个元素的插入而增长自己,而是当vector 需要增长自身时,它实际分配的空间比当前所需的空间要多一些,这主要是基于效率的考虑。 vector内存分配策略的实现是常常是双倍分配(不是所有),比如说当size为4,capacity大小为4,如果再push一个元素,则size为5,capacity为8。

vector在进行增数据操作时有可能会重新分配内存以保证空间的连续性。增数据操作:push_back,insert

vector在进行删数据操作时,内存不会重新分配。删数据操作:erase,pop_back

有两个概念需要明确:size和capacity

vector::size(): Returns the number of elements in the vector container.

vector::capacity(): Returns the size of the allocated storage space for the elements of the vector container

size是元素个数,capacity则是指为vector分配的内存大小,显然,capacity一定要大于等于size。

Vector的使用:
1、构造vector
方式一:默认构造函数,构造一个初始长度为0的空向量,如:vector<int>
v1;
方式二:带有单个整形参数的构造函数,此参数描述了向量的初始大小和成员的初始值。成员的初始值是一个可选的参数;如:vector<int>
v2(n,0): 构造含有n个成员0的向量;
方式三:复制构造函数,构造一个新的向量,作为已存在的向量的完全复制,如:vector<int>
v3(v2);
方式四:带两个常量参数的构造函数,产生初始值为一个区间的向量。区间由一个半开区间[first,last)
来指定。如:vector<int> v4(first,last)

2、初始化填充vector

如果我们想用原始数组的内容填充vector,那么于有很多种方式。我们来一次学习vector的几个方法。

例如我们有数组int v1[10] = {0,1,0,0,3,0,0,4,4,4};

初始化方式1:

vector<int> v2(10); //初始化size为10可以避免数组动态增长的时候不断的分配内存

//v2.reserve(10);//同上,只要使用其中一个就可以了

for( int i=0; i<10; i++ )

{

v2.push_back(v1[i]);//增加一个元素

}

初始化方式2:

vector<int> v3(&v1[0],&v1[9]);//原始数组的元素指针可以作为迭代器来使用

初始化方式3:

vector<int> v4;

v4.reserve(10);

v4.insert(v4.begin(), &v1[0], &v[9]);//在V4开始处,插入区间[v1[0],v1[9])的元素

初始化方式4:

vector<int> v5(10);

copy(v5.begin(), &v1[0], &v1[9]);

原始数组的元素指针可以作为迭代器来使用。

原则:尽量使用reserve来减少不必要的内存分配次数。

原则:尽量使用empty而不是size()==0 来判断容器是否为空

有可能我们需要在vector中插入相应的元素

vector<int>::iterator i = find( v1.begin(), v1.end(), 3);

if( i != v1.end() )

{

v1.insert( i, 6 );

}

3、遍历vector

例如有vector<int> v1;

void print( int i)

{

cout << i << endl;

}

方式1:

for( int i=0; i<v1.size(); i++ )

{

print(v1[i]);

}

这种方式是我们最熟悉的,但是不够好,写起来不够简洁。而且对于没有随机迭代器的其他容器来说,这样做是办不到的。

方式2:

typedef vector<int>:: iterator VIntIterator;

VIntIterator end = v1.end();

for( VIntIterator i=v1.begin(); i != end; ++i )

{

print( *i );

}

注意:先计算end有好处,因为不必要每次去重复计算end,vector的end()不是常数时间的,所以先缓存下来能提高效率。写算法的时候尽量使用!=比较迭代器,因为<对于很多非随机迭代器没有这个操作符。

但是这种方式也写起来比较繁琐。

方式3:

for_each( v1.begin(), v1.end(), print );

使用算法写起来简单多了。

使用算法的时候,可以使用函数对象,例如

class OutPut

{

public:

void operator ()( double i )

{

std::cout << i;

}

}

for_each( v1.begin(), v1.end(), OutPut );

4、访问vector中的数据

使用两种方法来访问vector。

1、 vector::at()

2、 vector::operator[]

operator[]主要是为了与C语言进行兼容。它可以像C语言数组一样操作。但at()是我们的首选,因为at()进行了边界检查,如果访问超过了vector的范围,将抛出一个例外。由于operator[]容易造成一些错误,所有我们很少用它。

vector<int>
v;

v.reserve(10);

for(int i=0;
i<7; i++)

v.push_back(i);

try

{

int iVal1
= v[7]; // not bounds checked - will not throw

int iVal2
= v.at(7); // bounds checked - will throw if out of range

}

catch(const exception&
e)

{

cout << e.what();

}
你可以在这个代码中尝试不同条件,观察它的结果,但是无论何时使用at(),都是正确的。

5、访问vector中的数据

vector添加数据的缺省方法是push_back()。push_back()函数表示将数据添加到vector的尾部(vector不支持从头部插入元素),并按需要来分配内存。例如:向vector<Widget>中添加10个数据,需要如下编写代码:
for(int i= 0;i<10; i++)
vWidgets.push_back(Widget(i));
6、删除vector中的数据

vector能够非常容易地添加数据,也能很方便地取出数据,同样vector提供了erase(),pop_back(),clear()来删除数据,当你删除数据的时候,你应该知道要删除尾部的数据,或者是删除所有数据,还是个别的数据。

删除指定元素

vector<double> v1;

//….初始化代码

vector<double>:: iterator i = find( v1.begin(), v1.end(), 3.0 );

if( i != v1.end() )

{

v1.erase(i);

}

这样就真的删除了么指定的元素了么?没有。其实只是内部的元素作了移动,vector的删除的时间复杂度是很高的。所以选择容器的时候,如果需要频繁在中间插入和删除元素,那选择vector就会影响效率了。

注意:插入或者删除操作会使得迭代器失效。

原则:使用erase-remove惯用法删除元素

v1.erase( remove(v1.begin(), v1.end(), 3.0), v1.end() );

7、vector是否为空

在判断容器是否为空的时候,使用empty()来代替size()是否等于0的检查方式,因为empty更加高效时间复杂度是常数时间的,size()时间复杂度不是常数时间的。

原则:使用empty判断标准容器是否为空

8,vector中的查找

原则:尽量使用标准容器自带的算法代替公共算法。

但是vector中并没有多少自己的算法,倒是list中有remove ,remove_if,sort,reverse等算法。

find

find_if

如:vector<double>:: iterator i = find( v1.begin(), v1.end(), 3.0 );

9.remove_if

Remove_if()算法

现在我们考虑操作里面的数据。如果要使用remove_if(),我们需要在头文件中包含如下代码::
#include <algorithm>
Remove_if()有三个参数:

1、 iterator _First:指向第一个数据的迭代指针。

2、 iterator _Last:指向最后一个数据的迭代指针。

3、 predicate _Pred:一个可以对迭代操作的条件函数。

条件函数

条件函数是一个按照用户定义的条件返回是或否的结果,是最基本的函数指针,或者是一个函数对象。这个函数对象需要支持所有的函数调用操作,重载operator()()操作。remove_if()是通过unary_function继承下来的,允许传递数据作为条件。

例如,假如你想从一个vector<CString>中删除匹配的数据,如果字串中包含了一个值,从这个值开始,从这个值结束。首先你应该建立一个数据结构来包含这些数据,类似代码如下:
#include <functional>
enum findmodes
{
FM_INVALID = 0,
FM_IS,
FM_STARTSWITH,
FM_ENDSWITH,
FM_CONTAINS
};
typedef struct tagFindStr
{
UINT iMode;
CString szMatchStr;
} FindStr;
typedef FindStr* LPFINDSTR;
然后处理条件判断:
class FindMatchingString
: public std::unary_function<CString, bool>
{

public:
FindMatchingString(const LPFINDSTR
lpFS) : m_lpFS(lpFS) {}

bool operator()(CString&
szStringToCompare) const
{
bool retVal
= false;

switch(m_lpFS->iMode)
{
case FM_IS:
{
retVal = (szStringToCompare == m_lpFDD->szMatchStr);
break;
}
case FM_STARTSWITH:
{
retVal = (szStringToCompare.Left(m_lpFDD->szMatchStr.GetLength())
== m_lpFDD->szWindowTitle);
break;
}
case FM_ENDSWITH:
{
retVal = (szStringToCompare.Right(m_lpFDD->szMatchStr.GetLength())
== m_lpFDD->szMatchStr);
break;
}
case FM_CONTAINS:
{
retVal = (szStringToCompare.Find(m_lpFDD->szMatchStr) != -1);
break;
}
}

return retVal;
}

private:
LPFINDSTR m_lpFS;
};
通过这个操作你可以从vector中有效地删除数据:
// remove all strings containing the value of
// szRemove from vector<CString> vs.

FindStr fs;
fs.iMode = FM_CONTAINS;
fs.szMatchStr = szRemove;

vs.erase(std::remove_if(vs.begin(), vs.end(), FindMatchingString(&fs)), vs.end());
Remove_if()能做什么?

你可能会疑惑,对于上面那个例子在调用remove_if()的时候还要使用erase()呢?这是因为大家并不熟悉STL中的算法。Remove(),remove_if()等所有的移出操作都是建立在一个迭代范围上的,那么不能操作容器中的数据。所以在使用remove_if(),实际上操作的时容器里数据的上面的。思考上面的例子:

1、 szRemove =
“o”.

2、 vs见下面图表中的显示。



观察这个结果,我们可以看到remove_if()实际上是根据条件对迭代地址进行了修改,在数据的后面存在一些残余的数据,那些需要删除的数据。剩下的数据的位置可能不是原来的数据,但他们是不知道的。

调用erase()来删除那些残余的数据。注意上面例子中通过erase()删除remove_if()的结果和vs.enc()范围的数据。

压缩一个臃肿的vector

很多时候大量的删除数据,或者通过使用reserve(),结果vector的空间远远大于实际需要的。所有需要压缩vector到它实际的大小。resize()能够增加vector的大小。Clear()仅仅能够改变缓存的大小,所有的这些对于vector释放内存等九非常重要了。如何来解决这些问题呢,让我们来操作一下。

我们可以通过一个vector创建另一个vector。让我们看看这将发生什么。假定我们已经有一个vector
v,它的内存大小为1000,当我们调用size()的时候,它的大小仅为7。我们浪费了大量的内存。让我们在它的基础上创建一个vector。

std::vector<CString> vNew(v);
cout << vNew.capacity();
vNew.capacity()返回的是7。这说明新创建的只是根据实际大小来分配的空间。现在我们不想释放v,因为我们要在其它地方用到它,我们可以使用swap()将v和vNew互相交换一下?

vNew.swap(v);
cout << vNew.capacity();
cout << v.capacity();
有趣的是:vNew.capacity()是1000,而v.capacity()是7。

现在是达到我的目的了,但是并不是很好的解决方法,我们可以像下面这么写:

std::vector<CString>(v).swap(v);
你可以看到我们做了什么?我们创建了一个临时变量代替那个命名的,然后使用swap(),这样我们就去掉了不必要的空间。

实例:

#include "StdAfx.h"

#include <iostream>

#include <vector>

using namespace std;

typedef vector<int> INTVECTOR;//自定义类型INTVECTOR

//测试vector容器的功能

int main()

{

//vec1对象初始为空

INTVECTOR vec1;

//vec2对象最初有10个值为6的元素

INTVECTOR vec2(10,6);

//vec3对象最初有3个值为6的元素,拷贝构造

INTVECTOR vec3(vec2.begin(),vec2.begin()+3);

//声明一个名为i的双向迭代器

INTVECTOR::iterator i;

//从前向后显示vec1中的数据

cout<<"vec1.begin()--vec1.end():"<<endl;

for (i =vec1.begin(); i !=vec1.end(); ++i)

cout << *i << " ";

cout << endl;

//从前向后显示vec2中的数据

cout<<"vec2.begin()--vec2.end():"<<endl;

for (i =vec2.begin(); i !=vec2.end(); ++i)

cout << *i << " ";

cout << endl;

//从前向后显示vec3中的数据

cout<<"vec3.begin()--vec3.end():"<<endl;

for (i =vec3.begin(); i !=vec3.end(); ++i)

cout << *i << " ";

cout << endl;

//测试添加和插入成员函数,vector不支持从前插入

vec1.push_back(2);//从后面添加一个成员

vec1.push_back(4);

vec1.insert(vec1.begin()+1,5);//在vec1第一个的位置上插入成员5

//从vec1第一的位置开始插入vec3的所有成员

vec1.insert(vec1.begin()+1,vec3.begin(),vec3.end());

cout<<"after push() and insert() now the vec1 is:" <<endl;

for (i =vec1.begin(); i !=vec1.end(); ++i)

cout << *i << " ";

cout << endl;

//测试赋值成员函数

vec2.assign(8,1);   // 重新给vec2赋值,8个成员的初始值都为1

cout<<"vec2.assign(8,1):" <<endl;

for (i =vec2.begin(); i !=vec2.end(); ++i)

cout << *i << " ";

cout << endl;

//测试引用类函数

cout<<"vec1.front()="<<vec1.front()<<endl;//vec1第零个成员

cout<<"vec1.back()="<<vec1.back()<<endl;//vec1的最后一个成员

cout<<"vec1.at(4)="<<vec1.at(4)<<endl;//vec1的第五个成员

cout<<"vec1[4]="<<vec1[4]<<endl;

//测试移出和删除

vec1.pop_back();//将最后一个成员移出vec1

vec1.erase(vec1.begin()+1,vec1.end()-2);//删除成员

cout<<"vec1.pop_back() and vec1.erase():" <<endl;

for (i =vec1.begin(); i !=vec1.end(); ++i)

cout << *i << " ";

cout << endl;

//显示序列的状态信息

cout<<"vec1.size(): "<<vec1.size()<<endl;//打印成员个数

cout<<"vec1.empty(): "<<vec1.empty()<<endl;//清空

}


结果如下:


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: