您的位置:首页 > 编程语言 > Java开发

java_集合体系之List体系总结、应用场景

2017-06-27 18:36 549 查看
感谢原作者!!

摘要:

总结很重要、他能客观的体现出你对这个体系的理解程度、首先要对整体的结构框架要掌握、再细化到每个分支的特点、再比较不同分支之间的相同点、不同点、再根据他们不同的特性分析他们的应用场景。


一:List的整体框架图



线条简单说明:

1、上图中虚线且无依赖字样、说明是直接实现的接口

2、虚线但是有依赖字样、说明此类依赖与接口、但不是直接实现接口

3、实线是继承关系、类继承类、接口继承接口

类或接口说明:

1、Collection:高度抽象出来的集合、定义某一类集合所具有的基本的方法、标准。

2、
4000
Iterable:标识性接口、要求子类提供获取Iterator方法、并且要实现Iterator具有的几个方法。

3、Iterator:迭代器、用于迭代Collection中元素、要求子类必须实现获取Iterator的方法、

4、ListIterator:用于迭代List集合的迭代器、要求List子类必须实现获取ListIterator方法、并且实现其必须方法。

5、List:以队列的形式存储、操作元素、定义了这种形式的集合所具有的基本方法、以及方法的定义。要求List实现类集合中每个元素都有索引、索引值从0开始、

6、Queue:以队列的数据结构存储、操作元素、Queue对于插入、提取和检查操作。每个方法都存在两种形式:一种抛出异常(操作失败时),另一种返回一个特殊值(null 或 false,具体取决于操作)。

7、Deque:实现Queue、使子类可以以双向链表的数据结构形式存储、操作数据、从这可以看出其子类的灵活性较大。

8、Enumeration:枚举、用于Vector及其子类迭代元素、他避免了fail-fast机制、使得Vector及其子类在迭代元素的时候可以保证线程安全。

9、AbstractCollection:Collection的实现类、要求需要实现Collection接口的类都必须从它继承、目的是用于简化编程。

10、 AbstractList:继承AbstractCollection、实现List接口中定义方法、目的也是简化编程、并且其内部提供了获取Iterator、ListIterator的方法。

11、 AbstractSequencedList:继承AbstractList、使得List支持有序队列、比如链表形式存储操作元素。

12、 ArrayList:继承AbstractList、以动态数组的形式存储、操作元素、

13、 LinkedList:继承AbstractSequencedList、实现Deque、List接口、以双向链表的形式存储、操作元素。

14、 Vector:继承AbstractList、以动态数组的形式存储、操作元素、线程安全

15、 Stack:继承Vector、在Vector的基础上新增以栈的形式存储、操作元素。


二:LinkedList与ArrayList


1、相同之处

a)都直接或者间接继承了AbstractList、都支持以索引的方式操作元素

b)都不必担心容量问题、ArrayList是通过动态数组来保存数据的、当容量不足时、数组会自动扩容、而LinkedList是以双向链表来保存数据的、不存在容量不足的问题

c) 都是线程不安全的、一般用于单线程的环境下、要想在并发的环境下使用可以使用Collections工具类包装。


2、不同之处

a)ArrayList是通过动态数组来保存数据的、而LinkedList是以双向链表来保存数据的

b)相对与ArrayList而言、LinkedList实现了Deque接口、Deque继承了Queue接口、同时LinkedList继承了AbstractSequencedList类、使得LinkedList在保留使用索引操作元素的功能的同时、也实现了双向链表所具有的功能、这就决定了LinkedList的特定

c)对集合中元素进行不同的操作效率不同、LinkedList善于删除、添加元素、ArrayList善于查找元素。本质就是不同数据结构之间差异。


三:ArrayList与Vector


1、相同之处:

a) 都是继承AbstractList、拥有相同的方法的定义、

b)内部都是以动态数组来存储、操作元素的、并且都可以自动扩容。


2、不同之处:

a) 线程安全:ArrayList是线程不安全的、适用于单线程的环境下、Vector是线程安全的、使用与多线程的环境下。

b)构造方法:Vector有四个构造方法、比ArrayList多一个可以指定每次扩容多少的构造方法

c) 扩容问题:每当动态数组元素达到上线时、ArrayList扩容为:“新的容量”=“(原始容量x3)/2 + 1”、 而Vector的容量增长与“增长系数有关”,若指定了“增长系数”,且“增长系数有效(即,大于0)”;那么,每次容量不足时,“新的容量”=“原始容量+增长系数”。若增长系数无效(即,小于/等于0),则“新的容量”=“原始容量 x 2”。

d) 效率问题:因为Vector要同步方法、这个是要消耗资源的、所以效率会比较低下

e)Vector为摆脱fail-fast机制、自己内部多提供了一种迭代方法Enumeration、


四:LinkedList、ArrayList、Vector、Stack、Array


1、不同操作的效率对比

关于上面四个集合加一个数组、在这里给出一个表格用于表示他们的不同的操作的效率的排名、这样更直观、

实现机制
随机访问
迭代操作
插入操作
删除操作
数组
连续内存区保护元素
1
不支持
不支持
不支持
ArrayList
以数组保存元素
2
2
2
2
Vector
以数组保存元素
3
3
3
3
Stack
以数组保存元素
3
3
3
3
LinkedList
以链表保存元素
4
1
1
1
通过实例来验证上面表格的内容、由于数组比较特殊、他是牺牲的长度的变化直接在内存中开辟空间来存储元素、所以查询效率是毋庸置疑的、同时由于size一旦确定就不能改变、所以插入删除不支持。所以下面验证没有关于Array的的验证


2、示例:

[java] view
plain copy







package com.chy.collection.example;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.LinkedList;

import java.util.List;

import java.util.Stack;

import java.util.Vector;

public class EfficiencyTest {

private static ArrayList<String> arrayList = new ArrayList<String>();

private static Vector<String> vector = new Vector<String>();

private static Stack<String> stack = new Stack<String>();

private static LinkedList<String> linkedList = new LinkedList<String>();

/**

* 测试插入方法(每次都将新增加的元素插入到集合开始处)、注意不要写成 add(Object o)方法、具体原因自己分析

*/

private static void testInsert(){

testInsert(arrayList);

testInsert(vector);

testInsert(stack);

testInsert(linkedList);

}

/**

* 测试随机访问效率

*/

private static void testRandomAccess(){

testRandomAccess(arrayList);

testRandomAccess(vector);

testRandomAccess(stack);

testRandomAccess(linkedList);

}

/**

* 测试Iterator迭代效率

*/

private static void testIterator(){

testIterator(arrayList);

testIterator(vector);

testIterator(stack);

testIterator(linkedList);

}

/**

* 测试删除效率

*/

private static void testDelete(){

testDelete(arrayList);

testDelete(vector);

testDelete(stack);

testDelete(linkedList);

}

private static void testInsert(List<String> list){

long start = currentTime();

for (int i = 0; i < 10000; i++) {

list.add(0,"a");

}

long end = currentTime();

System.out.println("the add method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");

}

private static void testRandomAccess(List<String> list){

long start = currentTime();

for (int i = 0; i < list.size(); i++) {

list.get(i);

}

long end = currentTime();

System.out.println("the random access method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");

}

private static void testIterator(List<String> list){

long start = currentTime();

Iterator<String> it = list.iterator();

while(it.hasNext()){

it.next();

}

long end = currentTime();

System.out.println("the iterator method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");

}

private static void testDelete(List<String> list){

long start = currentTime();

for (int i = 0; i < 10000; i++) {

if(!list.isEmpty()){

list.remove(0);

}

}

long end = currentTime();

System.out.println("the delete method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");

}

private static long currentTime(){

return System.currentTimeMillis();

}

public static void main(String[] args) {

testInsert();

System.out.println("==========================================================");

testRandomAccess();

System.out.println("==========================================================");

testIterator();

System.out.println("==========================================================");

testDelete();

}

}

运行结果:

[java] view
plain copy







the add method of java.util.ArrayList use time : 32ms

the add method of java.util.Vector use time : 47ms

the add method of java.util.Stack use time : 31ms

the add method of java.util.LinkedList use time : 15ms

==========================================================

the random access method of java.util.ArrayList use time : 15ms

the random access method of java.util.Vector use time : 16ms

the random access method of java.util.Stack use time : 17ms

the random access method of java.util.LinkedList use time : 47ms

==========================================================

the iterator method of java.util.ArrayList use time : 16ms

the iterator method of java.util.Vector use time : 15ms

the iterator method of java.util.Stack use time : 17ms

the iterator method of java.util.LinkedList use time : 16ms

==========================================================

the delete method of java.util.ArrayList use time : 47ms

the delete method of java.util.Vector use time : 31ms

the delete method of java.util.Stack use time : 32ms

the delete method of java.util.LinkedList use time : 15ms

不同的运行环境、差异可能比较大。


3、差异原因分析:

在这里不会主要讨论所有的差异、而是通过源码的方式分析LinkedList与Arraylist、ArrayList与Vector在随机访问、插入、删除元素方面的差异原因、至于迭代Iterator、他们都是用从AbstractList继承的获取Iterator方法、差异不大、不再比较。

ArrayList与LinkedList

a)ArrayList的随机访问效率高于LinkedList:

随机访问是通过索引去查找元素的、LinkedList关于获取指定索引处值的源码:

[java] view
plain copy







/** 获取index处的元素*/

public E get(int index) {

return entry(index).element;

}

/** 获取双向链表LinkedList中指定位置的节点、是LinkedList实现List中通过index操作元素的关键*/

private Entry<E> entry(int index) {

if (index < 0 || index >= size)

throw new IndexOutOfBoundsException("Index: "+index+ ", Size: "+size);

Entry<E> e = header;

if (index < (size >> 1)) {

for (int i = 0; i <= index; i++)

e = e.next;

} else {

for (int i = size; i > index; i--)

e = e.previous;

}

return e;

}

关于获取指定索引处的值的源码:

[java] view
plain copy







/** 检测下标是否越界*/

private void RangeCheck(int index) {

if (index >= size)

throw new IndexOutOfBoundsException(

"Index: "+index+", Size: "+size);

}

/** 获取ArrayList中索引为index位置的元素*/

public E get(int index) {

RangeCheck(index);

return (E) elementData[index];

}

对比两者源码可以看出、LinkedList获取指定索引处的值是通过二分法先确定索引所在范围之后、在逐个查找、直到找到指定索引处、并且对每个索引都是如此、相比于ArrayList直接定位到index处的值来讲、无疑是非常浪费时间、消耗资源的、

b)ArrayList的插入、删除操作效率低于LinkedList的原因:

对于指定index处的插入、删除、ArrayList和LinkedList都是先通过索引查找到指定位置、然后进行下一步的插入删除操作、上面我们知道LinkedList是先通过二分法查找index范围再确定index具体位置、但是ArrayList是直接定位到index处、为什么LinkedList反而快?依然通过源码找原因。

ArrayList关于指定位置的元素的插入:

[java] view
plain copy







/**

* 确保此ArrayList的最小容量能容纳下参数minCapacity指定的容量、

* 1、minCapacity大于原来容量、则将原来的容量增加(oldCapacity * 3)/2 + 1;

* 2、若minCapacity仍然大于增加后的容量、则使用minCapacity作为ArrayList容量

* 3、若minCapacity不大于增加后的容量、则使用增加后的容量。

*/

public void ensureCapacity(int minCapacity) {

modCount++;

int oldCapacity = elementData.length;

if (minCapacity > oldCapacity) {

Object oldData[] = elementData;

int newCapacity = (oldCapacity * 3)/2 + 1;

if (newCapacity < minCapacity)

newCapacity = minCapacity;

// minCapacity is usually close to size, so this is a win:

elementData = Arrays.copyOf(elementData, newCapacity);

}

}

/** 将指定元素添加到指定的索引处 、

* 注意:

* 1、如果指定的index大于Object[] 的size或者小于0、则抛IndexOutOfBoundException

* 2、检测Object[]是否需要扩容

* 3、 将从index开始到最后的元素后移一个位置、

* 4、将新添加的元素添加到index去。

*/

public void add(int index, E element) {

if (index > size || index < 0)

throw new IndexOutOfBoundsException(

"Index: "+index+", Size: "+size);

ensureCapacity(size+1); // Increments modCount!!

<span style="color:#ff0000;">System.arraycopy(elementData, index, elementData, index + 1,

size - index);</span>

elementData[index] = element;

size++;

}

LinkedList关于指定位置的元素的插入:

[java] view
plain copy







/** 在index前添加节点,且节点的值为element*/

public void add(int index, E element) {

<span style="color:#ff0000;"> addBefore(element, (index==size ? header : entry(index)));</span>

}

/** 获取双向链表LinkedList中指定位置的节点、是LinkedList实现List中通过index操作元素的关键*/

private Entry<E> <span style="color:#ff0000;">entry(int index) </span>{

if (index < 0 || index >= size)

throw new IndexOutOfBoundsException("Index: "+index+ ", Size: "+size);

Entry<E> e = header;

if (index < (size >> 1)) {

for (int i = 0; i <= index; i++)

e = e.next;

} else {

for (int i = size; i > index; i--)

e = e.previous;

}

return e;

}

//新建节点、节点值是e、将新建的节点添加到entry之前

private Entry<E> <span style="color:#ff0000;">addBefore(E e, Entry<E> entry)</span> {

//觉得难理解的可以先花个几分钟看一下链式结构资料、最好是图片形式的

//新建节点实体

Entry<E> newEntry = new Entry<E>(e, entry, entry.previous);

//将参照节点原来的上一个节点(即插在谁前面的)的下一个节点设置成newEntry

newEntry.previous.next = newEntry;

//将参照节点(即插在谁前面的)的前一个节点设置成newEntry

newEntry.next.previous = newEntry;

size++;

modCount++;

return newEntry;

}

对比上面代码可以看出来ArrayList每当插入一个元素时、都会调用System.arraycopy()将指定位置后面的所有元素后移一位、重新构造一个数组、这是比较消耗资源的、而LinkedList是直接改变index前后元素的上一个节点和下一个节点的引用、而不需要动其他的东西、所以效率很高。

ArrayList与Vector:

ArrayList、Vector都是继承与AbstractList、并且在类结构上没有多少差异、但是因为Vector要同步方法、所以在性能上不如ArrayList、从源码也可以看出Vector许多方法都是使用关键字synchronized修饰的。不再贴源码


总结:

学以致用、最后总结下上述List集合体系的各个类的使用环境:

1、当需要对集合进行大量的查询时、并且是单线程环境下使用ArrayList

2、当需要对集合进行大量添加、删除时、并且是单线程环境下使用LinkedList、

3、当多线程时、需要对集合进行大量的查询时、可以考虑使用Vector或者Stack、但是不建议、我们可以使用多次提到的Collections类包装。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: