您的位置：首页 > 理论基础 > 数据结构算法

Java核心技术笔记——数据结构（1）

2016-01-20 15:16 561 查看

java设计了一套集合（也叫容器）类库，来支持最常用的数据结构，Java集合类库采用接口与实现分离的原则。下面主要梳理集合接口，集合类（包括集合抽象类和具体实现类）。

1 Java集合接口

Java的集合接口关系图如下：

集合有两个基本接口Collection和Map

（1） Collection接口的源码如下：

public interface Collection<E> extends Iterable<E> {
// Query Operations
int size();
boolean isEmpty();
boolean contains(Object o);
//返回迭代器对象，用来访问集合中的元素
Iterator<E> iterator();
//返回集合的对象数组
Object[] toArray();
//添加元素
boolean add(E e);
//移除元素
boolean remove(Object o);
//判断传入集合是否被包含
boolean containsAll(Collection<?> c);
//与传入集合求交集
boolean retainAll(Collection<?> c);
boolean addAll(Collection<? extends E> c);
}

（2）Map用来存放键值对，Map接口源码如下：

public interface Map<K,V> {
// Query Operations
int size();
boolean isEmpty();
boolean containsKey(Object key);
boolean containsValue(Object value);
//获取对应k的值，如果没有这个值，则返回null,K可以为null
V get(Object key);
// Modification Operations
//插入k和v,此处可以插入k为null的键值对，但是v不能为null
V put(K key, V value);
V remove(Object key);

// Bulk Operations

void putAll(Map<? extends K, ? extends V> m);

void clear();

// Views
/*--注意从下面三个返回的集中，可以删除元素，与此同时也删除了Map中的元素，但是不能添加元素---***/

//返回Map中所有K的Set集
Set<K> keySet();
//返回Map中所有V的Collection集合
Collection<V> values();
//整个键值对作为一个Set集返回
Set<Map.Entry<K, V>> entrySet();

interface Entry<K,V> {
K getKey();
V getValue();
V setValue(V value);
boolean equals(Object o);
int hashCode();
}
// Comparison and hashing

boolean equals(Object o);
int hashCode();
}

注意，在Java中访问集合中某个位置元素，要使用迭代器（Iterator）。

（3）Iterator接口的源码如下：

public interface Iterator<E> {
//返回将要访问的下一个对象，如果已经是集合的最后一个元素，将抛出NoSuchElementException错误
E next();
//由于上面方法抛出错误，因此在访问集合元素之前，先判断是否有下一个元素
boolean hasNext();
//移除元素之前，要先使用next方法定位到改元素；
void remove();
}

List是一个顺序排列集合接口，List在特定位置添加元素的方法有两种，一种是整数索引，一种是列表迭代器。

（4）List接口的源码如下：

public interface List<E> extends Collection<E> {
// Query Operations
//继承Collection方法，参考Collection源码分析
int size();
boolean isEmpty();
boolean contains(Object o);
Iterator<E> iterator();
........

// Positional Access Operations
//获取给定位置的元素
E get(int index);
//用新元素取代给定位置元素，返回原来的元素
E set(int index, E element);
//通过整数索引，在给定位置添加元素
void add(int index, E element);
//移除给定位置的元素
E remove(int index);
// Search Operations
//返回与给定元素相等的元素在列表中第一次出现的位置，如果没有返回-1
int indexOf(Object o);
//返回与给定元素相等的元素在列表中最后一次出现的位置，如果没有放回-1
int lastIndexOf(Object o);

// List Iterators
//返回一个列表迭代器
ListIterator<E> listIterator();
//返回一个列表迭代器，第一次调用next后，返回的给定索引的元素
ListIterator<E> listIterator(int index);

// View
//返回List的某个范围内的子集合
List<E> subList(int fromIndex, int toIndex);
}

由于Collection有的子集合（如Set）是无序的，所以Iterator接口中无add方法，但是对于List子集合需要使用迭代器添加指定位置的元素，因此ListIterator继承Iterator，提供了add方法。

（5）ListIterator接口源码如下：

public interface ListIterator<E> extends Iterator<E> {
// Query Operations
//继承Iterator方法，参考Iterator源码分析
boolean hasNext();
E next();
//反向迭代列表时，判断是否有元素
boolean hasPrevious();
//返回前一个对象，如果已经是集合的第一个元素，将抛出NoSuchElementException错误
E previous();
//返回下一次调用next方法后，元素的索引
int nextIndex();
//返回下一次调用previous方法后，元素的索引
int previousIndex();
// Modification Operations
void remove();
void set(E e);
void add(E e);
}

Set接口和Collection接口的方法一样，这里Java为什么要定义一个新的接口？是为了从概念上区分集合与集，方面扩展。

SortedSet和SortedMap接口，顾名思义给开发者暴露了排序的方法，并可以返回某个范围内的子集

（6）SortedSet的源码如下：

public interface SortedSet<E> extends Set<E> {
//用于排序的方法，参考后续章节具体实现类
Comparator<? super E> comparator();
//下面三个方法，返回给定范围内的子SortedSet集
SortedSet<E> subSet(E fromElement, E toElement);
SortedSet<E> headSet(E toElement);
SortedSet<E> tailSet(E fromElement);

E first();
E last();
}

（7）SortedMap的源码如下：

public interface SortedMap<K,V> extends Map<K,V> {
//用于排序的方法，参考后续章节具体实现类
Comparator<? super K> comparator();
//下面三个方法，返回给定范围内的子SortedMap
SortedMap<K,V> subMap(K fromKey, K toKey);
SortedMap<K,V> headMap(K toKey);
SortedMap<K,V> tailMap(K fromKey);

//下面三个方法和Map接口中方法一样，参考Map接口源码
Set<K> keySet();
Collection<V> values();
Set<Map.Entry<K, V>> entrySet();
}

Java SE6引入了NavigableSet和NavigableMap接口，用来在有序集和Map中查找遍历方法

（8）NavigableSet源码如下：

public interface NavigableSet<E> extends SortedSet<E> {

E lower(E e);
E floor(E e);
.......

//下面三个方法主要返回给定范围内的子NavigableSet,boolean 标志是否包括边界值
NavigableSet<E> subSet(E fromElement, boolean fromInclusive,
E toElement,   boolean toInclusive);

NavigableSet<E> headSet(E toElement, boolean inclusive);
NavigableSet<E> tailSet(E fromElement, boolean inclusive);
//下面三个方法和SortedSet接口中方法一样，参考SortedSet接口源码
SortedSet<E> subSet(E fromElement, E toElement);
SortedSet<E> headSet(E toElement);
SortedSet<E> tailSet(E fromElement);
}

（9）NavigableMap源码如下：

public interface NavigableMap<K,V> extends SortedMap<K,V> {

Map.Entry<K,V> lowerEntry(K key);
K lowerKey(K key);
Map.Entry<K,V> floorEntry(K key);
K floorKey(K key)
Map.Entry<K,V> ceilingEntry(K key);
........

//下面三个方法，返回给定范围内的键的NavigableMap，boolean 表示是否包括边界
NavigableMap<K,V> subMap(K fromKey, boolean fromInclusive,
K toKey,   boolean toInclusive);
NavigableMap<K,V> headMap(K toKey, boolean inclusive);
NavigableMap<K,V> tailMap(K fromKey, boolean inclusive);

//下面三个方法，与SortedMap方法一样，参考SortedMap源码
SortedMap<K,V> subMap(K fromKey, K toKey);
SortedMap<K,V> headMap(K toKey);
SortedMap<K,V> tailMap(K fromKey);
}

队列是在尾部添加一个元素，在头部删除一个元素。双端队列是在头部和尾部都可以删除元素

（10）Queue的源码如下：

public interface Queue<E> extends Collection<E> {

//当执行add往队列中添加元素时，如果队列没有满，则往队列尾部添加元素并返回true，否则add方法抛出异常，offer方法返回false
boolean add(E e);
boolean offer(E e);

//当执行remove移除队列中头部元素时，如果队列不空，则移除头部元素并返回true，否则remove方法抛出异常，poll方法返回false
E remove();
E poll();

//当执行element查看队列中头部元素时，如果队列不空，则返回队列中的头部元素，否则element方法抛出异常，peek方法返回null
E element();
E peek();
}

（11）Deque（双端队列接口）源码如下：

public interface Deque<E> extends Queue<E> {
//当给定的对象添加到双端队列的头部和尾部时，如果队列满了，则前两个方法抛出异常，后两个方法返回false
void addFirst(E e);
void addLast(E e);
boolean offerFirst(E e);
boolean offerLast(E e);

//当删除双端队列头部和尾部元素时，如果队列为空，则前两个方法抛出异常，后两个方法返回null
E removeFirst();
E removeLast();
E pollFirst();
E pollLast();

//当查询双端队列头部和尾部元素时，如果队列为空，则前两个方法抛出异常，后两个方法返回null
E getFirst();
E getLast();
E peekFirst();
E peekLast();

boolean removeFirstOccurrence(Object o);
boolean removeLastOccurrence(Object o);

// *** Queue methods ***

//参考Queue 中的add、offer方法说明
boolean add(E e);
boolean offer(E e);
//参考Queue 中的remove、poll方法说明
E remove();
E poll();
//参考Queue 中的element、peek方法说明
E element();
E peek();

// *** Stack methods ***
void push(E e);
E pop();

// *** Collection methods ***
//参考Collection 中的方法说明
boolean remove(Object o);
boolean contains(Object o);
public int size();
Iterator<E> iterator();
Iterator<E> descendingIterator();
}

RandomAccess接口用于监测List随机访问的效率，该接口没有方法，ArrayList继承了该接口。

（12）RandomAccess源码：

public interface RandomAccess {

}

2. Java集合类

前面的Java集合接口中有大量的方法，这些方法主要通过抽象类和具体类实现。其中抽象类主要实现接口中一部分通用的方法，具体类针对具体的类型实现具体的方法。

下面是Java集合类图：

2.1 Java集合抽象类

对于公用的方法可在集合抽象类实现，一些具体的方法可抽象化在继承的有具体特征的子类中实现。集合抽象类主要有AbstractCollection、AbstractMap

AbstractList、AbstractSet、AbstractQueue、AbstractSequentialList

这里以AbstractCollection源码为例分析一下：

AbstractCollection的源码如下：

public abstract class AbstractCollection<E> implements Collection<E> {

protected AbstractCollection() {
}

// Query Operations
//Collection接口中方法，可根据不同的集合，具体实现。
//迭代器方法和集合大小方法抽象。
public abstract Iterator<E> iterator();
public abstract int size();

//下面所有的方法都在抽象类中实现
public boolean isEmpty() {
return size() == 0;
}

//用迭代器，访问逐次访问集合中的元素，判断是否包含给定的对象
public boolean contains(Object o) {
Iterator<E> it = iterator();
if (o==null) {
while (it.hasNext())
if (it.next()==null)
return true;
} else {
while (it.hasNext())
if (o.equals(it.next()))
return true;
}
return false;
}

//逐次访问集合中的元素，转换集合中对象为数组
public Object[] toArray() {
//根据集合大小定义数组
Object[] r = new Object[size()];
Iterator<E> it = iterator();
for (int i = 0; i < r.length; i++) {
if (! it.hasNext())
// fewer elements than expected
return Arrays.copyOf(r, i);
r[i] = it.next();
}
return it.hasNext() ? finishToArray(r, it) : r;
}

public <T> T[] toArray(T[] a) {
// Estimate size of array; be prepared to see more or fewer elements
int size = size();
T[] r = a.length >= size ? a :
(T[])java.lang.reflect.Array
.newInstance(a.getClass().getComponentType(), size);
Iterator<E> it = iterator();

for (int i = 0; i < r.length; i++) {
if (! it.hasNext()) { // fewer elements than expected
if (a != r)
return Arrays.copyOf(r, i);
r[i] = null; // null-terminate
return r;
}
r[i] = (T)it.next();
}
return it.hasNext() ? finishToArray(r, it) : r;
}

//Integer.MAX_VALUE是int整形的最大取值2的31次方-1，这个常量用来控制集合的最大容量
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private static <T> T[] finishToArray(T[] r, Iterator<?> it) {
int i = r.length;
while (it.hasNext()) {
int cap = r.length;
if (i == cap) {
int newCap = cap + (cap >> 1) + 1;
// overflow-conscious code
if (newCap - MAX_ARRAY_SIZE > 0)
newCap = hugeCapacity(cap + 1);
r = Arrays.copyOf(r, newCap);
}
r[i++] = (T)it.next();
}
// trim if overallocated
return (i == r.length) ? r : Arrays.copyOf(r, i);
}

//返回集合的最大容量值
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError
("Required array size too large");
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

// 添加对象方法实现
public boolean add(E e) {
throw new UnsupportedOperationException();
}
//移除对象方法实现
public boolean remove(Object o) {
Iterator<E> it = iterator();
if (o==null) {
while (it.hasNext()) {
if (it.next()==null) {
it.remove();
return true;
}
}
} else {
while (it.hasNext()) {
if (o.equals(it.next())) {
it.remove();
return true;
}
}
}
return false;
}

//批量操作方法实现
//判断传入集合是否被包含方法实现
public boolean containsAll(Collection<?> c) {
for (Object e : c)
if (!contains(e))
return false;
return true;
}
//添加传入集合方法实现
public boolean addAll(Collection<? extends E> c) {
boolean modified = false;
for (E e : c)
if (add(e))
modified = true;
return modified;
}
//移除传入集合方法实现
public boolean removeAll(Collection<?> c) {
boolean modified = false;
Iterator<?> it = iterator();
while (it.hasNext()) {
if (c.contains(it.next())) {
it.remove();
modified = true;
}
}
return modified;
}
//实现与传入集合求交集方法
public boolean retainAll(Collection<?> c) {
boolean modified = false;
Iterator<E> it = iterator();
while (it.hasNext()) {
if (!c.contains(it.next())) {
it.remove();
modified = true;
}
}
return modified;
}

//对象转换为字符串
public String toString() {
Iterator<E> it = iterator();
//如果集合中对象为null，返回"[]"
if (! it.hasNext())
return "[]";
//拼接字符串
StringBuilder sb = new StringBuilder();
sb.append('[');
for (;;) {
E e = it.next();
sb.append(e == this ? "(this Collection)" : e);
if (! it.hasNext())
return sb.append(']').toString();
sb.append(',').append(' ');
}
}
}

2.2 Java集合具体实现类

我们项目中经常使用的具体类（Java集合类图中具体类）主要有LinkedList、ArrayList、HashSet、TreeSet、PriorityQueue、Array、Deque、HashMap、TreeMap，这些类的源码解析，见后续章节的分析；

下面是Java集合具体类的主要特征，如下表：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航