您的位置：首页 > 其它

HashSet、TreeSet、LinkedHashSet三者比较

2013-12-04 19:26 537 查看

Set中不能有重复的元素，这是使用Set的主要原因之一。Set接口主要有三种实现：HashSet、TreeSet和LinkedHashSet。如何挑选一个合适的Set实现类是很重要的。简单来说，如果我们对速度的要求较高，可以使用HashSet；如果我们需要一个可排序的Set，则应该选用TreeSet；如果我们需要一个可根据插入顺序来进行元素读取的Set，则应使用LinkedHashSet。

1. Set接口

Set接口继承了Collection接口。Set接口中不允许有重复的元素，每一个元素在Set都应该是唯一的。我们可以简单地将元素添加至一个set，然后我们就能得到一个元素集合，该集合中重复的元素已经被自动移除了。

2. HashSet、TreeSet和LinkedHashSet

HashSet是使用哈希表（hash table）实现的，其中的元素是无序的。HashSet的add、remove、contains方法的时间复杂度为常量O(1)。

TreeSet使用树形结构（算法书中的红黑树red-black tree）实现的。TreeSet中的元素是可排序的，但add、remove和contains方法的时间复杂度为O(log(n))。TreeSet还提供了first()、last()、headSet()、tailSet()等方法来操作排序后的集合。

LinkedHashSet介于HashSet和TreeSet之间。它基于一个由链表实现的哈希表，保留了元素插入顺序。LinkedHashSet中基本方法的时间复杂度为O(1)。

3. TreeSet示例

TreeSet<Integer> tree = new TreeSet<Integer>();
tree.add(12);
tree.add(63);
tree.add(34);
tree.add(45);

Iterator<Integer> iterator = tree.iterator();
System.out.print("Tree set data: ");
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}

输出排序后的结果如下：

Tree set data: 12 34 45 63

现在，我们定义一个Dog类，如下：

class Dog {
int size;

public Dog(int s) {
size = s;
}

public String toString() {
return size + "";
}
}

然后，我们将一些Dog对象添加入TreeSet，如下所示：

import java.util.Iterator;
import java.util.TreeSet;

public class TestTreeSet {
public static void main(String[] args) {
TreeSet<Dog> dset = new TreeSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));

Iterator<Dog> iterator = dset.iterator();

while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}
}
}

编译成功，但出现运行时错误：

Exception in thread “main” java.lang.ClassCastException: collection.Dog cannot be cast to java.lang.Comparable
at java.util.TreeMap.put(Unknown Source)
at java.util.TreeSet.add(Unknown Source)
at collection.TestTreeSet.main(TestTreeSet.java:22)

这是因为TreeSet是可排序的，Dog对象需要实现java.lang.Comparable接口的compareTo()方法，如下所示：

class Dog implements Comparable<Dog>{
int size;

public Dog(int s) {
size = s;
}

public String toString() {
return size + "";
}

@Override
public int compareTo(Dog o) {
return size - o.size;
}
}

输出的结果如下：

1 2 3

4. HashSet示例

HashSet<Dog> dset = new HashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}

输出结果如下：

5 3 2 1 4

注意输出的顺序是不确定的。

5. LinkedHashSet示例

LinkedHashSet<Dog> dset = new LinkedHashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
System.out.print(iterator.next() + " ");
}

输出的结果是确定的，和插入的顺序一致。

2 1 3 5 4

6. 性能测试

下面的方法用于测试上述三个类中add()方法的性能。

public static void main(String[] args) {

Random r = new Random();

HashSet<Dog> hashSet = new HashSet<Dog>();
TreeSet<Dog> treeSet = new TreeSet<Dog>();
LinkedHashSet<Dog> linkedSet = new LinkedHashSet<Dog>();

// start time
long startTime = System.nanoTime();

for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
hashSet.add(new Dog(x));
}
// end time
long endTime = System.nanoTime();
long duration = endTime - startTime;
System.out.println("HashSet: " + duration);

// start time
startTime = System.nanoTime();

for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
treeSet.add(new Dog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("TreeSet: " + duration);

// start time
startTime = System.nanoTime();

for (int i = 0; i < 1000; i++) {
int x = r.nextInt(1000 - 10) + 10;
linkedSet.add(new Dog(x));
}
// end time
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("LinkedHashSet: " + duration);
}

从下面的输出结果中，我们可以清楚地看出，HashSet的add()方法速度最快。

HashSet: 2244768
TreeSet: 3549314
LinkedHashSet: 2263320

原文地址：HashSet vs. TreeSet vs. LinkedHashSet

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航