您的位置:首页 > 编程语言 > Java开发

Java集合框架总结(2)——Set接口的使用

2013-06-06 04:14 429 查看

1、Set接口的使用

Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档(可见身边随时带上API文档有多重要),基本与Collection方法相同。只是行为不同(Set不允许包含重复元素)。

Set集合不允许重复元素,是因为Set判断两个对象相同不是使用==运算符,而是根据equals方法。即两个对象用equals方法比较返回true,Set就不能接受两个对象。

01
public
class
TestSet
02
{
03
public
static
void
main(String[] args)
04
{
05
Set<String> books =
new
HashSet<String>();
06
 
07
//添加一个字符串对象
08
books.add(
new
String(
"Struts2权威指南"
));
09
 
10
//再次添加一个字符串对象,
11
//因为两个字符串对象通过equals方法比较相等,所以添加失败,返回false
12
boolean
result = books.add(
new
String(
"Struts2权威指南"
));
13
 
14
System.out.println(result);
15
 
16
//下面输出看到集合只有一个元素
17
System.out.println(books);
18
}
19
}

程序运行结果:


false
[Struts2权威指南]


说明:程序中,book集合两次添加的字符串对象明显不是一个对象(程序通过new关键字来创建字符串对象),当使用==运算符判断返回false,使用equals方法比较返回true,所以不能添加到Set集合中,最后只能输出一个元素。

Set接口中的知识,同时也适用于HashSet、TreeSet和EnumSet三个实现类。

2、HashSet类

HashSet按Hash算法来存储集合的元素,因此具有很好的存取和查找性能。


HashSet的特点:

(1)HashSet不是同步的,多个线程访问是需要通过代码保证同步

(2)集合元素值可以使null。


HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个对象的hashCode()方法返回值也相等。

01
//类A的equals方法总是返回true,但没有重写其hashCode()方法
02
class
A
03
{
04
public
boolean
equals(Object obj)
05
{
06
return
true
;
07
}
08
}
09
//类B的hashCode()方法总是返回1,但没有重写其equals()方法
10
class
B
11
{
12
public
int
hashCode()
13
{
14
return
1
;
15
}
16
}
17
//类C的hashCode()方法总是返回2,并重写其equals()方法
18
class
C
19
{
20
public
int
hashCode()
21
{
22
return
2
;
23
}
24
public
boolean
equals(Object obj)
25
{
26
return
true
;
27
}
28
}
29
public
class
TestHashSet
30
{
31
public
static
void
main(String[] args)
32
{
33
HashSet<Object> books =
new
HashSet<Object>();
34
//分别向books集合中添加2个A对象,2个B对象,2个C对象
35
books.add(
new
A());
36
books.add(
new
A());
37
books.add(
new
B());
38
books.add(
new
B());
39
books.add(
new
C());
40
books.add(
new
C());
41
System.out.println(books);
42
}
43
}


程序运行结果:

[B@1 , B@1 , C@2 , A@b5dac4 , A@9945ce]


说明:

(1)Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数)值,所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。

(2)即使2个A对象通过equals比较返回true,但HashSet依然把它们当成2个对象;即使2个B对象的hashCode()返回相同值,但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时,如果重写该对象equals()方法,也应该重写其hashCode()方法。其规则是:如果2个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相同。


hash算法的功能:

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。

当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。

当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。


继续深入研究HashSet:

当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。

看下面程序:

01
class
R
02
{
03
int
count;
04
public
R(
int
count)
05
{
06
this
.count = count;
07
}
08
public
String toString()
09
{
10
return
"R(count属性:"
+ count +
")"
;
11
}
12
public
boolean
equals(Object obj)
13
{
14
if
(obj
instanceof
R)
15
{
16
R r = (R)obj;
17
if
(r.count ==
this
.count)
18
{
19
return
true
;
20
}
21
}
22
return
false
;
23
}
24
public
int
hashCode()
25
{
26
return
this
.count;
27
}
28
}
29
public
class
TestHashSet2
30
{
31
public
static
void
main(String[] args)
32
{
33
HashSet<R> hs =
new
HashSet<R>();
34
hs.add(
new
R(
5
));
35
hs.add(
new
R(-
3
));
36
hs.add(
new
R(
9
));
37
hs.add(
new
R(-
2
));
38
//打印HashSet集合,集合元素是有序排列的
39
System.out.println(hs);
40
//取出第一个元素
41
Iterator<R> it = hs.iterator();
42
R first = (R)it.next(); 
//first指向集合的第一个元素
43
//为第一个元素的count属性赋值
44
first.count = -
3
;   
//first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。
45
//再次输出count将看到HashSet里的元素处于无序状态
46
System.out.println(hs);
47
hs.remove(
new
R(-
3
));
48
System.out.println(hs);
49
//输出false
50
System.out.println(
"hs是否包含count为-3的R对象?"
+ hs.contains(
new
R(-
3
)));
51
//输出false
52
System.out.println(
"hs是否包含count为5的R对象?"
+ hs.contains(
new
R(
5
)));
53
54
}
55
}


程序运行结果:

[R(count属性:5),R(count属性:9),R(count属性:-3),R(count属性:-2)]
[R(count属性:-3),R(count属性:9),R(count属性:-3),R(count属性:-2)]
[R(count属性:-3),R(count属性:9),R(count属性:-2)]
hs是否包含count为-3的R对象?false
hs是否包含count为5的R对象?false


说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。

3、TreeSet类

TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。

TreeSet提供的几个额外方法:

TreeSet提供的几个额外方法:


Comparator comparator(): 返回当前Set使用的Comparator,或者返回null,表示以自然方式排序。

Object first():返回集合中的第一个元素。

Object last():返回集合中的最后一个元素。

Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。

Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。

SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。

SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。

SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。

view source

print?

01
public
class
TestTreeSetCommon
02
{
03
public
static
void
main(String[] args)
04
{
05
TreeSet<Integer> nums =
new
TreeSet<Integer>();
06
//向TreeSet中添加四个Integer对象
07
nums.add(
5
);
08
nums.add(
2
);
09
nums.add(
10
);
10
nums.add(-
9
);
11
//输出集合元素,看到集合元素已经处于排序状态
12
System.out.println(nums);
13
//输出集合里的第一个元素
14
System.out.println(nums.first());
15
//输出集合里的最后一个元素
16
System.out.println(nums.last());
17
//返回小于4的子集,不包含4
18
System.out.println(nums.headSet(
4
));
19
//返回大于5的子集,如果Set中包含5,子集中还包含5
20
System.out.println(nums.tailSet(
5
));
21
//返回大于等于-3,小于4的子集。
22
System.out.println(nums.subSet(-
3
,
4
));
23
}
24
}
程序运行结果:

[-9,2,5,10]
-9
10
[-9,2]
[5,10]
[2]

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: