BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

浅析Java 8的聚合操作

| 作者 赵永 关注 0 他的粉丝 发布于 2014年6月27日. 估计阅读时间: 11 分钟 | GMTC大前端的下一站,PWA、Web框架、Node等最新最热的大前端话题邀你一起共同探讨。

Oracle在2014年3月19日如期发布了Java 8。Java 8版本被认为是具有里程碑意义的一个版本,Oracle在该版本中添加了许多新特性,包括Lambda表达式、方法引用、加强了安全等等。

在众多的新特性中,聚合操作(Aggregate Operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用Lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。

聚合操作与Java 8中的Lambda表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。

集合类的层次结构

集合类是Java语言提供的辅助类,是一种较为通用的数据结构,如Map、Set、List等。Java中集合类层次关系如下:

图 1

如上图,Collection是主要集合类的接口,其子接口(具化接口)有Deque、Queue、Set、List等。

Map是另一种类型的集合,以Key、Value的键值对存储数据集。

在Java 8中,在java.util.Collection接口中添加了如下方法:

Stream<E> stream() {
    return StreamSupport.stream(spliterator(), false);
}

stream()方法的可见性修饰符为default,这又是Java 8的新特性。在接口中(Collection为interface),本不需要(也不能)进行方法实现,但引入default修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于Default Method的详细解释,读者可以参考Java 8的官方文档。

正是stream方法引出了集合类的聚合操作。

[注意]

Map接口中并没有stream()方法,但是Map的values()和keySet()均返回集合对象,在集合对象上当然是可以使用stream()方法的。

聚合操作实例

为说明聚合操作的使用,首先定义一个数据元素类Person,如下:

import java.time.LocalDate;

public class Person {
		String name;
		LocalDate birthday;
		Sex gender;
		String emailAddress;

		public int getAge() {
			return LocalDate.now().getYear() - birthday.getYear();
		}
		
		public void setBirthday(LocalDate birthday){
			this.birthday = birthday;
		}

		public void setGender(Sex sex){
			this.gender = sex;
		}
		
		public void printPerson() {
			System.out.println("The name is " + name);
		}
		
		public Sex getGender(){
			return gender;
		}

		public enum Sex {
			MALE, FEMALE
		}
	}

在Java 8以前的版本中,对Person集合的遍历往往采用以下方式:

Set<Person> persons = new HashSet<Person>();

//传统遍历方式 for (Person person : persons) { if (person.getAge() > 18) { System.out.println(person.name + " is elder than 18."); } }

同样的功能,在Java 8中使用聚合操作,可以实现如下:

//使用聚合操作
persons.stream().filter(new Predicate<Person>() {
	   @Override
		public boolean test(Person person) {
			if (person.getAge() > 18) {
				return true;
			} else {
				return false;
			}
		}
	}).forEach(new Consumer<Person>() {
		@Override
		public void accept(Person person) {
			System.out.println(person.name + " is elder than 18.");
		}
	});

首先,在集合对象persons上调用stream()方法(聚合操作),取得person对象的数据集(elements),然后调用聚合操作filter()对集合中的元素进行过滤,再调用forEach()完成对符合条件的person的打印。

Predicate和Consumer为Java 8中定义的函数接口(Functional Interface),在java.util.function包下面,函数接口也是Java 8的新特性。在上述代码中,使用了两个匿名类分别对Predicate和Consumer进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。

上述代码中的写法还是比较繁琐的,为进一步简化,可以使用Lambda表达式实现,如下:

// 使用聚合操作及Lambda
	persons.stream()
		.filter(p -> p.getAge() >= 18)
		.forEach(p -> System.out.println(p.name + " is elder than 18."));

因为filter()、forEach()的参数均为函数接口,所以可以替换为Lambda表达式的方式。简单来理解,Lambda表达式就是允许开发者将代码逻辑作为参数进行传递,关于Lambda表达式的详细内容,请参Java 8的官方文档。

聚合操作的使用

聚合操作是Java 8针对集合类,使编程更为便利的方式,可以与Lambda表达式一起使用,达到更加简洁的目的。

前面例子中,对聚合操作的使用可以归结为3个部分:

  1. 数据源部分:通过stream()方法,取得集合对象的数据集。
  2. 通过一系列中间(Intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用filter()方法来对数据集进行过滤。
  3. 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用forEach()完成对过滤后元素的打印。

中间方法除了filter()外,还有distinct()、sorted()、map()等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。

最终方法往往是完成对数据集中数据的处理,如forEach(),还有allMatch()、anyMatch()、findAny()、findFirst(),数值计算类的方法有sum、max、min、average等等。最终方法也可以是对集合的处理,如reduce()、collect()等等。reduce()方法的处理方式一般是每次都产生新的数据集,而collect()方法是在原数据集的基础上进行更新,过程中不产生新的数据集。

从上面的例子中可以看出,通过stream()方法,从集合对象获取的数据集与集合对象的迭代器(Iterator)有些类似,但他们也不完全相同:

  1. 迭代器提供next()、hasNext()等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
  2. stream()方法返回的数据集无next()等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如parallelStream()方法。并行的方式在一些情况下,可以大幅提升处理的效率。

除上述介绍的聚合操作外,Java 8中还提供了其他更为丰富的聚合操作,读者可以参考Java 8的开发参考,了解更多内容。

总结

Java 8提供的聚合操作,以及一起使用的Lambda表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,Java也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。


感谢张龙对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT