BT

你的观点很重要! 快来参与InfoQ调研吧!

Scala中的函数式特性

| 作者 王宏江 关注 1 他的粉丝 发布于 2016年6月15日. 估计阅读时间: 12 分钟 | ArchSummit社交架构图谱:Facebook、Snapchat、Tumblr等背后的核心技术

Scala作为最有意思的编程语言之一,其中一等公民函数具有哪些特性呢?本文整理自ArchSummit微课堂:Scala布道师、挖财资深架构师王宏江老师的分享内容。ArchSummit交流体验群定期邀请业内大牛线上直播分享技术干货,加群方式见文章底部。

有一篇以调侃的口气评述各种编程语言史的文章里面说到:“2003年,一个叫Martin Odersky的醉汉看见了好时瑞森花生酱杯的广告,展示了某个人的花生酱倒入另一个人的巧克力的场景,他忽然有了个点子,创造了Scala,一种结合了面向对象和函数式编程的语言。这同时激怒了两个阵营的忠实信徒,他们立刻宣布要发动圣战烧死异教徒。”

这句调侃很有意思,它折射出这两种编程风格互相格格不入,所以尝试把这两种风格结合起来也是一种开创,当然注定了一开始就会存在争议。但争议归争议,我们作为工程人员最主要的还是看重它解决问题的能力,而当前来看Scala无疑已经算是比较成功的编程语言了。

这次跟大家交流一下Scala里的一些函数式特性,关于函数式特性这个话题比较大,这次时间很有限,我不知道能聊到多少内容,尽量抛出一些能引发大家思考的东西。编程语言分很多种范式,其中大家熟悉的有命令式(也称指令式)与函数式这两种范式。而这两种编程范式追溯起来是由这两位先贤确定的:

上图中,左边跑步的年轻小伙是图灵,右边年老一点的是阿隆佐邱奇。八卦一下,图灵也是个长跑健将,在学院期间经常早起先跑个半程马拉松;阿隆佐邱奇也是图灵在普林斯顿的老师,所以上世纪的普林斯顿的先贤们奠定了整个计算机领域的发展。

图灵机,以及冯诺依曼对它的实现(冯诺依曼体系),从风格上被归为“命令式”,它的运算过程可以看作不断地修改内存来反映运算的结果,即用命令修改状态;而阿隆佐邱奇提出的 Lambda 演算,则是通过连续的运算(基于函数)得到最终结果。

基于Lambda演算的被归为函数式,在众多的函数式编程语言里,Scala的血缘继承自ML 和Haskell 最多。关于ML有本非常好的书《ML for the Working Programmer》,这本书里面提到:“函数式程序是跟值打交道的,而不是跟状态打交道的。它们的工具是表达式,而不是命令。”

那么,我们先要了解一下这里说的“表达式”以及Scala里的表达式与Java有什么不同。在Scala里,所有的表达式都有值(继承自 ML)。举个例子,a = 1 是一段赋值表达式,但这个表达式有其自身的结果,它是一个Unit类型的结果,还有if else,try catch 甚至 throw Exception 等表达式,它们也都有结果。其中赋值语句的返回值问题跟 Java 里有很大的差异,我们来比较一下,Java里:

int a,b,c;
a = b = c = 1;

这样是没有问题的。

而Scala里则会出错,类型不匹配,因为c = 0这个表达式的结果是 Unit 类型,再把它赋值给 b 的时候类型不对。

特别典型的,我们在Java里逐行读取一段文本

while( (line = readLine() ) != null ) {
…
}

这里期望是每次读取一行内容赋值给line变量,并判断line不为null,在Java里没有问题,但Scala里 line = readLine() 这个赋值表达式的结果是一个 Unit 类型的值,导致永远不为null。而对于 {…} 这种代码块,也是一个表达式,它由若干表达式组合,最后一个表达式的值是它的值。先一定弄清楚这个差异,接下来我们谈函数的内容:

狭义地区分(从可传递性上)方法(method):

指的是在trait/class/object中以def关键字声明的,它不能被直接传递。函数(function)类型为ParamsType=>ResultType的变量,这些变量背后是用FuncfonN对象来封装的;可以被传递。方法可以转换为函数。

广义上,抛开背后的实现,方法就是函数,编译器某些场景自动把方法封装为一个函数对象来传递。Scala社区并不特别区分这两个名词,注意语境,有时候函数就是指方法,有时候则是指函数对象。

函数作为一等公民体现在哪儿? 这里简单介绍一些特性:

1) 可传递/赋值

2) 嵌套函数和匿名函数

3) 高阶

4) 偏应用(partial application)

5) 闭包

可传递性即函数可以像值一样被传来传去。

或者显式的定义一个函数值:

嵌套函数则是可以在函数内部再声明函数:

嵌套函数应用场景并不多,其中一个场景是将递归函数的转为尾递归方式。

匿名函数或 lambda 表达式也称函数字面量 (function literal):

高阶函数则是接受另一个函数做参数,或者返回的而结果是一个函数:

在lambda演算中,每个表达式都代表一个只有单独参数的函数,这个函数的参数本身也是一个只有单一参数的函数,同时函数的值是又一个只有单一参数的函数。

那么问题来了:多个参数的函数怎么办?

上面就是一个例子,把两个参数的函数通过柯里化转换为接受一个参数。它有点像一个函数链,把一个带有多个参数的函数转换为多个只有一个参数的函数来执行。

柯理化的实际用途?

1) 控制抽象,可改变代码的书写风格:

2)实现部分应用函数。部分应用函数 (partial application function) 把一个函数适配为另一个函数,举例来看:

然后看一下闭包,先回顾一下Java里的匿名内部类:

疑问:innerVar 还是分配在栈空间上么?

那么闭包简单来说就是一段行为,以及它的上下文。

这个方法返回了一个闭包(一段lambda实例),这个闭包里引用到了局部的变量localVal。闭包有很多问题都是引用环境的绑定(The Binding of Referencing Environments) 所产生的。

一个JavaScript 的例子

解决方式:多一层抽象

其实上面的解决方式里又涉及另一个话题:参数的传递方式,这里不讲了。当然闭包的绑定问题,还有高阶的话题,比如在递归情况下引用环境约束又是怎样的。

这个留给大家再进一步挖掘了。

最后简单说一点类型系统里的lambda,在Scala里generic types as first-class types,在类型系统上跟Java比有非常大的差异,它支持高阶特性。

我们从多态的层面来看,除了继承/子类型方式,还有泛型/参数化类型也可以实现多态。在 Java 里的泛型是在Java5才支持的(作者也是Scala的作者Martin),所以它有一些历史包袱:比如 List<T> 这个类型,T是类型参数,在Java里只能支持普通的类型参数,在Scala里写法不同:

那现在,如果对T这个参数再进一步抽象,它如果也是一个type constructor 会如何呢?

Java : class List2<C<T>> {} //不支持

Scala: class List2[C[T]]

不要小看这点差异,这是类型系统层面巨大的不同。它把类型的抽象层次一下提升了一个级别,对类型简单地归纳:

类型是对数据的抽象

那对类型再抽象呢?又叫什么?

Kind: 类别,对类型的抽象

所有的proper type被抽象为同一种 kind,用 * 表示:

以函数的视角:

Scala的类型系统是图灵完备的,即利用类型系统本身就可以解决一些问题。

时间比较紧,先分享这些东西。可能不太好消耗,希望这个分享对大家有所启发,对Scala的抽象有更深的理解。

问题1:请问初始学习Scala,看那些书比较好.?

先推荐这本《Scala程序设计:Java虚拟机多核编程实战 》,面向初学者。然后 Martin自己写的《Programming in Scala》内容非常充实,是最好的一本教材需要细读,现在可能有第三版了,中文版只有第一版。

还有《快学Scala》也值得一看。

最后《Scala函数式编程》这本书面向高阶特性,介绍了包括fuctor, monad 等函数式概念

问题2:C 语言工程师要想 转做 Scala 继续学习补充哪些知识呢?

对于 C 的人,转Scala的话,可能先把 Java 的特性弄熟更有利,Scala基于JVM平台,能先用起来解决实际问题,自然就能不断进步了。

问题3:Scala究竟是简单还是困难呢?和C++相比的有缺点在哪了?

如果你把Scala 当作 Java来用,并不复杂,不需要消化它的高阶特性,可以很快上手。有很多人将Scala和 C++相比,我没有C++方面的背景,很难回答。

Scala的复杂度主要是类型系统层面的,可以说是 Haskell 的影响,主要在思维方式的差异性上,对程序员有较大冲击。

问题4:Scala在程序排行榜中所占比例不太好的原因是什么呢?

很多理论都是从学院界逐渐转入工业界的,大众程序员对函数式的理解现在也不够普及,这需要一个过程。

问题5:请问在推广使用Scala方面有什么好的建议?

先解决实际问题,业务用起来了自然就推动了。

问题6:Scala的闭包和Node.js的闭包差异在什么地方呢?

在上下文绑定问题上没有差异。至于各种语言/平台,闭包在底层用什么方式来承载,我不好说。在Scala里闭包就是一个FunctionN 的类型,背后还是用对象来承载的。

问题7:命令式编程和函数式编程之间各有什么利弊?

看场景,命令式程序比较直接,容易理解。

函数式在并发场景更有用武之地。

ArchSummit交流体验群

大会很期待?线上解解馋——ArchSummit给求知若渴的你,微信搜索公众号:ArchSummit ,关注ArchSummit微信公众平台获取更多技术干货,及时了解大会进展,并可以提前参与大会讲师的线上分享和交流活动。

Cloudera、Hearsay Social、Uber、LinkedIn、Twitter……你将为哪家公司技术点赞?阿里巴巴、腾讯、百度、美团、饿了么、滴滴、新浪微博……核心业务技术较量谁又能触动你的神经...最精彩的技术切磋从这开始,ArchSummit全球架构师峰会2016深圳站, 9折售票最后一周,详情点击这里。购票热线:010-89880682 。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT