程序设计的邀请

程序设计是计算机科学的基础. 这句话或许有人同意或许有人反对, 但是并不会影响到程序设计教育的糟糕现实. 不论如何, 程序设计的重要性都被严重低估了, 尤其是当其被人拿来与算法和数据结构进行比较的时候. 程序设计教育的核心应该是让人理解到可复合性, 或者说抽象和组合, 在这个世界中的地位, 而不是教授具体编程语言的句法.

请允许我在这里重复SICP (一本光辉而伟大的计算机科学教科书) 里的文字和想法. 编程语言不仅是指挥计算机器执行命令的手段, 还是组织关于过程的想法的框架. 任何编程语言都必须提供原语, 组合的手段, 和抽象的手段. 原语就是最基本的表达形式, 组合是由较为简单的东西构造更加复杂的东西, 而抽象将不论复杂还是简单的东西当作一个整体看待和操纵, 忽略其细节. 任何复杂的系统, 不论看起来有多么不可思议, 也都是由组合和抽象的基本原则构筑起来的. 换句话说, 就是没有真正的魔法.

第1章编程基础

第1.1节读取求值输出循环

读取求值输出循环是一种模式, 其中用户输入一个表达式, 按下回车, 系统就会对于该表达式求值, 并将结果输出于下方, 接着等待用户的下一次输入, 因而是一个循环. 学习程序设计的最好方法或许就是观察读取求值输出循环的交互结果, 并思考缘由.

第1.2节字面量

数字, 布尔值, 字符串等都是字面量. Scheme用#t表示真, 用#f表示假.

第1.3节变量

变量在字面上是符号, 然而它不代表字面, 而是引用一个值, 值也被称为对象.

我们可以使用define形式将符号和值关联起来, 之后就可以用符号来引用这个值.

第1.4节过程应用

过程是函数的近义词, 过程应用即函数应用, 即应用函数于具体的参数上. 一般说来我们并不区分过程和函数这两种术语, 但是现在我们希望讨论一下它们之间微妙的区别.

现代数学意义上的函数是函数的外延, 因为它只是输入和输出的对应, 但并不直接诉诸于算术, 几何与算法. 过程, 在某种意义上来说, 是函数的古老概念, 它蕴涵着如何从输入通过计算得到输出的规则. 也就是说, 过程是内涵性的实体.

现在让我们回到正题. 数学中函数应用的句法是多种多样的, 例如中缀式

3 + 4

, 前缀式

f (x, y, z)

, 抑或是采用角标记号, 例如用于引用集族

{(A_{λ})}_{λ \in I}

里的一个集合

A_{μ}

. 实际上, 为了各种各样的目的, 数学家经常创制出许多ad hoc的记号, Halmos就喜欢这么做. 但是, Scheme中过程应用的句法是异常简单的, 或可以被称为全加括号的前缀记号.

第1.5节 lambda表达式

显然我们需要一种方式来表达过程, 在Scheme语言中, 那就是lambda表达式. 这个名字来源于

λ

演算, 一种由Alonzo Church设计的内涵性函数理论.

在以上交互中, (lambda (x) (* x x))表示一个函数, 其中(x)是参数的列表, (* x x)过程的体. 在某种意义上, 它就类似于数学记号

x \mapsto x \cdot x

. 或者, 对于大多数人更熟悉的表达是"令函数

f (x) = x \cdot x

", 但是读者应该注意到我们没有必要为每个函数取一个名字.

另外, 有时(x)中的x也被称为形式参数, 这是因为它本身不具备意义, 仅仅是一个占位的符号而已. 如果将其一致地替换为其他符号, 也不会改变函数本身的意义, 例如(lambda (y) (* y y))也表达了和(lambda (x) (* x x))一样的含义.

这似乎看上去有些复杂, 然而读者只要明白(lambda (f g) (lambda (x) (f (g x))))表达了函数复合之意, 那就不难理解.

第1.6节定义

第1.7节条件分支

条件分支表达了某种选择. 在Scheme中, 我们有两种这样的构造: if和cond, 其中cond可以被视为if的句法糖. 首先让我们来看if, 这是更简单的构造.

以上的绝对值函数abs在某种意义上可能是自明的, 但我们仍然最好对其作出一些解释. 这里的if表达式会先对于(< x 0)求值, 然后根据其结果来确定对于(- x)求值还是对于x求值, 并将这个结果作为整个if表达式的值. 机敏的读者应该注意到, if并非函数, 因为它不会对于它的每个参数都进行求值, 因而若当我们试图按照

练习. 举一个例子说明为什么在行为上if^并不等价于if? (读者不必立即回答此问题, 之后的练习也是类似.)

第1.8节 and, or, not

与或非是三种常见的逻辑联结词. 在Scheme中, 和绝大多数编程语言一样, and和or具有短路性质. 也正因如此, and和or显然不是函数, 鉴于它并不遵循通常函数应用的求值规则. 请看以下交互.

第1.9节递归定义

所谓递归定义, 指的是在定义中(直接或间接地)引用自身的定义. 尽管这听上去有些奇怪, 但是在阅读了以下的几个例子之后, 读者应该意识到递归是一种相当自然的表达方式.

请读者观察第一个例子, 即Fibonacci数列, 它在数学上是由递归定义的.

递归的要义在于: 对于某些简单的基本情形, 我们可以直接给出结果; 对于复杂的情形, 我们可以将其转化为更简单的情形的结果的组合. 之后我们将看到, 递归不仅可以在自然数上进行, 还可以在列表和树等结构上进行. 实际上, 最一般地, 递归可以定义于良基集合上. 良基的条件将允许我们用归纳法来证明关于程序的性质.

第1.10节局部定义

当然, sqrt的正确性是一个(数学)分析的问题, 但我们的重点不在于此.

第1.11节高阶过程

高阶过程指的是以过程作为参数或者返回值的过程. 或许有人会问为什么需要高阶过程, 那是因为若是没有高阶过程, 许多概念就无法表达. 实际上, 我们已经在第1.5节见过一个高阶过程的例子了, 即函数复合, 现在我们为其取一个名字compose.

实际上数学中高阶函数的例子是很多的, 就是往往它们被称为算子, 泛函之类的, 但就是不叫函数. 例如, 求和记号

\sum

在某种意义上就是一个高阶过程.

练习. 请仿照Sigma的定义编写用以求积的Pi.

函数的幂次也是一种相当经典的高阶函数, 其可以基于函数复合递归地定义:

f^{n} = {\begin{matrix} id & , n = 0 \\ f \circ f^{n - 1} & , 否则的话 \end{matrix}

其中

id

代表恒等函数, 其对于函数复合而言相当于单位元. 这个定义显然也可以直接地翻译为一个Scheme过程.

练习. Church编码是Alonzo Church发明的一种利用

λ

演算的编码方式. 例如, 在Church编码中, 自然数

0

被编码为

(define zero
  (lambda (f) (lambda (x) x)))

而自然数

1

则被编码为

(define one
  (lambda (f) (lambda (x) (f x))))

似乎规律还没有那么明显, 不过自然数

2

的编码是

(define two
  (lambda (f) (lambda (x) (f (f x)))))

这下读者应该看得比较清楚了. 也就是说, Church编码下的自然数

n

是一个高阶函数, 其以某个函数为输入, 产生了一个新的函数, 其是该函数的

n

次幂.
以此概念为基础, 我们可以编写一些常见的自然数上的函数, 例如

(define (succ n)
  (lambda (f)
    (lambda (x)
      (f ((n f) x)))))

succ正如其名, 可以计算一个Church编码下的自然数的后继.

(define (plus m n)
  ((m succ) n))

而plus看上去更简单, 因为它利用了succ. 这里我们没有按照

λ

演算本来的样子书写, 因为那里的函数都是单参数的. 不过多参数的函数可以藉由Currying转化为多个单参数函数的嵌套, 它们并无本质上的区别. 利用Currying, 以上的plus可以写成

(define plus-curried
  (lambda (m)
    (lambda (n)
      ((m succ) n))))

第1.12节计算行为

过程gcd和fact呈现的计算行为有何不同? 实际上, 这只需略微动笔计算即可得知.

实际上, 存在一种编程的技巧被称为延续传递风格 (Continuation-Passing Style), 其可以用尾递归的形式表达任意的递归过程. 然而, 实际的空间消耗并不可能减少, 因为它把记忆转移到了所谓的延续参数上. 延续是这样一种函数, 其接受值作为参数, 然后完成"剩余的计算". 对于延续进行"具体化", 也就是说用某种非常具体的数据来表示延续将导致所谓的"累积器传递风格". 似乎以上的讨论非常抽象, 然而现在我们举一个简单的例子来说明这些想法.

第1.13节复杂度

第2章列表处理

Scheme是Lisp的方言, Lisp旧称LISP, 而LISP代表LISt Processor, 列表处理器之意.

第2.1节序对和列表

序对是数据的黏合剂, 一个序对恰将两个对象组合成一个对象. 在Scheme中, cons用来构造序对, car是第一投影, cdr是第二投影.

cons, car, cdr并非魔法. 实际上, 仅使用第1章读者所学到的东西, 也可以实现它们.

所谓列表, 是一种使用序对串联起来的结构, 以一个特殊的对象空表作结.

第2.2节列表上的函数

第2.3节列表处理工具箱

列表可以用来表示有限的序列. 围绕列表, 我们可以设计一组过程, 它们可以对于列表进行各种各样的操作. 这些列表处理的过程可以灵活地组合在一起, 以表达各种各样的概念.

或许各种列表处理过程之中最为典型的就是map, 它对于列表的每个元素施行某种变换, 而结果仍然是一个列表.

我们应该注意到, 这里的fold-left是尾递归的, 但是fold-right不是尾递归的. 不过, 实际上的确可以将fold-right定义成尾递归的, 这留给读者思考.

练习. 定义尾递归的fold-right.

我们可以使用fold-left和fold-right来表达之前定义的几个列表处理过程.

第2.4节列表处理: 更进一步

上一节我们已经讨论了列表处理的最基本的一些模式, 现在我们想要处理一些更加复杂的问题.

许多时候, 虽然我们希望使用map来对于列表的每个元素施行某种变换, 但是这种变换返回的并不是一个结果, 而是一列结果. 从某种角度来说, 此时列表处理作为有限序列带来的可复合性被稍稍破坏了. 然而, 我们很容易修复这个问题, 通过一个与map类似的过程append-map, 有时也被称为flatmap.

和map不同的是, append-map使用append将变换的结果连接在一起, 起到了展平的效果, 因而flatmap的确也是一个合适的名字, 这被其他许多编程语言所采用.

为了刻画append-map的用途, 接下来我们举一个稍微复杂一点的例子, 即所谓的

n

皇后. 这个问题要求我们枚举出在一个

n \times n

的棋盘上放置

n

枚皇后棋子并使得这些棋子相互之间无法攻击的所有可能方案.

在编写程序之前, 我们最好先观察一下问题的结构, 有时简单的观察可以极大地简化程序或者提高效率. 当然, 读者也可以观察良久, 不过那更多是数学家的习惯. 首先, 我们注意到既然皇后可以自由地横行或直行, 那么对于可能的方案而言, 每一列和每一行必恰有一个皇后. 显然, 读者看出来我们可以将方案表示为一个置换.

程序设计的邀请

序言

第1章编程基础

第1.1节读取求值输出循环

第1.2节字面量

第1.3节变量

第1.4节过程应用

第1.5节 `lambda`表达式

第1.6节定义

第1.7节条件分支

第1.8节 `and`, `or`, `not`

第1.9节递归定义

第1.10节局部定义

第1.11节高阶过程

第1.12节计算行为

第1.13节复杂度

第2章列表处理

第2.1节序对和列表

第2.2节列表上的函数

第2.3节列表处理工具箱

第2.4节列表处理: 更进一步

程序设计的邀请

序言

第1章 编程基础

第1.1节 读取求值输出循环

第1.2节 字面量

第1.3节 变量

第1.4节 过程应用

第1.5节 lambda表达式

第1.6节 定义

第1.7节 条件分支

第1.8节 and, or, not

第1.9节 递归定义

第1.10节 局部定义

第1.11节 高阶过程

第1.12节 计算行为

第1.13节 复杂度

第2章 列表处理

第2.1节 序对和列表

第2.2节 列表上的函数

第2.3节 列表处理工具箱

第2.4节 列表处理: 更进一步

第1章编程基础

第1.1节读取求值输出循环

第1.2节字面量

第1.3节变量

第1.4节过程应用

第1.5节 `lambda`表达式

第1.6节定义

第1.7节条件分支

第1.8节 `and`, `or`, `not`

第1.9节递归定义

第1.10节局部定义

第1.11节高阶过程

第1.12节计算行为

第1.13节复杂度

第2章列表处理

第2.1节序对和列表

第2.2节列表上的函数

第2.3节列表处理工具箱

第2.4节列表处理: 更进一步