python函数式编程

图
函数式编程是一种范式,不同于函数
把计算视为函数而非指令;纯函数式编程:不需要变量,没有副作用,测试简单;
支持高阶函数,代码简洁。

@TOC

函数式编程

简介

函数: function
函数式:functional,一种编程范式

函数式编程特点:
把计算视为函数而非指令;纯函数式编程:不需要变量,没有副作用,测试简单;支持高阶函数,代码简洁

高阶函数

变量可以指向函数
函数名其实就是指向函数的变量
高阶函数:能接收函数作为参数的函数

1
2
3
4
5
>>>def add(x, y, f):
... return f(x)+f(y)
...
>>>add(-5, 9, abs)
14

(这就是一个高阶函数的例子,变量f指向函数abs)

  1. map() 函数python内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个新的 list 并返回。
    注意:map()函数不改变原有的 list,而是返回一个新的 list。

  2. reduce() 函数也是Python内置的一个高阶函数。reduce()函数接收的参数和 map()类似,一个函数 f,一个list,但行为和 map()不同,reduce()传入的函数 f 必须接收两个参数,reduce()对list的每个元素反复调用函数f,并返回最终结果值。

    调用 reduce(f, [1, 3, 5, 7, 9])时,reduce函数将做如下计算:
    先计算头两个元素:f(1, 3),结果为4;
    再把结果和第3个元素计算:f(4, 5),结果为9;
    再把结果和第4个元素计算:f(9, 7),结果为16;
    再把结果和第5个元素计算:f(16, 9),结果为25;
    由于没有更多的元素了,计算结束,返回结果25。

    reduce()还可以接收第3个可选参数,作为计算的初始值。如果把初始值设为100,计算:

  3. filter() 函数是 Python 内置的另一个有用的高阶函数,filter()函数接收一个函数 f 和一个list,这个函数 f 的作用是对每个元素进行判断,返回 True或 False,filter()根据判断结果自动过滤掉不符合条件的元素,返回由符合条件元素组成的新list
    利用filter(),可以完成很多有用的功能,例如,删除 None 或者空字符串:

    1
    2
    3
    4
    def is_not_empty(s):
    return s and len(s.strip()) > 0
    filter(is_not_empty, ['test', None, '', 'str', ' ', 'END'])
    结果:['test', 'str', 'END']

    注意: s.strip(rm) 删除 s 字符串中开头、结尾处的 rm 序列的字符。当rm为空时,默认删除空白符(包括’\n’, ‘\r’, ‘\t’, ‘ ‘)

    1
    2
    3
    a='\t\t123\r\n'
    a.strip()
    结果:'123'
  1. Python内置的 sorted() 函数可对list进行排序:
    但 sorted()也是一个高阶函数,它可以接收一个比较函数来实现自定义排序,比较函数的定义是,传入两个待比较的元素 x, y,如果 x 应该排在 y 的前面,返回 -1,如果 x 应该排在 y 的后面,返回 1。如果 x 和 y 相等,返回 0。
    因此,如果我们要实现倒序排序,只需要编写一个reversed_cmp函数:这样,调用 sorted() 并传入 reversed_cmp 就可以实现倒序排序:
    1
    2
    3
    4
    5
    6
    7
    8
    def reversed_cmp(x, y):
    if x > y:
    return -1
    if x < y:
    return 1
    return 0
    >>>sorted([36, 5, 12, 9, 21], reversed_cmp)
    [36, 21, 12, 9, 5]

python中返回函数

Python的函数不但可以返回int、str、list、dict等数据类型,还可以返回函数!
例如,定义一个函数 f(),我们让它返回一个函数 g,可以这样写:

1
2
3
4
5
6
7
def f():
print 'call f()...'
# 定义函数g:
def g():
print 'call g()...'
# 返回函数g:
return g

调用函数 f,我们会得到 f 返回的一个函数:

1
2
3
4
5
6
>>> x = f()   # 调用f()
call f()...
>>> x # 变量x是f()返回的函数:
<function g at 0x1037bf320>
>>> x() # x指向函数,因此可以调用
call g()... # 调用x()就是执行g()函数定义的代码

python中闭包

在函数内部定义的函数和外部定义的函数是一样的,只是他们无法被外部访问:

1
2
3
4
5
6
def g():
print 'g()...'

def f():
print 'f()...'
return g

将 g 的定义移入函数 f 内部,防止其他代码调用 g:

1
2
3
4
5
def f():
print 'f()...'
def g():
print 'g()...'
return g

但是,考察上一小节定义的 calc_sum 函数:

1
2
3
4
def calc_sum(lst):
def lazy_sum():
return sum(lst)
return lazy_sum

注意: 发现没法把 lazy_sum 移到 calc_sum 的外部,因为它引用了 calc_sum 的参数 lst

像这种内层函数引用了外层函数的变量(参数也算变量),然后返回内层函数的情况,称为闭包(Closure)

闭包的特点是返回的函数还引用了外层函数的局部变量,所以,要正确使用闭包,就要确保引用的局部变量在函数返回后不能变。举例如下:

1
2
3
4
5
6
7
8
9
#希望一次返回3个函数,分别计算1x1,2x2,3x3:
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()

你可能认为调用f1(),f2()和f3()结果应该是1,4,9,但实际结果全部都是 9。
原因就是当count()函数返回了3个函数时,这3个函数所引用的变量 i 的值已经变成了3。由于f1、f2、f3并没有被调用,所以,此时他们并未计算 ii,当 f1 被调用时:即为3 3。 应修改为:

1
2
3
4
5
6
7
8
9
10
11
12
13
def count():
fs = []
for i in range(1, 4):
def f(j): #它可以正确地返回一个闭包g,g所引用的变量j不是循环变量,因此将正常执行。避免引用循环变量i
def g():
return j*j
return g
r = f(i)
fs.append(r)
return fs

f1, f2, f3 = count()
print f1(), f2(), f3()

python中匿名函数

高阶函数可以接收函数做参数,有些时候,我们不需要显式地定义函数,直接传入匿名函数更方便。
在Python中,对匿名函数提供了有限支持。还是以map()函数为例,计算 f(x)=x2 时,除了定义一个f(x)的函数外,还可以直接传入匿名函数:

1
2
>>> map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9])
[1, 4, 9, 16, 25, 36, 49, 64, 81]

通过对比可以看出,匿名函数 lambda x: x * x 实际上就是:

1
2
def f(x):
return x * x

关键字lambda 表示匿名函数,冒号前面的 x 表示函数参数
匿名函数有个限制,就是只能有一个表达式,不写return,返回值就是该表达式的结果。
使用匿名函数,可以不必定义函数名,直接创建一个函数对象,很多时候可以简化代码:

1
2
3
>>> sorted([1, 3, 9, 5, 0], lambda x,y: -cmp(x,y))
[9, 5, 3, 1, 0]
`

1
2
3
4
5
def is_not_empty(s):
return s and len(s.strip()) > 0
filter(is_not_empty, ['test', None, '', 'str', ' ', 'END'])

print filter(lambda s: s and len(s.strip())>0, ['test', None, '', 'str', ' ', 'END'])

python中decorator装饰器-无参数

装饰器讲解

Python的 decorator 本质上就是一个高阶函数,它接收一个函数作为参数,然后,返回一个新函数。
使用 decorator 用Python提供的 @ 语法,这样可以避免手动编写 f = decorate(f) 这样的代码。

1
2
3
4
5
6
考察一个@log的定义:可以用在任何参数只有一个的函数上,效果就是打印出“call 该函数名”
def log(f):
def fn(x):
print 'call ' + f.__name__ + '()...'
return f(x)
return fn

但是,对于参数不是一个的函数,调用将报错:
因为 add() 函数需要传入两个参数,但是 @log 写死了只含一个参数的返回函数。
要让 @log 自适应任何参数定义的函数,可以利用Python的 *args**kw,保证任意个数的参数总是能正常调用:

1
2
3
4
5
def log(f):
def fn(*args, **kw):
print 'call ' + f.__name__ + '()...'
return f(*args, **kw)
return fn

现在,对于任意函数,@log 都能正常工作。

例题:请编写一个@performance,它可以打印出函数调用的时间。
计算函数调用的时间可以记录调用前后的当前时间戳,然后计算两个时间戳的差。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import time
def performance(f):
def fn(*args, **kw):
t1 = time.time()
r = f(*args, **kw) # f即为要被执行的函数, 也是要被装饰的函数
t2 = time.time()
print 'call %s() in %fs' % (f.__name__, (t2 - t1))
return r
return fn

@performance
def factorial(n):
return reduce(lambda x,y: x*y, range(1, n+1))
print factorial(10)

python中decorator装饰器-带参数

考察上一节的 @log 装饰器:发现对于被装饰的函数,log打印的语句是不能变的(除了函数名)。
如果有的函数非常重要,希望打印出’[INFO] call xxx()…’,有的函数不太重要,希望打印出’[DEBUG] call xxx()…’,这时,log函数本身就需要传入’INFO’或’DEBUG’这样的参数,类似这样:

1
2
3
4
5
@log('DEBUG')
def my_func():
pass
#把上面的定义翻译成高阶函数的调用,就是:
my_func = log('DEBUG')(my_func)

所以,带参数的log函数首先返回一个decorator函数,再让这个decorator函数接收my_func并返回新函数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
def log(prefix):
def log_decorator(f):
def wrapper(*args, **kw):
print '[%s] %s()...' % (prefix, f.__name__)
return f(*args, **kw)
return wrapper
return log_decorator

@log('DEBUG')
def test():
pass
print test()
#执行结果
[DEBUG] test()...
None

任务:上一节的@performance只能打印秒,请给 @performace 增加一个参数,允许传入’s’或’ms’:
@performance(‘ms’)
def factorial(n):
return reduce(lambda x,y: x*y, range(1, n+1))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import time

def performance(unit):
def perf_decorator(f):
def wrapper(*args, **kw):
t1 = time.time()
r = f(*args, **kw)
t2 = time.time()
t = (t2 - t1) * 1000 if unit=='ms' else (t2-t1)
print 'call %s() in %f %s' % (f.__name__, t, unit)
return r
return wrapper
return perf_decorator

@performance('ms')
def factorial(n):
return reduce(lambda x,y: x*y, range(1, n+1))

print factorial(10)

python中完善decorator

完善decorator
@decorator可以动态实现函数功能的增加,但是,经过 @decorator “改造”后的函数,和原函数相比,除了功能多一点外,有没有其它不同的地方?
可见,由于decorator返回的新函数函数名已经不是‘f2’,而是@log内部定义的‘wrapper’。这对于那些依赖函数名的代码就会失效。 decorator 还改变了函数的doc等其它属性。如果要让调用者看不出一个函数经过了@decorator的“改造”,就需要把原函数的一些属性复制到新函数中:

1
2
3
4
5
6
7
def log(f):
def wrapper(*args, **kw):
print 'call...'
return f(*args, **kw)
wrapper.__name__ = f.__name__
wrapper.__doc__ = f.__doc__
return wrapper

这样写decorator很不方便,因为我们也很难把原函数的所有必要属性都一个一个复制到新函数上,所以Python内置的functools可以用来自动化完成这个“复制”的任务:

1
2
3
4
5
6
7
import functools
def log(f):
@functools.wraps(f)
def wrapper(*args, **kw):
print 'call...'
return f(*args, **kw)
return wrapper

注意@functools.wraps应该作用在返回的新函数上

python中偏函数

当一个函数有很多参数时,调用者就需要提供多个参数。如果减少参数个数,就可以简化调用者的负担。
int()函数还提供额外的base参数,默认值为10。如果传入base参数,就可以做 N 进制的转换:
假设要转换大量的二进制字符串,每次都传入int(x, base=2)非常麻烦,于是,我们想到,可以定义一个 int2() 的函数,默认把 base=2 传进去:

1
2
def int2(x, base=2):
return int(x, base)

functools.partial就是帮助我们创建一个偏函数的,不需要我们自己定义int2(),可以直接使用下面的代码创建一个新的函数int2:

1
2
3
4
>>> import functools
>>> int2 = functools.partial(int, base=2)
>>> int2('1000000')
64

所以,functools.partial可以把一个参数多的函数变成一个参数少的新函数,少的参数需要在创建时指定默认值,这样,新函数调用的难度就降低了。

坚持原创分享,您的支持将鼓励我继续创作!