BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Python编程中的反模式

| 作者 曹知渊 关注 1 他的粉丝 发布于 2014年7月15日. 估计阅读时间: 6 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

Python是时下最热门的编程语言之一了。简洁而富有表达力的语法,两三行代码往往就能解决十来行C代码才能解决的问题;丰富的标准库和第三方库,大大节约了开发时间,使它成为那些对性能没有严苛要求的开发任务的首选;强大而活跃的社区,齐全的文档,也使很多编程的初学者选择了它作为自己的第一门编程语言。甚至有国外的报道称,Python已经成为了美国顶尖大学里最受欢迎的编程入门教学语言。


要学好一门编程语言实属不易,在初学阶段,就纠正一些错误的做法,对今后的深入学习至关重要。有一位叫Constantine Lignos的博主,他是宾夕法尼亚儿童医院放射研究部门的博士后研究员,他最近撰写了一篇很有意义的文章,列举了初学Python的学生们最常犯的错误,并对这些错误进行了分类和剖析,其内容提纲挈领,非常值得每个Python初学者学习。

这篇文章给出了一些在Python初学者中很常见的反模式,反模式通常是指那些不符合习惯或者会导致糟糕后果的用法。Lignos把他总结的反模式分成了四大类——迭代、性能、变量的漏洞和编程风格。下面我们逐一来看一个例子,理解这些反模式到底“反”在什么地方。

迭代

当我们需要简单迭代一个数量范围的时候,Python给了我们一个非常好用的函数:range。Lignos观察到有些初学者喜欢用range来迭代列表的下表,像下面这种形式:

for i in range(len(alist)):
    print alist[i]

这代码现在还没什么问题,但已经不符合Python的习惯了。但下面的代码就有问题了:

alist = ['her', 'name', 'is', 'rio']
for i in range(0, len(alist) - 1): # 漏掉了最后一个
    print i, alist[i]

我们可以看一下Python官方文档range的示例

>>> range(1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

range的右区间是不包含在内的,如果受了直觉或其他编程语言的影响,再减1就不对了。Lignos还列举了其他几种错误的迭代模式,我们只要记住,range应该用在迭代一个数量范围。

性能

Lignos给出了两段代码:

lyrics_list = ['her', 'name', 'is', 'rio']
words = make_wordlist()
for word in words:
    if word in lyrics_list: # 线性时间
        print word, "is in the lyrics"

lyrics_set = set(lyrics_list)
words = make_wordlist()
for word in words:
    if word in lyrics_set: # 常数时间
        print word, "is in the lyrics"

哪种模式效率更高?Lignos注释已经给出了答案。注释的意思是,判断一个元素是否在一组元素中存在,使用list的算法复杂度是O(n),而使用set的算法复杂度是O(1)。那是否set永远是优于list?在其他情况下,应该用哪个数据结构?Python官方Wiki有一份专门各个数据结构操作的时间复杂度的文档供参考,知道参考这份文档比答案本身更重要。至于为什么,只有Python的源码才能告诉我们。

变量的漏洞

初学者往往会假设一些不该假设的前提,对一些异常流程考虑不周。Lignos也给了一个例子:

for idx, value in enumerate(y):
    if value > max_value:
        break
processList(y, idx)

这里y如果是空的,那就出问题了,因为idx根本得不到定义,最终我们会得到一个NameError的异常。比较好的做法是给idx一个默认的错误值,在C语言里面我们经常喜欢用-1。下面的代码就考虑得比较全面:

def find_item(item, alist):
    # 对Python来说None比-1可能更好点
    result = -1
    for idx, other_item in enumerate(alist):
        if other_item == item:
            result = idx
            break
    return result

代码风格

Python有一份代码风格指导文档PEP 8,这些规则都是有道理的。当初学者不明白为什么的时候,最好的做法就是尽量遵守它,等到有更深入的理解了就会豁然开朗,同事也会明白什么时候可以打破规则。Lignos引用了这份文档的一些例子,比如,如何测试一个变量是否为空,如果测试一个变量是否为None等等。


以上分析了这篇文章中的一些例子,如果希望全面了解,请查看原文。想要学好一门编程语言,学会语法是远远不够的,必须逐步理解语言所依赖的CPU体系结构、编译器/解释器/虚拟机等内容。Lignos这篇文章虽然没有深入剖析Python的实现,但是对于入门者的帮助是非常明显的,当初学者有了一定经验后,对一些问题都可以做深入挖掘,引出Python实现层面的问题。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

页面体验太恶心了 by 小江 沈

页面绑定 select 事件用起来很恶心

。。。 by Yu Yan

这是翻译么

nice by 余 颜凯

哟,真巧。
学习了。

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

3 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT