InfoQ

新闻

针对Spam做设计:给Web出的难题

作者 Sadek Drobi译者 郭晓刚 发布于 2008年6月30日 上午2时11分

社区
Architecture
主题
设计,
Web 2.0
标签
Spam防治,
Web 2.0

伴随着Web的成长,牛皮癣们也越来越活跃,手段越来越激,工具越来越强,始终坚定不移地威胁着Web。不久前对Craigslist的Spam攻击引发了博客届的热烈反响,博客界开始分析牛皮癣们的技术,寻找可行的治疗方案,思考牛皮癣的蔓延对架构的潜在影响。

Mike Masnick引用John Nagled举的例子,说明CL Auto Posting Tool是怎样击败Craigslist的反Spam技术的

Craigslist想通过检查重复的提交来制止Spam。他们检查来自同一IP地址的过多帖子,要求用户提供有效的E-mail地址,增加CAPTCHA来阻止自动发帖工具。用户也可以标记认为属于Spam的帖子。

现在已经出现了一些商业工具可以克服上述阻碍批量发帖的小路障。

[…]

每则Spam消息都会加入一些随机的文字,愚弄Craigslist的重复消息检查。通过IP代理网站发帖,使IP地址分布到一个很广的范围。回复用的E-mail地址是通过Jiffy Gmail Creator创建的大量Gmail帐号。[……]用OCR系统识别CAPTCHA中的模糊文字。自动监控哪些Spam被作了标记,一发现被标记就重发。

即使最庞大的企业,比如Google,投入了“数以千计的员工和巨额的预算”,也不能幸免于牛皮癣攻击。Websense Security Labs的博客介绍了击败Google的CAPTCHA的新技术——可以任意注册随机的Gmail账号来发送Spam。

有两位博客作者开始思考Spam威胁日增背后的含义。“Discipline and Punish”博客的作者着重指出一项事实:“随着Web成为基本的架构元素和通信媒介,这个问题只会越来越严重”。他惊讶地发现,虽然颇有人热衷于展望“Web 5.0和语义Web,但其中鲜见有认真考虑过Spam的威胁的”,而“Spam已经是关系到Web 1.0站点存活能力的主要因素”,Web 2.0由于注重社交、协作和聚合,在Spam面前更为脆弱。他认为,“抵御无穷无尽的Spam冲击波的能力”,将决定未来分布式架构的存活能力。不把Spam纳入考虑将是“天大的错误”。

Jeff Atwood也对Craigslist被攻击事件发表了感想。他指出,牛皮癣们的行为“伤害了社区的信任[……],贬损了每个人参与的价值。”他和Discipline and Punish的观点一致,认为“设计软件的时候,应当假定用户是恶意的”,因为“如果你的设计不能抵挡恶行,就会失去你的用户群”。

Discipline and Punish还指出了另一项事实:在Web 2.0的世界里, Spam不一定是“坏人”制造的。该作者相信,“像Facebook这样的社交网络和FriendFeed这类超级聚合器引入了一种新型的社交Spam”,因为他们都鼓励用户做一些近似于Spam的行为,因此产生了“主要来自你的‘朋友’的新型社交Spam”。

好些作者都就如何与来自“坏人”的Spam作斗争提出了建议,比如开发新型的CAPTCHA,或者让社区参与Spam控制;但对于“社交Spam”,谁也没有办法。

查看英文原文:Designing for Spam: A Challenge for the Web?

4 条回复

回复

InfoQ是如何防止spam的? 发表人 R Lee 发表于 2008年6月30日 下午8时5分
Re: InfoQ是如何防止spam的? 发表人 wang hui 发表于 2008年7月1日 上午4时47分
Re: InfoQ是如何防止spam的? 发表人 Xiaogang Guo 发表于 2008年7月1日 下午1时3分
Re: InfoQ是如何防止spam的? 发表人 兵 大 发表于 2008年7月5日 上午8时25分
  1. 返回顶部

    InfoQ是如何防止spam的?

    2008年6月30日 下午8时5分 发表人 R Lee

    我从来没有看到过infoq的spam留言,而且也没有CAPTCHA,可以谈一下你们是如何做的吗?有后台处理?

  2. 返回顶部

    Re: InfoQ是如何防止spam的?

    2008年7月1日 上午4时47分 发表人 wang hui

    我想像infoq这样的专业性质的站点本身的关注度与网易一类门户相比是不可同日而语的,所以对spam的吸引力也相对会弱很多。说白了,基本上是spam根本就不来,呵呵~~~
    而且,it从业者虽多,由于大家交流频繁其实圈子很小很透明,谁要是在这里倒垃圾,嘿嘿,恐怕效果只能是反作用~~
    所以,俺觉得infoq的压力不大。

  3. 返回顶部

    Re: InfoQ是如何防止spam的?

    2008年7月1日 下午1时3分 发表人 Xiaogang Guo

    spam是有的,但确实不多,所以人工处理足矣。

    基本上是spam根本就不来

    分析得很对。

  4. 返回顶部

    Re: InfoQ是如何防止spam的?

    2008年7月5日 上午8时25分 发表人 兵 大

    确实是这样的。

    spam的目的还是商业利益,infoQ这种专业的网站的用户群决定了spam很少光顾。

独家内容

剖析短迭代

敏捷教练Dave Nicolette提出:我们应该如何设定迭代长度?是要根据发布周期的时间么?使用短迭代又有哪些好处?

应用JSF、Ajax和Seam开发Portlets(1/3)

本文主要讲述了如何用JBoss Portlet Container 和JBoss Portlet Bridge创建新项目,怎样配置一个JSF应用去使用JBoss Portlet Bridge,以及JBoss Portlet Bridge所具备的功能。

AtomServer:数据分发的发布动力(第二部分)

在这篇文章里,Bryon Jacob和Chris Berry将和我们继续探讨AtomServer,它是基于Apache Abdera的完整Atom存储实现。作者还创建了几个Atompub规范扩展,其中包括自动标记、批处理和Feeds聚合。

架构师(试刊第二期)

InfoQ中文站的电子杂志《架构师》试刊第二期出版了!相比于上期,我们在内容的选择安排和版式上都根据读者的意见重新做了修正。“细节决定成败”,我们希望基于InfoQ中文站的专业内容,《架构师》能逐渐成为大家喜欢的电子刊物!

一种正规的性能调优方法:基于等待的调优

在本文中,Steven Haines探讨了Web应用性能调优问题。该领域过去更像是一门艺术而不是一门科学。他提出了一种称为基于等待调优的方法,使整个调优过程更加可度量,也因此更具科学性。

Java程序员ActionScript 3入门

通常来说,改变技术路线时最艰难的部分是辨别语言语法之间的不同。这篇文章就为Java开发者提供了一份如何转向Flex基础语言ActionScript的指南。

浅谈如何创建Rails应用

本视频主要以财帮子为例,介绍了如何创建一个PV为百万级的Rails应用。其中包括:Rails应用的服务器架构、Rails Cache的优化、负载均衡的处理、Web服务器的调试、分布式解决方案、Open API的设计等等。

Alexandru Popescu谈InfoQ.com网站架构

InfoQ首席架构师Alexandru Popescu在采访中谈论了InfoQ架构、Webwork与DWR、Hibernate与JCR、Hibernate可扩展性、最新的InfoQ视频流系统和InfoQ的未来规划。