InfoQ

InfoQ

新闻

我的书签

登录注册 以永久保存书签。

该内容已经被标记书签!

标记书签错误,请重试!

针对Spam做设计:给Web出的难题

作者 Sadek Drobi 译者 郭晓刚 发布于 2008年6月30日

领域
架构 & 设计,
企业架构
主题
架构 ,
设计 ,
Web 2.0
标签
Spam防治 ,
Web 2.0

伴随着Web的成长,牛皮癣们也越来越活跃,手段越来越激,工具越来越强,始终坚定不移地威胁着Web。不久前对Craigslist的Spam攻击引发了博客届的热烈反响,博客界开始分析牛皮癣们的技术,寻找可行的治疗方案,思考牛皮癣的蔓延对架构的潜在影响。

Mike Masnick引用John Nagled举的例子,说明CL Auto Posting Tool是怎样击败Craigslist的反Spam技术的

Craigslist想通过检查重复的提交来制止Spam。他们检查来自同一IP地址的过多帖子,要求用户提供有效的E-mail地址,增加CAPTCHA来阻止自动发帖工具。用户也可以标记认为属于Spam的帖子。

现在已经出现了一些商业工具可以克服上述阻碍批量发帖的小路障。

[…]

每则Spam消息都会加入一些随机的文字,愚弄Craigslist的重复消息检查。通过IP代理网站发帖,使IP地址分布到一个很广的范围。回复用的E-mail地址是通过Jiffy Gmail Creator创建的大量Gmail帐号。[……]用OCR系统识别CAPTCHA中的模糊文字。自动监控哪些Spam被作了标记,一发现被标记就重发。

即使最庞大的企业,比如Google,投入了“数以千计的员工和巨额的预算”,也不能幸免于牛皮癣攻击。Websense Security Labs的博客介绍了击败Google的CAPTCHA的新技术——可以任意注册随机的Gmail账号来发送Spam。

有两位博客作者开始思考Spam威胁日增背后的含义。“Discipline and Punish”博客的作者着重指出一项事实:“随着Web成为基本的架构元素和通信媒介,这个问题只会越来越严重”。他惊讶地发现,虽然颇有人热衷于展望“Web 5.0和语义Web,但其中鲜见有认真考虑过Spam的威胁的”,而“Spam已经是关系到Web 1.0站点存活能力的主要因素”,Web 2.0由于注重社交、协作和聚合,在Spam面前更为脆弱。他认为,“抵御无穷无尽的Spam冲击波的能力”,将决定未来分布式架构的存活能力。不把Spam纳入考虑将是“天大的错误”。

Jeff Atwood也对Craigslist被攻击事件发表了感想。他指出,牛皮癣们的行为“伤害了社区的信任[……],贬损了每个人参与的价值。”他和Discipline and Punish的观点一致,认为“设计软件的时候,应当假定用户是恶意的”,因为“如果你的设计不能抵挡恶行,就会失去你的用户群”。

Discipline and Punish还指出了另一项事实:在Web 2.0的世界里, Spam不一定是“坏人”制造的。该作者相信,“像Facebook这样的社交网络和FriendFeed这类超级聚合器引入了一种新型的社交Spam”,因为他们都鼓励用户做一些近似于Spam的行为,因此产生了“主要来自你的‘朋友’的新型社交Spam”。

好些作者都就如何与来自“坏人”的Spam作斗争提出了建议,比如开发新型的CAPTCHA,或者让社区参与Spam控制;但对于“社交Spam”,谁也没有办法。

查看英文原文:Designing for Spam: A Challenge for the Web?

译者 郭晓刚 是InfoQ中文站架构社区编辑,创建并终结过数家软件小企业,翻译过多本技术书籍。

InfoQ是如何防止spam的? 发表人 Lee R 发表于
Re: InfoQ是如何防止spam的? 发表人 王 辉 发表于
Re: InfoQ是如何防止spam的? 发表人 Guo Xiaogang 发表于
Re: InfoQ是如何防止spam的? 发表人 大 兵 发表于
  1. 返回顶部

    InfoQ是如何防止spam的?

    发表人 Lee R

    我从来没有看到过infoq的spam留言,而且也没有CAPTCHA,可以谈一下你们是如何做的吗?有后台处理?

  2. 返回顶部

    Re: InfoQ是如何防止spam的?

    发表人 王 辉

    我想像infoq这样的专业性质的站点本身的关注度与网易一类门户相比是不可同日而语的,所以对spam的吸引力也相对会弱很多。说白了,基本上是spam根本就不来,呵呵~~~
    而且,it从业者虽多,由于大家交流频繁其实圈子很小很透明,谁要是在这里倒垃圾,嘿嘿,恐怕效果只能是反作用~~
    所以,俺觉得infoq的压力不大。

  3. 返回顶部

    Re: InfoQ是如何防止spam的?

    发表人 Guo Xiaogang

    spam是有的,但确实不多,所以人工处理足矣。

    基本上是spam根本就不来

    分析得很对。

  4. 返回顶部

    Re: InfoQ是如何防止spam的?

    发表人 大 兵

    确实是这样的。

    spam的目的还是商业利益,infoQ这种专业的网站的用户群决定了spam很少光顾。

深度内容

大规模视频网站的计费与流量管理

本次分享将会就大规模视频网站的计费与流量管理这个话题,从操作层面细细进行讲解和分析,为系统工程师们揭示平日里我们没有关心的另一些内容。同时也希望本次分享能揭示行业中的一些“潜规则”,让互联网行业的流量与带宽管理更为开放与简洁。
本次演讲视频录制于QCon杭州2011

专访Jeffrey Richter:Windows 8是微软的重中之重

Jeffrey Richter以其多本Windows核心技术的经典著作而闻名,同时,他深入掌握微软的.NET等一系列核心技术,2012年1月,Jeffrey Richter在北京接受了InfoQ中文站的专访,谈到Windows 8和WinRT编程,并就异步编程、Windows编程中的可扩展性、性能和安全性方面给出自己的建议。

应用云平台的可用性——从新浪SAE看云平台设计

云计算平台的可用性,相比传统互联网服务而言,更加复杂和困难,也更具有挑战性。本文借助新浪SAE云平台为读者讲述了云平台可用性的定义、如何打造高可用的平台,以及对云计算的用户提出了建议。

JVM定制改进 @ 淘宝

淘宝高度重视Java平台的健康发展,组建了一个团队专注于Java平台的底层部分的性能、功能与稳定性改进;工作主要基于OpenJDK中的HotSpot VM开展,其中一些通用的功能随后也会逐渐反馈给OpenJDK社区。希望能与使用Java平台开发应用的大家交流经验。
本次演讲视频录制于QCon杭州2011

"伤得起"的云计算应用——对云端应用之架构的思考

2011年4月21日至22日是值得云计算从业者纪念的日子。Amazon的IaaS服务出现故障,导致许多商业网站的服务中断,影响非常严重。作为云计算用户,我们需要思考的是,如何保证即便在云服务不可用的情况,我们的应用架构仍然能够屹立不倒?本文正是站在云计算用户的角度试图探讨这一问题。

让交付的速度跟上思考的速度

12人的技术团队,4组刀片服务器,每月20亿的访问量,每日1次准时部署,99.9%的可用性。这可能吗?当然。想知道如何做的吗?百姓网将与您分享他们在DevOps实践过程中的经验和技巧。
本次演讲视频录制于QCon杭州2011

架构之路——穿行在产品和业务之间

篱笆作为一家起源于社区的电子商务公司,反映到技术层面就是同时要面对产品和业务,以及经营战略的变化调整。如何在产品和业务的夹缝之间完成技术架构的抽象与平衡,寻找更有效的价值定位,这当中有些经验教训和个人感悟愿与众人分享。
本次演讲视频录制于QCon杭州2011

特性注入:成功三部曲

本文将对特性注入以及相关方法做一个扫盲性的介绍。我们会解释这个框架的关键要素,并附上实例来证实它们。为了让文章保持相对较短,我们不会深入到某个工具或方法中,而是会给出一些参考资料,以便大家做进一步的研究。