和Google互补的搜索引擎Wolfram|Alpha
Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
作者 Sadek Drobi 译者 郭晓刚 发布于 2008年6月30日 上午2时11分
伴随着Web的成长,牛皮癣们也越来越活跃,手段越来越激,工具越来越强,始终坚定不移地威胁着Web。不久前对Craigslist的Spam攻击引发了博客届的热烈反响,博客界开始分析牛皮癣们的技术,寻找可行的治疗方案,思考牛皮癣的蔓延对架构的潜在影响。
Mike Masnick引用John Nagled举的例子,说明CL Auto Posting Tool是怎样击败Craigslist的反Spam技术的:
Craigslist想通过检查重复的提交来制止Spam。他们检查来自同一IP地址的过多帖子,要求用户提供有效的E-mail地址,增加CAPTCHA来阻止自动发帖工具。用户也可以标记认为属于Spam的帖子。
现在已经出现了一些商业工具可以克服上述阻碍批量发帖的小路障。
[…]
每则Spam消息都会加入一些随机的文字,愚弄Craigslist的重复消息检查。通过IP代理网站发帖,使IP地址分布到一个很广的范围。回复用的E-mail地址是通过Jiffy Gmail Creator创建的大量Gmail帐号。[……]用OCR系统识别CAPTCHA中的模糊文字。自动监控哪些Spam被作了标记,一发现被标记就重发。
即使最庞大的企业,比如Google,投入了“数以千计的员工和巨额的预算”,也不能幸免于牛皮癣攻击。Websense Security Labs的博客介绍了击败Google的CAPTCHA的新技术——可以任意注册随机的Gmail账号来发送Spam。
有两位博客作者开始思考Spam威胁日增背后的含义。“Discipline and Punish”博客的作者着重指出一项事实:“随着Web成为基本的架构元素和通信媒介,这个问题只会越来越严重”。他惊讶地发现,虽然颇有人热衷于展望“Web 5.0和语义Web,但其中鲜见有认真考虑过Spam的威胁的”,而“Spam已经是关系到Web 1.0站点存活能力的主要因素”,Web 2.0由于注重社交、协作和聚合,在Spam面前更为脆弱。他认为,“抵御无穷无尽的Spam冲击波的能力”,将决定未来分布式架构的存活能力。不把Spam纳入考虑将是“天大的错误”。
Jeff Atwood也对Craigslist被攻击事件发表了感想。他指出,牛皮癣们的行为“伤害了社区的信任[……],贬损了每个人参与的价值。”他和Discipline and Punish的观点一致,认为“设计软件的时候,应当假定用户是恶意的”,因为“如果你的设计不能抵挡恶行,就会失去你的用户群”。
Discipline and Punish还指出了另一项事实:在Web 2.0的世界里, Spam不一定是“坏人”制造的。该作者相信,“像Facebook这样的社交网络和FriendFeed这类超级聚合器引入了一种新型的社交Spam”,因为他们都鼓励用户做一些近似于Spam的行为,因此产生了“主要来自你的‘朋友’的新型社交Spam”。
好些作者都就如何与来自“坏人”的Spam作斗争提出了建议,比如开发新型的CAPTCHA,或者让社区参与Spam控制;但对于“社交Spam”,谁也没有办法。
查看英文原文:Designing for Spam: A Challenge for the Web?我从来没有看到过infoq的spam留言,而且也没有CAPTCHA,可以谈一下你们是如何做的吗?有后台处理?
我想像infoq这样的专业性质的站点本身的关注度与网易一类门户相比是不可同日而语的,所以对spam的吸引力也相对会弱很多。说白了,基本上是spam根本就不来,呵呵~~~ 而且,it从业者虽多,由于大家交流频繁其实圈子很小很透明,谁要是在这里倒垃圾,嘿嘿,恐怕效果只能是反作用~~ 所以,俺觉得infoq的压力不大。
spam是有的,但确实不多,所以人工处理足矣。
基本上是spam根本就不来
分析得很对。
确实是这样的。 spam的目的还是商业利益,infoQ这种专业的网站的用户群决定了spam很少光顾。
Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
Vijay Narayanan在这篇文章中对数据服务的几个方面进行了介绍,它们都是SOA实践者和数据架构师感兴趣的内容。本文对数据服务的几个方面进行了介绍,包括需求定义,基本原理和好处、范围、开发以及消费模式。
罗马不是一天建成的,豆瓣的技术架构也是随着用户规模的增长一直在持续变化中。在本次演讲中,豆瓣的首席架构师洪强宁将与大家一起分享从上线时的单台服务器架构开始一直到现在的豆瓣架构变迁历程。
Billy McCafferty展示了S#arp架构,它在ASP.NET MVC框架的基础上,荟萃了当今的最佳实践,应用在ASP.NET Web应用程序的架构设计中。
中国作为新兴市场中的新兴市场,是Sun在美国之外实施SSE(SUN Startup Essentials)项目重点关注的地区。在QCon Beijing 2009期间,InfoQ中文站有幸对此项目的负责人王雷先生进行了采访,探讨了关于开源、新兴市场、SSE等话题。
HTML5 是由 WHATWG发起的,最开始的名称叫做Web Application 1.0,而后这个标准吸纳了Web Forms 2.0的标准,并一同被W3C组织所采用,合并成为下一代的HTML5标准。
4 条回复
关注此讨论 回复