和Google互补的搜索引擎Wolfram|Alpha
Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
作者 Al Tenhundfeld 译者 赵劼 发布于 2008年10月5日 上午2时33分
reCAPTCHA ASP.NET类库提供了一个非常简单直观的方式,在您的ASP.NET站点上放置一个CAPTACHA组件,以此避免网站受到机器人的干扰。这个类库封装了reCAPTCHA API。您可以使用C#或Visual Basic.NET等任何一种.NET语言来操作这个类库。
一个CAPTCHA程序能够生成一些人类能通过,但是目前的计算机却无法通过的测试。例如,人类能够阅读如下图中扭曲的文字,但是目前的计算机程序却无法将其识别出来:
.
reCAPTCHA中的扭曲文字是书籍数字化进程的产物:
为了使计算机能够获取人类知识以及更好的传播信息,目前已有多个项目正在设法将计算机时代之前的出版物进行数字化。书页首先被扫描成照片,然后使用“Optical Character Recognition”(OCR)技术将其转化为文字。将图片内容转化为文字非常有用,因为书籍扫描成图片之后将很难被保存在小型的设备中,难以下载,并且无法进行查询。不过问题在于OCR技术并不完美(下图为OCR出错示例)。reCAPTCHA将计算机无法阅读的文字通过CAPTCHA的方式在Web页面上展现出来,由人进行识别,并以此为书本数字化的进程做出贡献。具体地说,就是将OCR无法正确识别的单词以图片的方式显示并作为CAPTCHA来使用。这个做法是可行的,因为大部分的OCR程序在无法正确识别单词时将给出提示。
![]()
不过,既然计算机无法阅读此类CAPTCHA,系统又如何知道这个问题的正确答案呢?它的工作方式在于,每个OCR无法识别的新单词将会和另一个已经确定的单词一起提供给用户,而用户会被告知同时输入两个单词。如果答案已知的单词被正确输入,那么系统假设新的单词也是正确的。为了提高准确率,无论输入的结果是否正确,系统都会生成新的图片让其他一些用户再次进行辨认。
目前,我们正在帮助Internet Archive里的书籍以及旧版纽约时报进行数字化。
如果您要使用reCAPTCHA.NET:
ReCAPTCHA同时还提供了一个Email地址CAPTCHA。
关于reCaptcha控件的一个常遇到的抱怨是它没有提供一个ValidationGroup属性。因此,如果网站需要加入一个较为复杂的ValidationGroup结构时,您可能需要多做一些额外的工作。
查看英文原文:ReCAPTCHA ASP.NET LibraryWolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
Vijay Narayanan在这篇文章中对数据服务的几个方面进行了介绍,它们都是SOA实践者和数据架构师感兴趣的内容。本文对数据服务的几个方面进行了介绍,包括需求定义,基本原理和好处、范围、开发以及消费模式。
罗马不是一天建成的,豆瓣的技术架构也是随着用户规模的增长一直在持续变化中。在本次演讲中,豆瓣的首席架构师洪强宁将与大家一起分享从上线时的单台服务器架构开始一直到现在的豆瓣架构变迁历程。
Billy McCafferty展示了S#arp架构,它在ASP.NET MVC框架的基础上,荟萃了当今的最佳实践,应用在ASP.NET Web应用程序的架构设计中。
中国作为新兴市场中的新兴市场,是Sun在美国之外实施SSE(SUN Startup Essentials)项目重点关注的地区。在QCon Beijing 2009期间,InfoQ中文站有幸对此项目的负责人王雷先生进行了采访,探讨了关于开源、新兴市场、SSE等话题。
HTML5 是由 WHATWG发起的,最开始的名称叫做Web Application 1.0,而后这个标准吸纳了Web Forms 2.0的标准,并一同被W3C组织所采用,合并成为下一代的HTML5标准。
1 条回复
关注此讨论 回复