BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

ASP.NET上的ReCAPTCHA类库

| 作者 Al Tenhundfeld 关注 0 他的粉丝 ,译者 赵劼 关注 5 他的粉丝 发布于 2008年10月6日. 估计阅读时间: 3 分钟 | ArchSummit北京2018 共同探讨机器学习、信息安全、微服务治理的关键点

reCAPTCHA ASP.NET类库提供了一个非常简单直观的方式,在您的ASP.NET站点上放置一个CAPTACHA组件,以此避免网站受到机器人的干扰。这个类库封装了reCAPTCHA API。您可以使用C#或Visual Basic.NET等任何一种.NET语言来操作这个类库。

一个CAPTCHA程序能够生成一些人类能通过,但是目前的计算机却无法通过的测试。例如,人类能够阅读如下图中扭曲的文字,但是目前的计算机程序却无法将其识别出来:

.

reCAPTCHA中的扭曲文字是书籍数字化进程的产物:

为了使计算机能够获取人类知识以及更好的传播信息,目前已有多个项目正在设法将计算机时代之前的出版物进行数字化。书页首先被扫描成照片,然后使用“Optical Character Recognition”(OCR)技术将其转化为文字。

将图片内容转化为文字非常有用,因为书籍扫描成图片之后将很难被保存在小型的设备中,难以下载,并且无法进行查询。不过问题在于OCR技术并不完美(下图为OCR出错示例)。reCAPTCHA将计算机无法阅读的文字通过CAPTCHA的方式在Web页面上展现出来,由人进行识别,并以此为书本数字化的进程做出贡献。具体地说,就是将OCR无法正确识别的单词以图片的方式显示并作为CAPTCHA来使用。这个做法是可行的,因为大部分的OCR程序在无法正确识别单词时将给出提示。

不过,既然计算机无法阅读此类CAPTCHA,系统又如何知道这个问题的正确答案呢?它的工作方式在于,每个OCR无法识别的新单词将会和另一个已经确定的单词一起提供给用户,而用户会被告知同时输入两个单词。如果答案已知的单词被正确输入,那么系统假设新的单词也是正确的。为了提高准确率,无论输入的结果是否正确,系统都会生成新的图片让其他一些用户再次进行辨认。

目前,我们正在帮助Internet Archive里的书籍以及旧版纽约时报进行数字化。

如果您要使用reCAPTCHA.NET:

  • 下载Recaptcha.dll并将其放至bin目录中。
  • 为您的网站获取公钥及私钥。
  • 将自定义reCAPTCHA验证控件加入页面中。

ReCAPTCHA同时还提供了一个Email地址CAPTCHA

关于reCaptcha控件的一个常遇到的抱怨是它没有提供一个ValidationGroup属性。因此,如果网站需要加入一个较为复杂的ValidationGroup结构时,您可能需要多做一些额外的工作。

查看英文原文:ReCAPTCHA ASP.NET Library

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

不符合国情 by Lee Jason

这个验证码对于中国很不合适,一些词完全看不清楚,很多中国人没有英文基本的用起来会很吃力

Re: 不符合国情 by xiong dongping

好歹我英语也过了四级,听说读写没啥大问题,但对付这样的验证码,我是服了,有生以来就猜对过一次。无语了。

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

2 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT