豆小豆 发表于 2016-5-24 10:22

验证码里竟然藏着这么大的商机

咱们每天在各种网络平台中,总会遇到各种各样的验证码。虽说验证码是为了保护个人信息,防止恶意软件,但填不完的验证码,也的确是挺闹心的。据Google统计,全世界每天要填写大约两亿个验证码。如果平均每次填写验证码的时间是10秒,那咱们每天花在验证码上的时间就高达50万个小时,足足相当于六十年。

你或许会想,网民这么庞大的碎片时间,要是能利用起来的话该多好?没错,验证码的发明人路易斯·冯·安也想到了这一点,让我们来看看他是怎样将这些碎片时间利用起来的。

有一类最常见的验证码,是让人们辨别图片里头歪歪扭扭的单词,但你知道吗?其实我们在填这些验证码的时候,也正在帮助将一些扫描的书数字化。

有一些比较古老的书,在网上很难找到电子版,我们看到的都是扫描出来的图片,传统的光学识别技术,很难识别这些扫描出来的文字。如果想把这些扫描图片转化成电子版,就得耗费很多人力资源,将它们一个字一个字对照着输入到文档中。而现在,仅通过网民的举手之劳,就能完成这一艰巨的任务。

实际上,验证码的这些文字图像,正是电脑从某些扫描的书里头截选出来的。每一次,电脑会分配两个或以上的单词给人们去辨认,这其中有几个是已经被后台工作人员识别出来教给了计算机的。当你输入正确了这几个电脑认识的单词时,电脑便会判定你是真人,然后推测你剩下的几个输入也是正确的。而那几个单词刚好电脑不认识,每天通过统计大部分人给出的答案,电脑就能将这个之前没法识别的词语数字化,然后匹配到扫描文本对应的位置。这样,下次我们打开这本书的扫描文档时,对应的位置就可以直接用鼠标复制粘贴成电子文档了。

你看,这想法是不是棒呆了?通过这种方式,每天能够数字化的词汇可以达到一亿个,这相当于每年能将250万本书数字化。仅仅是一亿人的举手之劳,便完成了如此庞大的工程。

同样的思路,也被应用到了翻译这项工作上。我们知道,互联网里的内容大部分是英文,但其它语言的体量也非常大。就拿维基百科为例,其西班牙语版的内容仅为英语版的20%,如果要把另外的80%也翻译成西班牙语,则至少要耗费5000万美元。那有没有办法,能让网民自发地将网上的英语翻译成其它语言呢?有一款叫做“多邻国”的语言教育软件,就做到了这一点。

如今,世界上有超过12亿人在学习一门外语,仅在美国,花上500美元购买学习软件的人就超过了500万。而多邻国恰好反其道而行之,它是完全免费的,但是有个条件,那就是你在免费学习语言的同时,我会分配一些相当难的语句让你翻译,而这些语句恰好就是网络上真的需要翻译的内容。通过比对大多数用户的翻译结果,系统就能分辨出正确的翻译给原来的内容,而用户在这个过程中也得到了提高。

这一理念在实际应用中非常有效,比如要将维基百科剩下的80%英文内容翻译成西班牙语,有10万个活跃用户的情况下,就只需要五个礼拜的时间。而如果有100万个活跃用户,就只需要80个小时。

所以你看,互联网时代的确是个新时代,它给我们个人和企业都带来了完全不同的商业和驱动模式。任何一个人或组织,只要有好的idea,能将数量巨大的网民的碎片时间利用起来,就有可能完成我们过去想都没法想象的壮举。

大宝 发表于 2016-5-24 21:44

厉害,帮顶
页: [1]
查看完整版本: 验证码里竟然藏着这么大的商机