以前看电视,警察出去抓坏人,大部分都要打开警报鸣笛。
当时就想,这也太傻逼了吧,警车鸣笛不是提前告诉犯罪人,好让其逃跑吗?
后来有一次我一个女性朋友和我讲了一个事。
有次她下夜班回家,在经过一条没有路灯的小路时,曾遇到过两个拦路抢劫的。
两个抢劫的劫完钱,又想劫色,虽然事情过去了很久,但听她讲起,能深深的感受到当时的她是多么的绝望。
就在两个劫匪要对她实施暴行时,突然从远处传来警报声,劫匪听到警报声,以为是我这个朋友报的警,留下几句狠话,就匆匆逃跑了,我朋友也算逃过一劫。
其实那天她根本就没报警,那天的警报是警察去处理一件打架斗殴事件,碰巧从那经过。
她告诉我,以前她也觉得警察老远就开警报鸣笛特别傻逼,可是经过那件事之后,她在也不那么认为。
其实警察出警时拉警报鸣笛,主要是起到优先通行的作用,提醒社会车辆避让,还有对想要违法犯罪、正在违法犯罪、已犯罪人员的一种震慑。
因为减少对于无辜者的伤害比捉到一个罪犯更重要。可能大部分人都觉得出警拉警报鸣笛很傻逼,但对于那些处于危险中的人,可真要称之为天籁之音了。
当年在南京上班的时候,每次坐地铁从电梯出来,总感觉扶手的履带比踏板要快一点,从上电梯的一刻起扶着扶手,我的手在与身体平行稍微靠前的位置,手臂还是弯曲状态,等到了电梯结束的时候,放在扶手履带上的手,就移动到了很靠前的位置,手臂已经呈伸直状态。当时是以为这个是设计上的疏漏,猜测扶手履带和踏板是独立运行,踏板上站了人,所以慢一点。
后来去了上海、西安、北京、广州、武汉、天津、杭州、合肥(基本上全国各地)出差,发现每个地方的电梯扶手都比踏板要快。
后经过资料的查询,原来自动扶梯的国家标准GB 16899-2011 5.6.1规定扶手带比梯级快(0~+2%)。扶手带和梯级是各自独立的驱动系统,该条款应该是根据各种年龄的人对手和身体相对位置的不同而保持平衡的能力测试的结果制订的。
这样的要求是为了防止乘客在手握扶手时,因为扶手带的速度滞后于梯级或踏板的速度,而造成人体后仰而发生意外情况。原因是人手臂的生理结构可能在扶手带滞后时向后移动而锁住关节,使手无法及时松开扶手带,进而带动乘客后仰跌倒,曾经因此发生过事故。
看到这个题目,我脑中蹦出的第一个答案就是它,一项大概让所有机器人和大部分人类都痛恨的发明:验证码。准确地说,今天我要说的并不是广义的验证码-CAPTCHA,而是reCAPTCHA)
说它看起来很蠢我想大家都会同意吧,第一,丑;第二,原理看起来简单粗暴,一点不“高级”。那为什么又说它精妙无比呢?先从CAPTCHA说起吧,这是"验证码"的英文名,然而它并不是一个现成的单词,而是一个缩写,什么缩写呢?深吸一口气,跟我念:"Completely Automated Public Turing test to tell Computers and Humans Apart"。翻译成中文就是"全自动区分计算机和人类的图灵测试",一下变得高大上了有木有?
相比于图灵测试,在CAPTCHA中,人类和机器的角色其实是互换了的,所以它其实属于一种反图灵测试(Reverse Turing test),显得更高大上了。
典型的CAPTCHA就是像下图这样,给你一张包含扭曲文字的图片,再给你一个文本框用来输入。接下来就轮到我们的主角Luis von Ahn大神出场了,CAPTCHA这个名字就是他提出来的。他出生于1978年,2000年在杜克大学获得了数学学士学位,随后就进入卡内基梅隆大学读博士。2003年,他和几个人一起提出了“CAPTCHA”这个提法,但验证码本身是由其他人在更早的时候发明的。
验证码虽然显得又“丑”又“蠢”,但在区分人类和机器这件事上非常有效,所以从被发明开始,每天都在被全世界的网站成千上万次的使用,防止恶意的攻击、注册、刷票、抽奖等等。Louis大神就想了,每天有这么多人要一遍遍地去识别一串串字符,能不能把这些脑力、时间利用起来、集合起来做一些有意义的事呢?
于是,2007年,他创立了reCAPTCHA。
跟CAPTCHA相比,reCAPTCHA看起来区别并不大,
外观上最大的区别,就是待识别的单词从一个变成了两个,然而这恰恰是reCAPTCHA的玄机所在。这个玄机就是,两个单词中的一个,来自于某个真实文本的扫描,而这个文本,可能由于文本的年代/印刷质量或者扫描质量的关系,很难用OCR技术准确识别出来。
而reCAPTCHA做的事情,就是让每一个“挑战”这个验证码的人其实都当了一次“人肉”OCR,“帮助”电脑识别文本的内容。
读到这里你也许发现问题了,既然电脑都认不出来那个词是什么,那么它怎么知道你输入的对还是错呢?
2个单词中的另一个就发挥作用了,这个单词是reCAPTCHA知道答案的,如果这个单词你的输入是正确的,那么系统就认为你输入的另一个单词的也是正确的,当然,还会通过把词条分发给多人等办法来交叉验证保证准确率。
通过这种牛B的众包(Crowdsourcing - Wikipedia),reCAPTCHA在短时间内帮助纽约时报数字化了从1851年至今的所有文章,共计1300多万篇,非常完美地诠释了当时reCAPTCHA的slogan,"Stop spam,read books",也就是上面reCAPTCHA的截图中右下角的文字。
就问你,酷不酷,妙不妙?





