我被爬虫爬了:大数据时代的隐忧

说也奇怪,动物之中我最惧爬虫。爬虫无獠牙利齿,血盆大口,绝不会伤害我等性命,且爬虫小得可怜,行动缓慢,一不留意反倒被人踏上一脚,断送了卿卿小命。然爬虫却让人毛骨悚然。

孩提时,我折桑树树枝,折到的是一条小爬虫。细小的爬虫长得跟桑树一个颜色,倒立树干上,活脱脱一根掉光了叶片的干树枝。我顿时吓得尖叫起来。

后来知识青年上山下乡去。一日,我低头锄禾忙,突然一个凉凉的东西掉在脖子上,伸手一抓,居然又是爬虫。金黄色爬虫毛耸耸的,惊得我跳将起来。

几十年过去,我来了大洋彼岸,却又被更厉害的爬虫爬了。

平时浏览国内网页,页面上总会跳出广告,邀你跟半裸女玩游戏,我自岿然不动旌旗不乱。此外,网页上也会出现一些国内的商业广告,什么抽红包乐不停,千万大奖等你拿,新年春节大优惠等。这类广告我也不屑一顾。

后来发生的事儿引起了我的注意。一次,我浏览了一些有关英语学习的网页。接下来几天,不管我去哪个网站浏览,页面上总是会出现各种英语学习的广告。

一天,我在网上浏览有关婴儿辅食喂养方面的信息。接下来只要我上网,无论去哪个网站,页面上少不了出现婴儿辅食喂养方面的链接,一会儿是婴儿辅食喂养时间表,一会儿是婴儿辅食的种类,一会儿又是婴儿辅食喂养要注意的问题等等。

跟踪我的不光是国内的广告,还有加拿大的广告。最近我准备买车,遂在加拿大汽车交易网站看车。接下来不管我浏览什么网页,该网站的汽车广告总在那里等我。更奇妙的是,广告商似乎知道我在多伦多,天天在网页上推出多伦多交友婚恋网站的广告。

我纳闷了,广告商怎么知道我心思呢?广告怎么会如此如影随形?一天,我无意之中发现网页底部出现了如下文字:

“本站少部分内容来自于爬虫自动从网络抓取,非人为转载、传播,其版权归原作者所有。如内容涉及或侵犯了您的权益,请通知我们。”

原来,我们浏览网页时会留下 “蛛丝马迹”,俗称小甜饼(英文为cookie)。这些小甜饼相当于网络世界中的个人身份证,上面有我们的私人信息,如登录时间、浏览过的网页或点击的按钮。小甜饼名字听上去很贴心,却会招来爬虫。

爬虫,又称网页蜘蛛,是一种自动地抓取网上信息的小程序。我们上网时,爬虫会利用我们留下的小甜饼存储我们浏览网页的信息,进行分析过滤,并建立索引,辨认我们的需求,然后自动量身定做,提供相关广告。

广告商派出爬虫跟踪用户的兴趣爱好,以更精准的投放广告,有时会给我们方便。但没完没了的广告让人生厌,而且会减慢打开网页的速度,消耗流量,甚至使服务器瘫痪。更要命的是,这类无形的爬虫虽不像毛茸茸的爬虫面目狰狞,却挥之不去,并悄然爬进我们的隐私世界。据国内央视315晚会曝光,网易等网络公司就曾利用爬虫窃取用户信息,加拿大和美国也有类似事件的报道。想到此,我不免全身发紧,毛骨悚然起来。说到底,在大资料时代,我们能守住几多隐私,我心里没底。
 

登录后才可评论.